ShowMeAI —— Show u 三连
內容來源:系列教程 (showmeai.tech)
ShowMeAI日報系列全新升級!覆蓋AI人工智能 工具&框架 | 項目&代碼 | 博文&分享 | 數據&資源 | 研究&論文 等方向。
本文整理了ShowMeAi日報上的部分內容,有關python學習、深度學習、項目、面試、各種易用的工具框架、資源,等等。
?
博文&分享
👍『數據科學面試』題集
github.com/youssefHosn…
作者從 2022 年 5 月份開始,在 LinkedIn 上發布每日數據科學面試的問題及答案,并將所有內容匯總在了這個項目頁面中。目前分為 Machine Learning / 機器學習、Deep Learning / 深度學習、Statistics / 統計、Probability / 概率、Python、SQL & DB、簡歷等7個主題、近百個問答。
👍『計算機』自學指南
github.com/pkuflyingpi…
csdiy.wiki/
隨著歐美眾多名校將質量極高的計算機課程全部開源,自學 CS 成了一件可操作性極強的事情。作者梳理了自己的學習路徑,希望幫助剛剛接觸計算機的小白,憑借開源社區的優質資源,成長為一個有扎實的數學功底和代碼能力的程序員。
👍 機器學習 / 計算機視覺 / 計算機科學『速查卡片集』
github.com/b7leung/MLE…
作者制作了 200 多張知識卡片,包括『計算機科學』『機器學習』『計算機視覺和深度學習基礎』『計算機視覺和深度學習精選專題』4個主題,用以回顧多年的 ML 研究、課程和學習中的所有內容,并為機器學習工程師的面試做準備。作者在 2022 年拿到了谷歌、特斯拉、三星、Motional、UiPath 和 TikTok 等多家公司的Offer!如果你已經有較好的ML基礎,需要系統復習和查漏補缺,那推薦學起來呀!
👍 『機器學習』核心概念的可視化解釋
mlu-explain.github.io/
MLU( Machine Learning University,機器學習大學)是亞馬遜的一項教育計劃,旨在教授機器學習理論和實際應用。MLU-Explain 作為計劃的一部分,通過可視化這種信息豐富且有趣的方式,講解了機器學習的重要概念。交互頁面的設計非常酷!
👍 104個『Python 數據科學實戰』項目
python.plainenglish.io/85-data-sci…
作者整理了 104 個數據科學實戰項目,對于初學者提升概念理解、操作技能等都非常有幫助!
👍 『深度學習』應用與實戰書籍推薦
shepherd.com/best-books/…
本文作者 Jakub Langr 具備豐富的機器學習領域實踐和授課經驗,推薦了5本適合進行深層次進階學習的學習,并附上了推薦理由。
- 『Deep Learning with Python』,由深度學習框架 Keras 的創作者所著,將內容講解得非常易于理解,適合新手入門。
- 『Deep Learning for Coders with Fastai and Pytorch: AI Applications Without a PhD』作者 Jeremy Howard 的 fast.ai 實戰課可謂全球知名。本書以 fast.ai 課程為基礎,側重實戰,學完就能掌握自己的項目!
- 『How to Measure Anything: Finding the Value of Intangibles in Business』并非技術書籍,但闡述了機器學習的應用場景,也加入了作者的很多深刻思考。
- 『Deep Learning』真正的學術王者!作者 Ian Goodfellow 等將基本原理講得嚴謹且清晰,也因此備受好評。因為封面被昵稱為『花書』。
- 『Grokking Deep Learning』可以幫你在堅實、實用的基礎上提出新的調整或模型類型,理清被卡住的環節。這是一本真正帶你直觀了解深度學習的好書。
👍『ML YouTube Courses』Youtube 最新機器學習課程大合集
github.com/dair-ai/ML-…
合集包括 Youtube 上的 35 門廣受歡迎的課程,覆蓋以下 9 個領域:機器學習(Machine Learning)、深度學習(Deep Learning)、自然語言處理(NLP)、計算機視覺(Computer Vision)、強化學習(Reinforcement Learning)、圖機器學習(Graph ML)、多目標學習(Multi-Task Learning)、自動駕駛(Self-Driving Cars)、機器人(Robotics)。如果想在 B 站觀看同主題合輯,那么推薦博客 blog.showmeai.tech/ 和 B站 space.bilibili.com/479444931。
📚 『NeRF at CVPR 2022』分享:CVPR 2022的NeRF相關成果匯總
dellaert.github.io/NeRF22/
本文作者 Frank Dellaert 是美國 Georgia Institute of Technology 的教授,同時也是谷歌AI研究科學家。他與曾經的學生、現在的 Google 同事 Andrew Marmon 一道,對 CVPR 2022 會議上與神經輻射場(NeRFs)相關的50多篇論文進行了整理匯總。NeRFs 領域的研究和論文正在井噴式增長!連作者這樣的大佬都感嘆『確實有點卷不動』
📚 『算法工程師-機器學習』面試題目總結
github.com/zhengjingwe…
📚 『人員分析中的圖譜與網絡』基于R與Python,免費電子書
ona-book.org/ , github.com/keithmcnult…
Keith McNulty 在《Handbook of Graphs and Networks in People Analytics》 書中描述了網絡分析技術一個有趣的應用方向——組織管理。網絡分析將個人之間看似簡單的對偶關系編織成一個完整的社會結構,并可以通過分析和應用網絡數據來應對組織挑戰。
作者做了大量努力,使得數據和代碼變得簡單生動——只闡述最重要的理論、大量的示例數據集和代碼片段、可視化圖表等。作者對于網絡分析在組織中的應用方向,也非常激動人心——新員工入職、鼓勵多樣化的合作、尋找有效的溝通策略、確定更好的組織結構、尋找潛在的領導者等等。
📚 『Python小項目全集』免費書電子書
inventwithpython.com/bigbookpyth…
這本《The Big Book of Small Python Projects》書包含 81 個 Python 練手小項目合集,包括游戲、動畫、迷宮和模擬等。作者 Al Sweigart 『授之以輪』,書的內容設計保證了高趣味性和實用性,帶你看懂每個項目的代碼原理,還鼓勵你對輪子瘋狂魔改~
?
工具&框架?
『Zotero Tag』Zotero的 Tag 管理插件
github.com/windingwind…
Zotero Tag 是一個 Zotero 附加的標簽管理插件,自動為新項目添加標簽并在閱讀后刪除、支持帶標簽的批處理、支持自定義規則進行標簽管理。簡單安裝插件后,右鍵單擊集合中的任何項目,就可以批量添加/刪除標簽啦!
🚧『Zotero Better Notes』Zotero 內置 note 功能擴展
github.com/windingwind…
從配圖可以看到,頁面和菜單欄設計簡潔,但其實功能非常完備。除了常規的 Note 功能外,Zotero Better Notes 的一些拓展功能非常亮眼,主筆記的外部文檔插入、高亮批注、超鏈接插入PDF、插入筆記、引用、子筆記、大綱模式的思維導圖等功能,都值得嘗試!就呈現效果的豐富度而言,Zotero Better Notes 更像是一個富文本編輯器了。
🚧 『doccano』基于網頁的開源協同多語言文本標注工具
github.com/doccano/doc…
doccano 是一個開源人工文本標注工具,可以為 Named Entity Recognition 命名實體識別、Sentiment Analysis 情感分析、Tanslation 文本翻譯、Intent Detection and Slot Filling、Text to SQL、Image Classification 圖像分類、Image captioning 圖像說明、Object Detection 目標檢測、Polygon Segmentation 多邊形分割、Speech to Text 語音到文本等任務提供標注功能。只要創建一個項目,上傳數據并開始標注,就可以在幾個小時內建立一個數據集。
?
🚧 『ExplainableAI.jl』使用 Julia 和 Flux.jl 的可解釋人工智能
github.com/adrhill/Exp…
ExplainableAI.jl 實現了神經網絡的可解釋性方法和可視化,類似于 PyTorch 的 Captum、Zennit 以及Keras 模型的 iNNvestigate。Repo 提供了一個示例,用 LRP 解釋為什么使用一個預先訓練好的小型 LeNet5 模型將 MNIST 數字歸類為9。
🚧 『yolov7-opencv-onnxrun-cpp-py』YOLOv7目標檢測部署
github.com/hpc203/yolo…
Repo 分別使用 OpenCV、ONNXRuntime 部署 YOLOv7 目標檢測,一共包含14個 onnx模型。依然是包含 C++ 和 Python 兩個版本的程序。
🚧 『Superset』數據探索 & 數據可視化平臺
github.com/apache/supe…
Apache Superset 是一個企業級 BI 平臺,可以使用戶快速、輕量、直觀地探索和可視化數據,具有無代碼快速構建圖表、支持 SQL 編輯器、豐富美觀的可視化圖庫、可程序化定制的 API 等功能。Repo 頁面和官網(superset.apache.org)提供了多樣的下載安裝方式和詳細的教程。
🚧 『BasicSR-docs』BasicSR 開源庫的中文解讀文檔
github.com/XPixelGroup…
BasicSR(Basic Super Restoration)是一個基于 PyTorch 的開源圖像視頻復原工具箱,功能包括超分辨率、去噪、去模糊、去 JPEG 壓縮噪聲等,GitHub 已經有 3.6k Star!BasicSR-docs 是 BasicSR 中文解讀文檔的 LaTex 源碼文件,并提供了中文版 PDF 文檔下載(公眾號『ShowMeAI研究中心』回復關鍵字『日報』也可以獲取)。
🚧 『RESP』從 Google Scholar、ACL、ACM、Arxiv、PMLR 等獲取科研論文的引用情況、相關論文等
github.com/monk1337/re…
RESP(Research Papers Search),可以從谷歌學術獲取單篇論文的所有引用信息、相關論文,從 connectedpapers.com 獲取所有相關論文,基于關鍵詞從不同來源獲取相關論文。Repo 提到的源包括以下這些:Google Scholar、Acl、 Pmlr 、Arxiv、Semantic Scholar、NeurIPS、IJCAI、openreview、thecvf。
🚧 『LeetCode Curation Topical』技術面試準備清單
github.com/fterh/leetc…
針對面試過程中容易被問到的數據結構 LeetCode 題進行歸類整理:Arrays/Strings、Linked Lists/Deques、Trees、Graphs、Recursion/Backtracking、Dynamic Programming、Design & Implementation、Greedy 等。
🚧 『flashlight』快速、靈活的C++機器學習庫
github.com/flashlight/…
Flashlight 是一個快速、靈活的機器學習庫,由 Facebook AI 語音團隊及Torch、Deep Speech 的創作者完全使用 C++ 編寫。其核心功能包括內部可修改、占用空間小、默認功能高性能、效率和規模。
🚧『Asent』基于spaCy的情感分析庫
github.com/KennethEnev…
Asent 是一個基于規則的 Python 情感分析庫,使用一個包含正面/負面評價的詞匯字典 & 一系列規則,來確定一個詞、句子或文件是正面還是負面的。目前的規則考慮了否定詞(如 不高興/not happy)、增強詞(如 非常高興/very happy),并考慮了對比性連接詞(如 但是/but),以及其他強調標記(如感嘆號、大小寫和問號)。Repo 詳細介紹了情感計算的流程,配圖是例句『i am not very happy』的運行過程與解釋。
🚧『AQP』語音/音頻的質量評估平臺
github.com/QxLabIrelan…
AQP (Audio Quality Platform,音頻質量平臺),是一個高度模塊化的 pipeline,非常易于使用,可以對語音/音頻的各類質量指標 (如 ViSQOL、PESQ、Warp-Q 等) 進行客觀的測試和比較,以提高研發的穩健性、可重復性和開發速度。
🚧『Gorse』用 Go 編寫的開源推薦系統
github.com/gorse-io/go…
gorse.io/
Gorse 是一個使用 GO 語言編寫的開源推薦系統。將項目、用戶和交互數據導入 Gorse 后,系統將自動訓練模型為每個用戶生成推薦!作者總結了幾個項目的特點(或者說優點),看看哪點讓你心動了:
- 多源推薦:對于用戶,從不同的方式(流行、最新、基于用戶、基于項目和協同過濾)收集推薦項目,并通過點擊率預測進行排名。
- AutoML:通過后臺模型搜索自動選擇最佳推薦模型和策略。
- 分布式推薦:單節點訓練,分布式預測,在推薦階段實現水平擴展的能力。
- RESTful API:為數據 CRUD 和推薦請求提供 RESTful API。
- Dashboard:提供數據導入導出、監控、集群狀態檢查的dashboard。
🚧 『TLNewsSpider』輿情信息獲取,狠心開源企業級輿情爬蟲項目
github.com/casual-silv…
TLNewsSpider 是一個輿情信息獲取與可視化平臺,基于 GNE(General News Extractor,通用新聞正文抽取)模塊,抽取 300 多個輿情站點的正文內容、標題、作者、發布時間、圖片地址和正文所在的標簽源代碼等信息。 項目主干技術覆蓋python、scrapy、scrapyd、scrapydweb(開源管理平臺)、mysql、redis,支持任意數量的爬蟲一鍵運行、定時任務、批量刪除、一鍵部署,并且可以實現爬蟲監控可視化、配置集群爬蟲分配策略、現成的docker一鍵部署等功能。
🚧 『Upgini』機器學習自動化數據特征搜索/擴充庫
github.com/upgini/upgi…
外部數據和特征可以顯著提升監督學習模型的準確度,但是費時費力。本 repo 將這個過程自動化啦——在幾分鐘內提升模型效果,精準擴充有用的特征!Upgini 是一個簡單的特征搜索和擴充庫,可以在公共數據集或社區共享的數據源中,自動檢索『開箱即用』的數千個特征,并篩選、返回能提高模型預測能力的相關特征。
🚧 『PrimeQA』最先進的多語言問答(QA)開發庫
github.com/primeqa/pri…
PrimeQA 是基于Transformers 的開源庫,可以訓練最先進的回答(QA)模型。使用 PrimeQA ,研發人員既可以復現最新NLP會議論文,也可以在自定義數據中下載并運行預訓練的模型。PrimeQA 支持『基于傳統BM25的信息檢索』『ColBERT神經網絡信息檢索』『基于XLM-R的機器閱讀理解』『新聞&電影上的多媒體問答』,在信息檢索與問答場景提供端到端解決方案。
🚧 『Chinese-CLIP』CLIP模型的中文版
github.com/OFA-Sys/Chi…
本 repo 為 CLIP 模型的中文版本,幫助用戶實現中文領域的跨模態檢索、圖像表示等功能。項目使用大規模中文數據(約2億圖文對)進行訓練,并且對『open_clip project』原始項目代碼在中文數據上的效果進行了優化。項目作者在持續努力中,『開源 ViT-L-14 規模 Chinese-CLIP 模型』正在訓練中,后續也將提供基于 Chinese-CLIP 的圖文檢索demo 及其用戶在自己環境中的部署流程等等~ 良心制作,值得持續關注!
數據&資源
🔥 LeetBook『圖解算法數據結構』配套代碼 &『劍指 Offer』Python / Java / C++ 解題代碼
github.com/krahets/Lee…
LeetBook《圖解算法數據結構》面向算法初學者、互聯網求職者設計,主要內容包括『劍指 Offer 圖文題解』『數據結構與算法專欄』兩部分內容,為互聯網算法/軟件求職者、學習者等提供一份比較完整的學習和打卡資料。
🔥 『Python3 面試』準備參考
github.com/peterlamar/…
作者在自學 Python3 進行各種面試和有趣的 leetcoding 時,構建了這個備忘單。這份小抄不求全而是抓重點,是一個 Python 高頻問題子集。
🔥 『Awesome Face Generation』人臉生成相關文獻資源列表
github.com/zhangzjn/aw…
🔥 『Best Incremental Learning』增量學習/持續學習/終生學習相關文獻資源集
github.com/Vision-Inte…
🔥 『Federated Learning on Graph and Tabular Data』圖和表格數據上的聯邦學習文獻資源列表
github.com/youngfish42…
🔥『Awesome-YOLO-Object-Detection』YOLO目標檢測系統各種實現及應用項目大列表
github.com/dotnet-rs-p…
總結
以上是生活随笔為你收集整理的ShowMeAI —— Show u 三连的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 生成二维码 并可以点击下载(多个二维码一
- 下一篇: php. 生成器 send,PHP生成器