面向机器学习的特征工程翻译版
前些日子推薦了一個倉庫,是知名開源apachecn組織翻譯的《面向機器學習的特征工程》英文版,可以說是特征工程的寶典,值得推薦。
倉庫說明
知名開源apachecn組織翻譯了《面向機器學習的特征工程》英文版,可以說是特征工程的寶典,值得推薦:
倉庫地址:
https://github.com/apachecn/feature-engineering-for-ml-zh
文件目錄
一、引言
二、簡單數字的奇特技巧
三、文本數據:展開、過濾和分塊
四、特征縮放的效果:從詞袋到 TF-IDF
五、類別特征:機器雞時代的雞蛋計數
六、降維:使用 PCA 壓縮數據集
七、非線性特征提取和模型堆疊
八、自動化特征提取器:圖像特征提取和深度學習
九、回到特征:將它們放到一起
附錄、線性模型和線性代數基礎
內容簡介
第 1 章從數字數據的基本特征工程開始:過濾,合并,縮放,日志轉換和能量轉換以及交互功能。
第 2 章和第 3 章深入探討了自然文本的特征工程:bag-of-words,n-gram 和短語檢測。
第 4 章將 tf-idf 作為特征縮放的例子,并討論它的工作原理。
圍繞第 5 章討論分類變量的高效編碼技術,包括特征哈希和 bin-counting,步伐開始加速。
當我們在第 6 章中進行主成分分析時,我們深入機器學習的領域。
第 7 章將 k-means 看作一種特征化技術,它說明了模型堆疊的有效理論。
第 8 章都是關于圖像的,在特征提取方面比文本數據更具挑戰性。在得出深度學習是最新圖像特征提取技術的解釋之前,我們著眼于兩種手動特征提取技術 SIFT 和 HOG。
第 9 章中完成了一個端到端示例中的幾種不同技術,為學術論文數據集創建了一個推薦器。
總結
知名開源apachecn組織翻譯了《面向機器學習的特征工程》英文版,可以說是特征工程的寶典,值得推薦:
倉庫地址:
https://github.com/apachecn/feature-engineering-for-ml-zh
請關注和分享↓↓↓?
本站的知識星球(黃博的機器學習圈子)ID:92416895
目前在機器學習方向的知識星球排名第一
往期精彩回顧
良心推薦:機器學習入門資料匯總及學習建議(2018版)
黃海廣博士的github鏡像下載(機器學習及深度學習資源)
吳恩達老師的機器學習和深度學習課程筆記打印版
機器學習小抄-(像背托福單詞一樣理解機器學習)
首發:深度學習入門寶典-《python深度學習》原文代碼中文注釋版及電子書
機器學習的數學基礎
機器學習必備寶典-《統計學習方法》的python代碼實現、電子書及課件
吐血推薦收藏的學位論文排版教程(完整版)
Python環境的安裝(Anaconda+Jupyter notebook+Pycharm)
Python代碼寫得丑怎么辦?推薦幾個神器拯救你
重磅 | 完備的 AI 學習路線,最詳細的資源整理!
總結
以上是生活随笔為你收集整理的面向机器学习的特征工程翻译版的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 推荐:用动画的形式呈现解LeetCode
- 下一篇: 推荐Datawhale整理的秋招求职攻略