史上最萌最认真的机器学习/深度学习/模式识别入门指导手册(三)
能夠堅持走到階段三的喵一定是很有毅力的喵!也是很合格的機器學習/人工智能研究者啦~但是走到這里,也意味著您不滿足于使用看似孤立的機器學習模型來生硬的完成一些任務,那么,大一統的理論體系就在這一階段建立吧~
前言
完成這一階段的喵,在很多人眼里已經是小牛了。其實完成這一階段后確實可以無壓力的閱讀大部分機器學習/模式識別/深度學習及相關領域的論文了,甚至可以動動小想法發表小論文啦(只要英語別太差)。但是在小夕看來,開始扔掉大牛的書籍,開始啃論文才是研究的開始哦~
?
發布上個階段二時,有可愛的讀者聽到小夕說有4個階段后表示壓力很大,好像小夕這個入門指導太殘忍了一些,2333~其實真的沒有啦,靜下心來,堅實的走好每一步,會發現路邊都是風景哦。
?
還有人問小夕,小夕進行到階段幾了。小夕說過早就完成入門了呀,2333~加油哦,小夕在介里等你哦
?
階段三
?python
前置課程
線性代數
最優化算法
主參考資料
《a byte of Python》
《NumPy Tutorial》
《SciPy Tutorial》
輔助參考資料
《Python核心編程》
CSDN等各種中文技術博客
重點內容:
python基本語法
numpy
scipy
線性代數(linear algrbra)
優化(optimization)
高級內容(學嗨了就順便學了,沒學嗨留著以后現學現用)
scipy其他內容,比如統計、圖像處理等
matplotlib
scikit-learn
libsvm
學習方法
關于基礎語法:
對于已經有C/C++/Java中的一種或幾種編程語言基礎的老手,相信不用小夕多啰嗦啦~一本《a byte of python》就足夠掌握python基礎語法啦,記得只有100頁左右,一兩天就可以學完。對了,這本書有中文版哦,翻譯的還可以,喵喵一搜就能搜到啦。
對于編程基礎很薄弱的同學,可以忽略《a byte of python》,建議根著《python核心編程》的前十四章來,將基礎語法掌握牢固吶。
再啰嗦一句,其實入門最快的方式還是多看多寫代碼,《a byte of python》有附帶源代碼,看完《a byte of python》或者《python核心編程》后,再將這些源代碼看一遍一定會有不少收獲嗒~
關于各種擴展庫
對于英語還不錯的同學,強烈建議看官方各種庫的tutorial,講的很清晰,又簡潔。
對于英語實在不忍直視的同學,只能找各種中文博客啦,一搜xx庫入門指導,肯定出來很多打小牛的技術博客。。。雖然質量參差不齊,但是拿來入門勉強可以的。
主要意義
python在科學計算上的優勢使得其無論在學術界還是工業界都非常流行,雖然一般不會用python開發最終的產品,但是對于新算法、機器學習系統的快速實現是任何編譯型語言都比不來的。機器學習的主流編程語言不得不學哦。機器學習工程實踐
前置課程
python
機器學習
主參考資料
《機器學習實戰》
重點內容:
k近鄰
決策樹
樸素貝葉斯
logistic回歸
svm
adaboost
線性回歸
k-means
高級內容(學嗨了順便學了,這些輪子沒有前面的輪子重要)
PCA
SVD
學習方法
在保證機器學習理論已經掌握的情況下,參考《機器學習實戰》,對各個典型的機器學習模型進行代碼實現。最低要求建立代碼實現與數學理論的聯系,代碼能力強者可以嘗試獨立復現主流機器學習模型及其在應用場景的優化。
主要意義
? ? 小夕經常看到有人對這本書的書評是“重復造輪子的無意義書籍”。小夕對于這種說法好不想解釋呀,很多“經驗豐富”的程序員轉行做機器學習,卻認為機器學習跟學安卓/IOS開發一樣, 把API用熟練就算入門了,這種想法大錯特錯呀。機器學習是一門理論與工程仍舊在不斷突破的學科,而不是一件成熟的工業化產品。哪怕是在工業界,不懂輪子構造,只會用別人造好的輪子來實現機器學習系統的話,那這樣的工程師可能還不如xx語言工程師有價值。等AI浪潮一突破或者一冷靜,這些類庫小王子必然是首當其沖的。所以用python深刻的造輪子是長久發展的不可或缺的環節哦。
?
模式識別與深度學習-上
前置課程
線性代數
概率與統計
最優化算法
機器學習
主要參考資料
《模式分類》
《DEEP LEARNING》
重點內容:
貝葉斯決策
參數估計
非參數方法
線性判別函數
淺層神經網絡
delta方法
BP算法及其優化
RBF網絡
深度神經網絡
Hopfield了解
玻爾茲曼機(了解
RBM了解
DBN了解
DBM了解
CNN
Autoencoder
RNN
LSTM
聚類
高斯混合密度
K-means
層次聚類
決策樹與隨機森林
特征提取與特征選擇
學習方法
這門課學習時一定一定一定要記得自己多總結,梳理框架。不僅要深刻理解公式細節,更重要的是從全局出發,從更上層的視角來將機器學習模型串到一個大框架下。
重點內容的1-5和7-9根據《模式分類》來即可。
重點內容5中的SVM在模式分類中講解很糙,在之前的機器學習中已經掌握SVM的可以跳過,否則建議再理解一下。
重點內容的6根據《Deep Learning》對應章節來即可。
重點內容的8、9也講的很糙(我們的ppt講的很細,但是老師不讓分享ppt呀QAQ),如果看書覺得不夠透徹的話,可以求助wiki或者小夕。
主要意義
? ? ? 這門課是小夕整個計劃的最重點的一門課。這么課的重點和規劃也是按照我們學校的《模式識別》課程來的,學完之后應該很扎實的具備了機器學習/模式識別的理論啦。雖然網上經常把《模式分類》的難度吹的上天,其實只要按小夕說的,前置課程掌握好的話,這本書讀起來非常享受~真的那么難的話,怎么可能作為我們的教材呢。不過話說這本書的小錯誤真的很多!小夕以后寫一篇文章來把《模式分類》中發現的小錯誤與大家分享一下。
下階段預告
最優化算法-下
模式識別與深度學習-下
?
加油哦,快來陪小夕并肩作戰吧。
總結
以上是生活随笔為你收集整理的史上最萌最认真的机器学习/深度学习/模式识别入门指导手册(三)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Android自动化页面测速在美团的实践
- 下一篇: 深度学习在美团推荐平台排序中的运用