看完这13张图,不得不佩服还是外国人会玩人工智能
對于程序員來說,機器學習領域無疑充滿著巨大的誘惑和挑戰,很多人對里面復雜的概念和算法頭疼不已,那么,有沒有一套對新手既友好又明了,對老手能加深印象,不斷復習的學習辦法呢?有,今天優達菌要送給大家一份“機器學習小抄”!
如果你不太清楚機器學習小抄是什么,請繼續耐心閱讀;如果你比較著急獲取完整版內容,請直接翻到文末,查看獲取小抄的方法。
這份“小抄”來自網紅數據科學家Chris Albon,他有近十年的統計學習、人工智能和軟件工程方面的經驗。著名的IT播客 Partially Derivative,就是他和其他兩位大佬一起主持的。
由于在機器學習上浸淫多年,累積了豐富的知識,Chris便將自己所識所學濃縮在一張張短小精悍的卡片中,并且在Twitter上不定期地更新卡片內容。
Chris本人
眾所周知,機器學習是由計算機、科學統計學和數學共同支撐起的一個廣闊領域,有數百個概念要學習,這些卡片旨在幫助你速記機器學習中的關鍵概念。
每一張卡片都包含一個機器學習概念,用圖片搭配文字解釋的方式生動地向你闡述概念背后的基礎思路,范圍從數學基礎橫跨到大熱的深度學習。
這些公式由Chris先手工繪制,再數據化轉換成你面前的一張張圖片,比起一頁頁地翻教科書更輕松偷♂稅。
你甚至能把圖片復制進手機,哪里不會點哪里,路上通勤的時候也能隨手翻看,這總比背英語單詞有趣多了吧!
到底愉不愉悅?優達君花了點時間金錢集齊了這套卡片,并辛苦地做了漢化,同時對一些作者沒講到或者不全面的知識做了補充。今天先發一些給大家感受下,如果覺得好玩且有幫助,可以直接翻到文末,查看小卡片領取方法。
準確率:分類問題中的常見度量方法。當我們有極為不平衡的分類時則不能奏效。這種情況下使用F1分數更為合適。
自適應提升算法:
1、為每一個觀測值Xi賦一個初始的權重值,Wi = 1/n,n是觀測值總數。
2、訓練一個“弱”模型。(通常是決策樹)
3、對于每一個觀測值:
? ? ?a)??????如果預測值錯誤,Wi增加
? ? ?b)??????如果預測值正確,Wi減少
4、訓練一個新的弱模型,其中,有更高權重的觀測值獲得更高優先級。
5、重復第3、4步,直到觀測值都能被完美預測出來或者預設數量的樹都被訓練完了。
調整R平方:
直觀上:一旦所有正確的特征都已經加上,額外的特征應該被懲罰。
(優達菌注:調整R平方有最大值,在此最大值下有最好的特征組合,常用于特征選擇。)
凝聚型聚類:所有的觀測值初始自成一個聚類。根據一些標準,聚類間相互合并。不斷重復這一過程,直到到達某一終點。
AIC(Akaike information criterion):在特征選擇時用于比較哪個模型更好。AIC越小越好。
幾乎處處:根據度量理論,一個幾乎處處成立的性質對所有事物都是正確的,但是一些先鋒案例就會自然地忽略掉。
嶺回歸中的Alpha,不懂看圖。
安斯庫姆四重奏:安斯庫姆四重奏用4組完全不同的數據,得出相同的匯總統計和回歸線。這是對匯總統計的警示。
神經網絡架構:
?????????? 神經網絡架構指單元,他們的激活函數,有幾層等等。
?????????? 大多數的神經網絡架構可被理解為單元堆積層。
?????????? 某一問題的最好架構應該通過使用驗證集試驗后找到。
AUC:ROC曲線代表二分類器中真正類比例和假正類比例的概率閾值。AUC能評判模型的整體質量。AUC越高越好。
覺得機器學習很有趣,想進一步深入學習,加入 AI 熱潮,成為擁有?Google 技術認證的高薪、搶手又能改變世界的機器學習工程師嗎?
Udacity 與 Google、Kaggle、滴滴打車等行業領先企業,共同設計打造“機器學習工程師”納米學位項目,帶你從0開始進入人工智能領域,達到行業認可的硅谷水平。
掃描下方二維碼,加入微信群,獲取全套機器學習小卡片,還有更多課程資訊等你了解!
加入課程,你可以獲得:
硅谷獨家課程內容,Google、Kaggle、滴滴出行開發課程并頒發認證
全中文的學習輔導
每周一次直播輔導,答疑沒煩惱
加入同步學習小組,在導師監督下加速成長
本期課程將于?12月14日(明天)10:00?正式開放報名,僅限 300?席位。點擊閱讀原文,立即預定搶席位!
總結
以上是生活随笔為你收集整理的看完这13张图,不得不佩服还是外国人会玩人工智能的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 简单六步,用数据说服你的听众
- 下一篇: 仿真模拟,需要注意这几点!