推荐:周志华《机器学习》西瓜书精炼版笔记来了!
西瓜書《機器學習》無疑是機器學習的必讀書籍。本書作為該領域的入門教材,在內容上盡可能涵蓋機器學習基礎知識的各方面。 為了使盡可能多的讀者通過本書對機器學習有所了解, 作者試圖盡可能少地使用數學知識. 然而, 少量的概率、統計、代數、優化、邏輯知識似乎不可避免。
對于這本書,我是非常推薦的。但是對于很多初學者或者數學基礎不是特別扎實的同學們來說,想要完整、清晰地弄懂這本書其實并不容易。因此,一份優秀的筆記對于我們學習本書來說,幫助很大。
今天就給大家推薦一個西瓜書《機器學習》的精煉版筆記。作者 Vay-keen 來自深圳大學,將自己整理的完整版筆記發布在了 GitHub 上。直接放出筆記地址:
https://github.com/Vay-keen/Machine-learning-learning-notes
對于這份筆記,作者這樣說:
周志華《機器學習》又稱西瓜書是一本較為全面的書籍,書中詳細介紹了機器學習領域不同類型的算法(例如:監督學習、無監督學習、半監督學習、強化學習、集成降維、特征選擇等),記錄了本人在學習過程中的理解思路與擴展知識點,希望對新人閱讀西瓜書有所幫助!
筆記目錄
這份筆記總共包含 17 份 .md 文檔,優勢在于美分文檔集合了圖片和公式,清晰明了。這 17 份文檔涵蓋了西瓜書 16 章的完整內容。具體筆記目錄如下:
緒論
性能度量
假設檢驗&方差&偏差
線性模型
決策樹
神經網絡
支持向量機
貝葉斯分類器
EM 算法
集成學習
聚類
降維與度量學習
特征選擇與稀疏學習
計算學習理論
半監督學習
概率圖模型
強化學習
筆記內容
下面,我們將摘錄一些筆記的內容,供大家參考。
1. 線性回歸
回歸就是通過輸入的屬性值得到一個預測值,利用上述廣義線性模型的特征,是否可以通過一個聯系函數,將預測值轉化為離散值從而進行分類呢?線性幾率回歸正是研究這樣的問題。對數幾率引入了一個對數幾率函數(logistic function),將預測值投影到0-1之間,從而將線性回歸問題轉化為二分類問題。
2. 神經網絡
在機器學習中,神經網絡一般指的是“神經網絡學習”,是機器學習與神經網絡兩個學科的交叉部分。所謂神經網絡,目前用得最廣泛的一個定義是“神經網絡是由具有適應性的簡單單元組成的廣泛并行互連的網絡,它的組織能夠模擬生物神經系統對真實世界物體所做出的交互反應”。
一直沿用至今的“M-P神經元模型”正是對這一結構進行了抽象,也稱“閾值邏輯單元“,其中樹突對應于輸入部分,每個神經元收到n個其他神經元傳遞過來的輸入信號,這些信號通過帶權重的連接傳遞給細胞體,這些權重又稱為連接權(connection weight)。細胞體分為兩部分,前一部分計算總輸入值(即輸入信號的加權和,或者說累積電平),后一部分先計算總輸入值與該神經元閾值的差值,然后通過激活函數(activation function)的處理,產生輸出從軸突傳送給其它神經元。M-P神經元模型如下圖所示:
作者還給出了 BP 神經網絡算法調整隱含層到輸出層的權重調整規則的推導過程:
3.?支持向量機
支持向量機是一種經典的二分類模型,基本模型定義為特征空間中最大間隔的線性分類器,其學習的優化目標便是間隔最大化,因此支持向量機本身可以轉化為一個凸二次規劃求解的問題。
4. 集成學習
顧名思義,集成學習(ensemble learning)指的是將多個學習器進行有效地結合,組建一個“學習器委員會”,其中每個學習器擔任委員會成員并行使投票表決權,使得委員會最后的決定更能夠四方造福普度眾生~...~,即其泛化性能要能優于其中任何一個學習器。
Boosting族算法最著名、使用最為廣泛的就是AdaBoost,AdaBoost使用的是指數損失函數,因此AdaBoost的權值與樣本分布的更新都是圍繞著最小化指數損失函數進行的。
整個AdaBoost的算法流程如下所示:
以上只摘錄了一小段筆記內容,完整的筆記請大家自行查閱,希望對你有所幫助。
最后,再次放上西瓜書開源筆記鏈接地址:
https://github.com/Vay-keen/Machine-learning-learning-notes
備注:西瓜書請買正版,支持下周志華老師
作者的公眾號:
本站簡介↓↓↓?
“機器學習初學者”是幫助人工智能愛好者入門的個人公眾號(創始人:黃海廣)
初學者入門的道路上,最需要的是“雪中送炭”,而不是“錦上添花”。
本站的知識星球(黃博的機器學習圈子)ID:92416895
目前在機器學習方向的知識星球排名第一(上圖二維碼)
往期精彩回顧
良心推薦:機器學習入門資料匯總及學習建議
黃海廣博士的github鏡像下載(機器學習及深度學習筆記及資源)
機器學習小抄-(像背托福單詞一樣理解機器學習)
首發:深度學習入門寶典-《python深度學習》原文代碼中文注釋版及電子書
機器學習的數學基礎
機器學習必備寶典-《統計學習方法》的python代碼實現、電子書及課件
Python代碼寫得丑怎么辦?推薦幾個神器拯救你
重磅 | 完備的 AI 學習路線,最詳細的資源整理!
圖解word2vec(原文翻譯)
CS229線性代數翻譯
備注:本站qq群:865189078(共8個群,不用重復加)。
加入本站微信群,請加黃博的助理微信,說明:公眾號用戶加群。
總結
以上是生活随笔為你收集整理的推荐:周志华《机器学习》西瓜书精炼版笔记来了!的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 深度学习的一些经验总结和建议| To d
- 下一篇: 斯坦福CS229机器学习课程的数学基础(