为什么要写《机器学习实践应用》这本书
預(yù)售地址:
https://item.jd.com/12114501.html
歷經(jīng)了10個(gè)月,《機(jī)器學(xué)習(xí)實(shí)踐應(yīng)用》這本書終于面世了。首先呢,因?yàn)槲业墓ぷ鞅容^忙,只能抽一些周末或者是下班以后的時(shí)間進(jìn)行寫作,另外書的發(fā)布流程是一個(gè)漫長(zhǎng)的過(guò)程。所以當(dāng)這本書出版的時(shí)候,我感到熟悉又陌生,熟悉是因?yàn)闀械膬?nèi)容經(jīng)過(guò)了多次校對(duì)已經(jīng)印到我的腦子中了,陌生是距離剛開始寫這本書已經(jīng)過(guò)去接近一年,對(duì)于當(dāng)時(shí)的狀態(tài)有一些陌生。我因?yàn)橛洃浟Σ缓?#xff08;智商偏低),所以從小就養(yǎng)成了經(jīng)常總結(jié)事情的毛病,今天剛好趕上快周末,并且《機(jī)器學(xué)習(xí)實(shí)踐應(yīng)用》已經(jīng)上架預(yù)售,所以就寫了這篇筆記對(duì)這本書發(fā)布的流程進(jìn)行總結(jié)。
首先就是為什么要寫這本書?其實(shí)從小都沒(méi)想過(guò)我會(huì)寫一個(gè)這么多字的東西,碩士畢業(yè)的時(shí)候?qū)?萬(wàn)字論文都快把我逼瘋了,更何況是20萬(wàn)字的一本書。而且我從小語(yǔ)文就不太好,高考語(yǔ)文也是最低的一科。但是因?yàn)橛浶圆缓?#xff0c;所以我一直特別喜歡記筆記,特別是后來(lái)在CSDN上寫博客開始記錄和分享我的一些學(xué)習(xí)成果,我覺(jué)得能有更多的人跟我一起討論一件事是非常之有趣的。加上最近兩年入職阿里,寫了很多機(jī)器學(xué)習(xí)相關(guān)的文章,得到了一些出版行業(yè)的朋友的關(guān)注。所以索性,把之前的學(xué)習(xí)筆記和已經(jīng)寫好的機(jī)器學(xué)習(xí)相關(guān)的文章做一個(gè)整合,于是就形成了《機(jī)器學(xué)習(xí)實(shí)踐應(yīng)用》。
另外,也有一些比較宏觀的原因,比如我覺(jué)得市面上很多機(jī)器學(xué)習(xí)相關(guān)的書都偏理論,但是真正搞機(jī)器學(xué)習(xí)的大部分人群是一些算法的使用者,這部分同學(xué)可能不需要對(duì)每一種算法在數(shù)學(xué)層面的推導(dǎo)有很深的見(jiàn)解,大家需要一些偏業(yè)務(wù)的引導(dǎo)。基于這個(gè)原因,我想有一本書可以幫助大家彌補(bǔ)算法和業(yè)務(wù)之間的gap。但是因?yàn)槟芰τ邢?#xff0c;不知道是幫忙縮小了這個(gè)gap,還是擴(kuò)大了,哈哈。
最后就是我覺(jué)得出一本書是一件很酷的事情,紙質(zhì)的書會(huì)讓我自己看算法的時(shí)候變的很舒服,而且現(xiàn)在不是流行一句話“阿貓阿狗都能出書了”,我也想當(dāng)次阿貓阿狗。寫書可以強(qiáng)迫你去更多的思考,去看更豐富的資料,無(wú)意間也可以提高自己的姿勢(shì)。總結(jié)起來(lái)就是一句話,“生活在這個(gè)繁雜浮躁的社會(huì),能花10個(gè)月的精力專注的做一件事情是一個(gè)很酷的行為”(認(rèn)真臉)。
對(duì)于后期的計(jì)劃,用稿費(fèi)來(lái)一次說(shuō)走就走的旅行,幾個(gè)候選集:印度、去西班牙看皇馬的比賽、去一次非洲,我還沒(méi)想清楚。上班之前給自己定了一個(gè)計(jì)劃,每年用業(yè)余時(shí)間去做一件酷的事情,上一件是出版一本書,已經(jīng)實(shí)現(xiàn)了,下一件事情正在有條不紊的進(jìn)行。最后的最后,忘了推薦《機(jī)器學(xué)習(xí)實(shí)踐應(yīng)用》這本書,那就不推薦了吧(上面那幾個(gè)地方?jīng)]稿費(fèi)我也去的起,哈哈)。
內(nèi)容簡(jiǎn)介:
機(jī)器學(xué)習(xí)是一門多領(lǐng)域交叉學(xué)科,涉及概率論、統(tǒng)計(jì)學(xué)、逼近論、凸分析、算法復(fù)雜度等多門學(xué)科,專門研究計(jì)算機(jī)怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為。機(jī)器學(xué)習(xí)是人工智能的核心,是使計(jì)算機(jī)具有智能的根本途徑。
本書通過(guò)對(duì)機(jī)器學(xué)習(xí)的背景知識(shí)、算法流程、相關(guān)工具、實(shí)踐案例以及知識(shí)圖譜等內(nèi)容的講解,全面介紹了機(jī)器學(xué)習(xí)的理論基礎(chǔ)和實(shí)踐應(yīng)用。書中涉及機(jī)器學(xué)習(xí)領(lǐng)域的多個(gè)典型算法,并詳細(xì)給出了機(jī)器學(xué)習(xí)的算法流程。
本書適合任何有一定數(shù)據(jù)功底和編程基礎(chǔ)的讀者閱讀。通過(guò)閱讀本書,讀者不僅可以了解機(jī)器學(xué)習(xí)的理論基礎(chǔ),也可以參照一些典型的應(yīng)用案例拓展自己的專業(yè)技能。同時(shí),本書也適合計(jì)算機(jī)相關(guān)專業(yè)的學(xué)生以及對(duì)人工智能和機(jī)器學(xué)習(xí)感興趣的讀者閱讀。
目錄:
第1部分 背景知識(shí)
第1章 機(jī)器學(xué)習(xí)概述 3
1.1 背景 3
1.2 發(fā)展現(xiàn)狀 6
1.2.1 數(shù)據(jù)現(xiàn)狀 6
1.2.2 機(jī)器學(xué)習(xí)算法現(xiàn)狀 8
1.3 機(jī)器學(xué)習(xí)基本概念 12
1.3.1 機(jī)器學(xué)習(xí)流程 12
1.3.2 數(shù)據(jù)源結(jié)構(gòu) 14
1.3.3 算法分類 16
1.3.4 過(guò)擬合問(wèn)題 18
1.3.5 結(jié)果評(píng)估 20
1.4 本章小結(jié) 22
第2部分 算法流程
第2章 場(chǎng)景解析 25
2.1 數(shù)據(jù)探查 25
2.2 場(chǎng)景抽象 27
2.3 算法選擇 29
2.4 本章小結(jié) 31
第3章 數(shù)據(jù)預(yù)處理 32
3.1 采樣 32
3.1.1 隨機(jī)采樣 32
3.1.2 系統(tǒng)采樣 34
3.1.3 分層采樣 35
3.2 歸一化 36
3.3 去除噪聲 39
3.4 數(shù)據(jù)過(guò)濾 42
3.5 本章小結(jié) 43
第4章 特征工程 44
4.1 特征抽象 44
4.2 特征重要性評(píng)估 49
4.3 特征衍生 53
4.4 特征降維 57
4.4.1 特征降維的基本概念 57
4.4.2 主成分分析 59
4.5 本章小結(jié) 62
第5章 機(jī)器學(xué)習(xí)算法——常規(guī)算法 63
5.1 分類算法 63
5.1.1 K近鄰 63
5.1.2 樸素貝葉斯 68
5.1.3 邏輯回歸 74
5.1.4 支持向量機(jī) 81
5.1.5 隨機(jī)森林 87
5.2 聚類算法 94
5.2.1 K-means 97
5.2.2 DBSCAN 103
5.3 回歸算法 109
5.4 文本分析算法 112
5.4.1 分詞算法——Hmm 112
5.4.2 TF-IDF 118
5.4.3 LDA 122
5.5 推薦類算法 127
5.6 關(guān)系圖算法 133
5.6.1 標(biāo)簽傳播 134
5.6.2 Dijkstra最短路徑 138
5.7 本章小結(jié) 145
第6章 機(jī)器學(xué)習(xí)算法——深度學(xué)習(xí) 146
6.1 深度學(xué)習(xí)概述 146
6.1.1 深度學(xué)習(xí)的發(fā)展 147
6.1.2 深度學(xué)習(xí)算法與傳統(tǒng)
算法的比較 148
6.2 深度學(xué)習(xí)的常見(jiàn)結(jié)構(gòu) 152
6.2.1 深度神經(jīng)網(wǎng)絡(luò) 152
6.2.2 卷積神經(jīng)網(wǎng)絡(luò) 153
6.2.3 循環(huán)神經(jīng)網(wǎng)絡(luò) 156
6.3 本章小結(jié) 157
第3部分 工具介紹
第7章 常見(jiàn)機(jī)器學(xué)習(xí)工具介紹 161
7.1 概述 161
7.2 單機(jī)版機(jī)器學(xué)習(xí)工具 163
7.2.1 SPSS 163
7.2.2 R語(yǔ)言 167
7.2.3 工具對(duì)比 172
7.3 開源分布式機(jī)器學(xué)習(xí)工具 172
7.3.1 Spark MLib 172
7.3.2 TensorFlow 179
7.4 企業(yè)級(jí)云機(jī)器學(xué)習(xí)工具 190
7.4.1 亞馬遜AWS ML 191
7.4.2 阿里云機(jī)器學(xué)習(xí)PAI 196
7.5 本章小結(jié) 205
第4部分 實(shí)戰(zhàn)應(yīng)用
第8章 業(yè)務(wù)解決方案 209
8.1 心臟病預(yù)測(cè) 209
8.1.1 場(chǎng)景解析 209
8.1.2 實(shí)驗(yàn)搭建 211
8.1.3 小結(jié) 216
8.2 商品推薦系統(tǒng) 216
8.2.1 場(chǎng)景解析 217
8.2.2 實(shí)驗(yàn)搭建 218
8.2.3 小結(jié) 220
8.3 金融風(fēng)控案例 220
8.3.1 場(chǎng)景解析 221
8.3.2 實(shí)驗(yàn)搭建 222
8.3.3 小結(jié) 225
8.4 新聞文本分析 225
8.4.1 場(chǎng)景解析 225
8.4.2 實(shí)驗(yàn)搭建 226
8.4.3 小結(jié) 230
8.5 農(nóng)業(yè)貸款發(fā)放預(yù)測(cè) 230
8.5.1 場(chǎng)景解析 230
8.5.2 實(shí)驗(yàn)搭建 232
8.5.3 小結(jié) 236
8.6 霧霾天氣成因分析 236
8.6.1 場(chǎng)景解析 237
8.6.2 實(shí)驗(yàn)搭建 238
8.6.3 小結(jié) 243
8.7 圖片識(shí)別 243
8.7.1 場(chǎng)景解析 243
8.7.2 實(shí)驗(yàn)搭建 245
8.7.3 小結(jié) 253
8.8 本章小結(jié) 253
第5部分 知識(shí)圖譜
第9章 知識(shí)圖譜 257
9.1 未來(lái)數(shù)據(jù)采集 257
9.2 知識(shí)圖譜的概述 259
9.3 知識(shí)圖譜開源
工具 261
9.4 本章小結(jié) 264
參考文獻(xiàn) 265
與作者交流,請(qǐng)關(guān)注公眾號(hào):
總結(jié)
以上是生活随笔為你收集整理的为什么要写《机器学习实践应用》这本书的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 深度学习分布式策略优化、显存优化、通信优
- 下一篇: 深度学习RNN实现股票预测实战(附数据、