吴恩达机器学习笔记——第一章
每學(xué)完一章都來寫一篇博客,用來總結(jié)回顧和反思。
一、機(jī)器學(xué)習(xí)的一些簡單應(yīng)用
我們可以利用計(jì)算機(jī)實(shí)現(xiàn)基礎(chǔ)的功能:例如計(jì)算A到B的最短路徑。
但是 網(wǎng)頁搜索、垃圾郵件的過濾、圖片識(shí)別 等功能需要應(yīng)用機(jī)器學(xué)習(xí)的技術(shù),總體來說分成五個(gè)方面
? 1、數(shù)據(jù)挖掘,例如分析用戶的點(diǎn)擊量來分析用戶習(xí)慣,更好的了解用戶
? 2、對(duì)于某些無法直接編寫代碼的場景,例如無人機(jī)自動(dòng)駕駛
??3、NLP 自然語言處理
? 4、個(gè)性推薦
? 5、AI,像人的大腦一樣
二、什么是機(jī)器學(xué)習(xí)
? ? ?Arthur Samuel對(duì)機(jī)器學(xué)習(xí)的定義:在沒有明確設(shè)置的情況下,使計(jì)算機(jī)具有學(xué)習(xí)能力的研究領(lǐng)域(有些陳舊,不正確)。
? ? Tom Mitchell:計(jì)算機(jī)程序從經(jīng)驗(yàn)E中學(xué)習(xí)解決某一任務(wù)T,進(jìn)行某一性能度量P,通過P測定在T上的表現(xiàn)因經(jīng)驗(yàn)E而提高。
? ? 機(jī)器學(xué)習(xí)算法分類:
? ? 1. 監(jiān)督學(xué)習(xí):我們教計(jì)算機(jī)做某件事情
? ? 2. 無監(jiān)督學(xué)習(xí):我們讓計(jì)算機(jī)自己學(xué)習(xí)
? ? 3. 強(qiáng)化學(xué)習(xí)
? ? 4. 推薦系統(tǒng)
三、監(jiān)督學(xué)習(xí)(supervised learning)
監(jiān)督學(xué)習(xí):就是我們給算法一個(gè)數(shù)據(jù)集,其中包含了正確答案。也就是說我們給它一個(gè)房價(jià)數(shù)據(jù)集,在這個(gè)數(shù)據(jù)集中的每個(gè)樣本,我們都給出正確的價(jià)格即這個(gè)房子實(shí)際賣價(jià),算法的目的就是給出更多的正確答案,例如為你朋友想要賣掉的這所新房子給出估價(jià)。
回歸問題:結(jié)果是線性的(我們?cè)O(shè)法預(yù)測出一個(gè)連續(xù)值的結(jié)果)。
分類問題:結(jié)果是離散的(我們?cè)O(shè)法預(yù)測出一個(gè)離散值得結(jié)果)。
四、無監(jiān)督學(xué)習(xí)(unsupervised learning)
無監(jiān)督學(xué)習(xí):就是我們已知的數(shù)據(jù),不同于監(jiān)督學(xué)習(xí)的數(shù)據(jù)一樣,無監(jiān)督學(xué)習(xí)中是沒有任何標(biāo)簽的。針對(duì)數(shù)據(jù)集,無監(jiān)督學(xué)習(xí)就可能判斷出數(shù)據(jù)有兩個(gè)不同的聚集簇。這是一個(gè),這是另外一個(gè),二者不同。這就叫聚類算法。
聚類應(yīng)用的一個(gè)例子就是在谷歌新聞中。如果你以前從來沒見過它,你可以到這個(gè) URL 網(wǎng)址 news.google.com 去看看。谷歌新聞每天都在收集非常多非常多的網(wǎng)絡(luò)的新聞內(nèi)容。 它再將這些新聞分組,組成有關(guān)聯(lián)的新聞。所以谷歌新聞做的就是搜索非常多的新聞事件, 自動(dòng)地把它們聚類到一起。所以,這些新聞事件全是同一主題的,并會(huì)顯示到一起。
所以這個(gè)就是無監(jiān)督學(xué)習(xí),因?yàn)槲覀儧]有提前告知算法一些信息。我們只是說,是的,這是有一堆數(shù)據(jù)。我不知道這些數(shù)據(jù)是什么。我不知道誰是什么類型。我甚至不知道有哪些不同的類型,你能自動(dòng)地找到數(shù)據(jù)中的結(jié)構(gòu)嗎?就是說你要自動(dòng)地聚類那些個(gè)體到各個(gè)類,我沒法提前知道哪些是哪些。因?yàn)槲覀儧]有給算法正確答案來回應(yīng)數(shù)據(jù)集中的數(shù)據(jù),所以這就是無監(jiān)督學(xué)習(xí)。
聚類和分類的區(qū)別:
分類:已知數(shù)據(jù)的類型,即在沒有輸入的時(shí)候,就知道輸出的結(jié)果(如:腫瘤良性還是惡性)。
聚類:不知道數(shù)據(jù)的類型,只給數(shù)據(jù)一些特征,機(jī)器根據(jù)特征,將數(shù)據(jù)分開。
無監(jiān)督學(xué)習(xí)或者聚類的一些應(yīng)用:
1、它用于組織大型計(jì)算機(jī)集群。我有些朋友在大數(shù)據(jù)中心工作,那里有大型的計(jì)算機(jī)集群,他們想解決什么樣的機(jī)器易于協(xié)同地工作,如果你能夠讓那些機(jī)器協(xié)同工作,你就能讓你的數(shù)據(jù)中心工作得更高效。
2、第二種應(yīng)用就是社交網(wǎng)絡(luò)的分析。所以已知你朋友的信息,比如你經(jīng)常發(fā) email 的,或是你 Facebook 的朋友、谷歌+圈子的朋友,我們能否自動(dòng)地給出朋友的分組呢?即每組里的人們彼此都熟識(shí),認(rèn)識(shí)組里的所有人?
3、還有市場分割。許多公司有大型的數(shù)據(jù)庫,存儲(chǔ)消費(fèi)者信息。所以,你能檢索這些顧客數(shù)據(jù)集,自動(dòng)地發(fā)現(xiàn)市場分類,并自動(dòng)地把顧客劃分到不同的細(xì)分市場中,你才能自動(dòng)并更有效地銷售或不同的細(xì)分市場一起進(jìn)行銷售。這也是無監(jiān)督學(xué)習(xí),因?yàn)槲覀儞碛兴械念櫩蛿?shù)據(jù),但我們沒有提前知道是什么的細(xì)分市場,以及分別有哪些我們數(shù)據(jù)集中的顧客。我們不知道誰是在一號(hào)細(xì)分市場,誰在二號(hào)市場,等等。那我們就必須讓算法從數(shù)據(jù)中發(fā)現(xiàn)這一切。
4、最后,無監(jiān)督學(xué)習(xí)也可用于天文數(shù)據(jù)分析,這些聚類算法給出了令人驚訝、有趣、有用的理論,解釋了星系是如何誕生的。
這些都是聚類的例子,但是聚類只是無監(jiān)督學(xué)習(xí)中的一種。
Fighting!!!
?
?
?
與50位技術(shù)專家面對(duì)面20年技術(shù)見證,附贈(zèng)技術(shù)全景圖總結(jié)
以上是生活随笔為你收集整理的吴恩达机器学习笔记——第一章的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: OpenCV4.0+VS2017完整安装
- 下一篇: SpringCloud 入门教程(八):