[机器学习笔记] Note1--机器学习简介
閱讀本文大約需要 2 分鐘
本文結(jié)構(gòu):
- 什么是機(jī)器學(xué)習(xí)
- 監(jiān)督學(xué)習(xí)(Supervised Learning)
- 非監(jiān)督學(xué)習(xí)(Unsupervised Learning)
- 課程小結(jié)
這是學(xué)習(xí) Andrew Ng 在 Coursea 上的機(jī)器學(xué)習(xí)課程所做的筆記。
什么是機(jī)器學(xué)習(xí)
對于機(jī)器學(xué)習(xí),并沒有一個一致認(rèn)同的定義,一個比較古老的定義是由Arthur Samuel在 1959 年給出的:
機(jī)器學(xué)習(xí)研究的是如何賦予計算機(jī)在沒有被明確編程的情況下仍能夠?qū)W習(xí)的能力。(Field of study that fives computers the ability to learn without being explicily programmed.)
隨后他編寫了一個跳棋游戲的程序,并且讓這個程序和其自身玩了幾萬局跳棋游戲,并且記錄下來棋盤上的什么位置可能會導(dǎo)致怎樣的結(jié)果,隨著時間的推移,計算機(jī)學(xué)會了棋盤上的哪些位置可能會導(dǎo)致勝利,并且最終戰(zhàn)勝了設(shè)計程序的 Samuel。
另一個比較現(xiàn)代且形式化的定義是由Tom Mitchell在 1998 年給出的:
對于某個任務(wù)T和表現(xiàn)的衡量P,當(dāng)計算機(jī)程序在任務(wù)T的表現(xiàn)上,經(jīng)過P的衡量,隨著經(jīng)驗E而增長,我們便稱計算機(jī)程序能夠通過經(jīng)驗E來學(xué)習(xí)該任務(wù)。
在上述的跳棋游戲的例子中,任務(wù) T 是玩跳棋游戲,P 是游戲的輸贏,而經(jīng)驗E 則是一局局的游戲。
一些機(jī)器學(xué)習(xí)的應(yīng)用例子:
- 數(shù)據(jù)挖掘
- 一些無法通過手動編程來編寫的應(yīng)用:如自然語言處理,計算機(jī)視覺
- 一些自助式的程序:如推薦系統(tǒng)
- 理解人類是如何學(xué)習(xí)的
監(jiān)督學(xué)習(xí)(Supervised Learning)
監(jiān)督學(xué)習(xí)是什么呢?
下面我們用一個房價的例子來介紹下監(jiān)督學(xué)習(xí),如下所示:
即通過給出房子面積和房價的一些數(shù)據(jù),來預(yù)測一個新的房子面積所能賣出的房價。
所以,監(jiān)督學(xué)習(xí)是指給出標(biāo)記的數(shù)據(jù)集,并且已知輸入和輸出的關(guān)系,然后計算一個模型,可以對新的輸入預(yù)測對應(yīng)的輸出結(jié)果。
監(jiān)督學(xué)習(xí)分為兩類問題,分別是回歸問題和分類問題。回歸問題的輸出是一個連續(xù)值,比如在預(yù)測房價這個例子中,預(yù)測房價是一個回歸問題,其結(jié)果是連續(xù)值。而分類問題是得到一個離散值的輸出,比如同樣是預(yù)測房價的例子,如果問題從預(yù)測賣出的房價變成賣出的房價是偏高還是偏低,就是屬于分類問題,因為其答案可以用 0 或 1 表示高了或者低了。
課程中給出另一個例子說明分類問題,如下圖所示:
問題是假設(shè)預(yù)測一個乳腺癌是否是惡性的,圖中坐標(biāo)軸橫軸表示腫瘤的大小,縱軸表示病人的年齡,以 O 表示良性腫瘤,以X表示惡性腫瘤。所以問題就是判斷是良性還是惡性腫瘤,這就是一個分類問題。
非監(jiān)督學(xué)習(xí)(Unsupervised Learning)
在監(jiān)督學(xué)習(xí)中,無論是回歸問題還是分類問題,數(shù)據(jù)集都有一個明確的結(jié)果。
但非監(jiān)督學(xué)習(xí)中,數(shù)據(jù)并沒有一個結(jié)果,有的只是特征,即非監(jiān)督學(xué)習(xí)要解決的問題是這些數(shù)據(jù)是否可以分成不同的組。
因此,非監(jiān)督學(xué)習(xí)中典型的例子就是聚類問題。例如對一個大型的數(shù)據(jù)中心的網(wǎng)絡(luò)傳輸數(shù)據(jù)情況進(jìn)行分析,發(fā)現(xiàn)那些多數(shù)時候是在協(xié)作的計算機(jī)。
課程小結(jié)
這是第一節(jié)課程的內(nèi)容,主要介紹了機(jī)器學(xué)習(xí)是什么,以及機(jī)器學(xué)習(xí)的兩大學(xué)習(xí)問題–監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)。
本節(jié)課程比較簡單,但介紹的內(nèi)容還是很重要的,后面介紹的大多數(shù)機(jī)器學(xué)習(xí)算法都屬于監(jiān)督學(xué)習(xí)或者非監(jiān)督學(xué)習(xí),當(dāng)然實際上機(jī)器學(xué)習(xí)還不只有這兩種學(xué)習(xí)問題,比如最近一兩年開始熱門起來的強(qiáng)化學(xué)習(xí)問題,以及半監(jiān)督學(xué)習(xí)問題,但在吳恩達(dá)老師這門入門課程中并不會介紹這些內(nèi)容。
歡迎關(guān)注我的公眾號,一起交流,學(xué)習(xí)和進(jìn)步!
總結(jié)
以上是生活随笔為你收集整理的[机器学习笔记] Note1--机器学习简介的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python学习--windows下安装
- 下一篇: 2020年周记(3/50)