机器学习笔记(1):Introduction
目錄
1)welcome
2)What is Machine Learning
3)Supervised Learning?
4)Unsupervised Learning
1)welcome
第一個視頻主要介紹了機器學習目前的案例,主要有:數據庫挖掘、醫療記錄、生物工程、無人直升機、手寫識別、NLP、計算機視覺等。
2)What is Machine Learning
下面是機器學習的兩個定義,分別來自于Arthur Samuel 和 Tom Mitchell:
第一個定義是:在未進行特定編程的情況下,給予計算機學習能力的領域。
第二個定義是:一個程序被認為能從經驗 E 中學習,解決任務 T,達到性能度量值P,當且僅當,有了經驗 E 后,經過 P 評判,程序在處理 T 時的性能有所提升。
目前存在幾種不同類型的學習算法,主要的兩種類型為監督學習和無監督學習。此外還有強化學習和推薦系統等。但更重要的還有了解應用學習算法的建議。我們不僅要知道工具,更要知道如何使用好工具。
3)Supervised Learning?
先看一個例子,這有一張數據圖,橫軸表示面積,縱軸表示房價。基于這組數據,假如你有一個朋友,他有一套750平方英尺的房子,能賣多少錢?從圖中可以看出,紅色和藍色曲線代表兩種擬合方式,顯然藍色曲線擬合的效果更好。這是一個回歸問題,回歸的意思是,我們在試著推測出一個連續值的結果。
這里有一份關于乳腺癌的數據,橫軸表示腫瘤大小,縱軸表示腫瘤是否為惡性。惡性則為1,良性記為0。這是一個分類的問題,分類指的是,我們推測出離散的輸出值。
在其它機器學習問題中,可能會遇到不止一種特征,我們不僅知道腫瘤的尺寸,還知道患者的年齡。腫塊密度、腫瘤細胞尺寸等等。
現在我們來總結一下,監督學習基本思想是:我們數據集中的每個樣本都有相應的 “正確答案”。回歸可以推出一個連續的輸出,分類目標是一組離散的結果。
4)Unsupervised Learning
現在我們來介紹無監督學習。在監督學習中,數據集已經有了正確的標記。而在無監督學習中,數據集沒有任何的標簽。下圖中,我們把數據分成了兩個簇,這是聚類算法。
? ? ? ? ? ? ? ? ? ? ??? ? ? ? ?
下圖也是一個聚類算法的應用,輸入一組不同個體的基因,我們把個體聚類到不同的類或不同類型的組。
下面是無監督學習的應用,如組織大型計算機群、社交網絡分析,市場分割,天文學數據分析。
總結
以上是生活随笔為你收集整理的机器学习笔记(1):Introduction的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: JAMMER2ND.EXE是什么进程 J
- 下一篇: 教训惨痛!B站用户4000元买RTX 3