吴恩达机器学习(第一章)——初识机器学习
第一章 初識機器學習
文章目錄
- 第一章 初識機器學習
- 前言
- 機器學習定義
- 機器學習算法
- 監督學習
- 無監督學習
- 學習工具
前言
Machine Learning:
Grewout of work in AI,newcapability for computers
機器學習
人工智能的偉大成就,計算機的新功能
| 數據挖掘 | 自動化/網絡化發展帶來的大數據集 |
| 不能用手編寫的應用程序 | example. 自然語言處理NLP,計算機視覺CV |
| 個人定制程序 | example. 亞馬遜的產品推薦 |
機器學習定義
舊定義:在沒有明確設置的情況下,使計算機具有學習能力的研究領域
新定義:計算機程序從經驗 E 中學習解決某一任務 T 進行某一性能測量 P ,通過 P 測定在 T 上的表現因經驗 E 而提高。
機器學習算法
| 監督學習 | 人教會計算機做某些事情 |
| 無監督學習 | 讓計算機自己學習劃分數據 |
| 其他 | 強化學習、推薦系統等等 |
監督學習
監督學習(Supervised Learning):給機器一定的訓練集,訓練集里面每個元素都有相應正確的標簽,讓機器學習這些訓練集,來訓練出可以達到預期相應的正確標簽的模型
- 我們可以通過直線擬合來預測房價,也可以通過多項式擬合等其他算法來預測房價
- 對房價的預測是一個回歸問題,對給定值預測實際輸出
- 房價實際上是一系列離散的值,但是通常把房價看作實數,當作標量,所以把它看成一個連續的值,回歸的意思是試著推測出這一系列連續值屬性
- 估算腫瘤是良性還是惡性的概率,是一個分類問題
- 分類指的是,我們試著推測出離散的輸出值:0或1 。事實上在分類問題中,輸出可能不止一個值,可能輸出 0、1、2、3 等。
- 在其他機器學習問題中,可能會遇到多種特征需要表示的情況,以后會學習一個算法,叫支持向量機(Support Vector Machine)簡稱SVM,即使有無限種特征都能處理
無監督學習
無監督學習(Unsupervised Learning):給機器一定的數據集,每條數據要么沒有任何標簽,要么是有相同的標簽,從中找出數據的某種結構并劃分
聚類算法:對于大量未知標注的數據集,按數據集的內在相似性將數據集劃分為多個類別,即劃分為不同的簇。聚類算法是無監督學習中最常用的一種
聚類算法的應用:
- 組織大量的計算機集群
- 社交網絡分析
- 市場細分的應用
- 天文數據的分析
- ······
無監督學習的另一種算法是雞尾酒算法
在一個雞尾酒宴會中,兩個人在同時說話,用兩個不同位置的麥克風記錄下他們的話,這聽起來像是兩份錄音被疊加到了一起,產生了我們現在的錄音,算法將會這兩個音頻資源區分開來
學習工具
吳恩達的機器學習課程的學習工具前幾年是用的 Octave 和 Matlab,現在則是推薦使用 Python 進行學習
從2018年開始,Python 變得炙手可熱,有必要學習 Python 的一些基礎語法,用 Python 進行數據分析并完成作業,更好地掌握機器學習知識的應用
總結
以上是生活随笔為你收集整理的吴恩达机器学习(第一章)——初识机器学习的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: CentOS7使用yum安装Nginx
- 下一篇: 吴恩达机器学习(第二章)——单变量线性回