机器学习入门:机器学习概论
生活随笔
收集整理的這篇文章主要介紹了
机器学习入门:机器学习概论
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
什么是機器學習?
?
在1959年,Arthur Samuel:不用編程去指定機器做什么,而是讓機器有能力自己學習;
在1998年,Tom Mitchell:首先定義任務T,經驗E,表現P,如果機器有一個任務T,隨著經驗E的增多,表現P也會變好,則表示機器正在經驗E中學習;
以上就是對機器學習的兩個定義; 機器學習在生活中也處處可見,比如: (1)在gmail中,提供了一個“垃圾郵件”選項,可以通過機器學習辨別郵件是否為垃圾郵件,此處利用了分類算法; 如果我們根據Tom Mitchell的定義,則: T:classify email as spam or not spam. E:watching you label emails as spam or not spam. P:The number of emails correctly classified as spam or not spam. (2)ebay利用學習型算法判斷某個信用卡是否被盜; (3)“深藍”下棋勝過國際象棋大師,是因為“深藍”已經通過機器學習的方法學習了下棋的技術;
以上這些例子就是機器學習的常見案例; 機器學習的常見算法分為: (1)Supervised Learning(監督學習):下面的圖片就是典型的監督學習的例子,監督學習分為Classifying和Regression,兩者的區別后面解釋,下圖的文字明確地解釋了監督學習的定義: 監督學習的例子:垃圾郵件的分類,這個在上面已經講解過;
(2)Unsupervised Learning(非監督學習):給定一組數據,這些數據從外表上來看沒有什么差別,都落在了坐標軸上,我們的目標是從中找出結構,并將其分組,如下圖,是聚類的例子,每個數據都是以原點的形式出現的,但是我們能夠很清晰地將這些點分成兩組(group into):
非監督學習的例子:
以上介紹了機器學習的常見分類(監督學習和非監督學習),并詳細介紹了定義及應用;
剛才我們說到監督學習分為: (1)分類; (2)回歸; 這兩者有什么區別呢? 區別在于分類的output為離散的,而回歸的output為連續的,這樣講可能比較抽象,比如上面的例子就是回歸,因為output為price,雖然看起來price是離散的,但是他的值是可以無限制的,因此是連續的,而下圖為分類的例子,因為output=惡性or良性,可能的取值就兩個值,因此為回歸;
? 以上說明了分類和回歸的區別;
? 練習題
? 1.你現在在證券所上班,對于某個特定的股票A,希望根據以往的價格走勢,來推算出明天的價格是多少,這算是分類問題還是回歸問題? 答:屬于回歸問題,因為股票的價格是連續的,因此是回歸問題;
2.我們給出4個問題:
以上就是對機器學習的兩個定義; 機器學習在生活中也處處可見,比如: (1)在gmail中,提供了一個“垃圾郵件”選項,可以通過機器學習辨別郵件是否為垃圾郵件,此處利用了分類算法; 如果我們根據Tom Mitchell的定義,則: T:classify email as spam or not spam. E:watching you label emails as spam or not spam. P:The number of emails correctly classified as spam or not spam. (2)ebay利用學習型算法判斷某個信用卡是否被盜; (3)“深藍”下棋勝過國際象棋大師,是因為“深藍”已經通過機器學習的方法學習了下棋的技術;
以上這些例子就是機器學習的常見案例; 機器學習的常見算法分為: (1)Supervised Learning(監督學習):下面的圖片就是典型的監督學習的例子,監督學習分為Classifying和Regression,兩者的區別后面解釋,下圖的文字明確地解釋了監督學習的定義: 監督學習的例子:垃圾郵件的分類,這個在上面已經講解過;
(2)Unsupervised Learning(非監督學習):給定一組數據,這些數據從外表上來看沒有什么差別,都落在了坐標軸上,我們的目標是從中找出結構,并將其分組,如下圖,是聚類的例子,每個數據都是以原點的形式出現的,但是我們能夠很清晰地將這些點分成兩組(group into):
非監督學習的例子:
- google News中,會將一些新聞進行聚類(分組),即每個大類的新聞下面都會有多個URL,這些URL雖然來自不同的網站,但是都是這一類新聞,比如:
- Market segmentation:將客戶分組為幾組,對每組客戶進行不同的銷售手段,如下圖:
- 兩個人在話筒前面同時說話,錄音后發現這兩個人的聲音會混雜在一起,但是如果通過非監督學習,則可以將這兩個人的聲音分離開來;
以上介紹了機器學習的常見分類(監督學習和非監督學習),并詳細介紹了定義及應用;
剛才我們說到監督學習分為: (1)分類; (2)回歸; 這兩者有什么區別呢? 區別在于分類的output為離散的,而回歸的output為連續的,這樣講可能比較抽象,比如上面的例子就是回歸,因為output為price,雖然看起來price是離散的,但是他的值是可以無限制的,因此是連續的,而下圖為分類的例子,因為output=惡性or良性,可能的取值就兩個值,因此為回歸;
? 以上說明了分類和回歸的區別;
? 練習題
? 1.你現在在證券所上班,對于某個特定的股票A,希望根據以往的價格走勢,來推算出明天的價格是多少,這算是分類問題還是回歸問題? 答:屬于回歸問題,因為股票的價格是連續的,因此是回歸問題;
2.我們給出4個問題:
- 我們已經知道了這一堆是垃圾郵件,想要將這些垃圾郵件繼續分子類;
- 給定一個數據集,全是心臟病的病人,我們需要將他們分成不同的簇,對每個簇用不同的治療方法;
- 兩個足球隊要比賽,根據以往的數據,預測哪個隊會贏;
- 根據一個人的DNA,預測10年后得糖尿病的幾率;
總結
以上是生活随笔為你收集整理的机器学习入门:机器学习概论的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 指令集及流水线基本概念
- 下一篇: 机器学习入门书单