1.什么是机器学习
機器學(xué)習(xí)是一幫計算機科學(xué)家想讓計算機像人一樣思考,所研發(fā)出來的計算機理論。
在計算機科學(xué)家眼里看來,人和計算機其實并沒有差別。同樣都是一大批互相連接的 信息傳遞和存儲元素所組成的系統(tǒng)。所以有了這樣的想法,加上那批科學(xué)家得天獨厚的數(shù)學(xué)功底,機器學(xué)習(xí)的前身也有孕育而生了,機器學(xué)習(xí)的萌芽誕生于19世紀60年代。20年前逐漸興起,它是一門跨學(xué)科的交融。這里面包含了概率論,統(tǒng)計學(xué)等等學(xué)科。
隨著計算機硬件的提升,計算機運算速度的不斷提高,它真正開始進入到我們的日常生活當中,而在不久的將來,我相信它也會成為我們生活中必不可少的組成元素。
我們說一說日常生活中的機器學(xué)習(xí)的應(yīng)用
第一個提到的,最具代表性的公司 應(yīng)該就是GOOGLE,它所開發(fā)的google now,google photos都是基于機器學(xué)習(xí)的產(chǎn)物。與此同時,各種各樣的企業(yè)都開始嘗試把自己的產(chǎn)品往機器學(xué)習(xí)上靠攏。比如金融公司的匯率預(yù)測,股票漲跌,房地產(chǎn)公司的房價預(yù)測等等。
機器學(xué)習(xí)不僅僅只有一種方法。實現(xiàn)它的方法多種多樣,這里所說的方法,在程序語言中,我們叫做算法。目前所有機器學(xué)習(xí)的算法大概可以被分為4到5類。
如果在學(xué)習(xí)過程中,我們不斷的向計算機提供數(shù)據(jù)和這些數(shù)據(jù)所對應(yīng)的值。比如給計算機看貓和狗的圖片,并告訴計算機哪個是貓,哪個是狗,這種學(xué)習(xí)的方式就叫做“監(jiān)督學(xué)習(xí)(supervised learning)”
大家所熟知的神經(jīng)網(wǎng)絡(luò)同樣是一種監(jiān)督學(xué)習(xí)的方式。
但如果同樣在這種學(xué)習(xí)過程中,我只給計算機提供貓和狗的圖片,但并不告訴計算機哪些是貓哪些是狗,而是讓計算機自己去判斷和分類,讓計算機自己總結(jié)出兩種圖片之間的不同之處,這就是一種“非監(jiān)督學(xué)習(xí)(unsupervised learning)”。在這一種學(xué)習(xí)過程中,我們可以不用提供數(shù)據(jù)所對應(yīng)的標簽信息,計算機通過觀察各種數(shù)據(jù)之間的特性,會發(fā)現(xiàn)這些特性背后的規(guī)律。這些規(guī)律也就是非監(jiān)督方法所學(xué)到的東西。
還有一種方法綜合了監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)的特征,這種叫做“半監(jiān)督學(xué)習(xí)(semi-supervised learning)”
它主要考慮如何利用少量有標簽的樣本和大量沒有標簽的樣本進行訓(xùn)練和分類。
在規(guī)劃機器人的行為準則方面,一種機器學(xué)習(xí)方法叫做“強化學(xué)習(xí)(reinforcement learning)”,也就是把計算機丟到一個對于它完全陌生的環(huán)境或者讓它完成一項從未接觸過的任務(wù),它自己會嘗試各種手段,最后讓自己成功的適應(yīng)這一陌生的環(huán)境。或者學(xué)會完成這件任務(wù)的方法途徑。
還有一種和強化學(xué)習(xí)類似的學(xué)習(xí)方法,叫做遺傳算法(Geneticalgorithm),這一種是模擬我們熟知的進化理論,淘汰弱者,適者生存。通過這樣的淘汰機制去選擇最優(yōu)的設(shè)計或模型。
總結(jié)
有數(shù)據(jù)和標簽的 監(jiān)督學(xué)習(xí)
只有數(shù)據(jù)沒有標簽的 非監(jiān)督學(xué)習(xí)
結(jié)合了監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)的半監(jiān)督學(xué)習(xí)
從經(jīng)驗中總結(jié)提升的強化學(xué)習(xí)
最后是和強化學(xué)習(xí)類似的,有著適者生存 不適者淘汰準則的遺傳算法。
總結(jié)
- 上一篇: 117. Populating Next
- 下一篇: linux 下进程和线程指定CPU运行