【机器学习】机器学习概述
簡單的一句話:讓機器從數據中學習,進而得到一個更加符合現實規律的模型,通過對模型的使用使得機器比以往表現的更好,這就是機器學習。
機器學習是實現人工智能的一種途徑,它和數據挖掘有一定的相似性,也是一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、計算復雜性理論等多門學科。
對比于數據挖掘從大數據之間找相互特性而言,機器學習更加注重算法的設計,讓計算機能夠白動地從數據中“學習”規律,并利用規律對未知數據進行預測。因為學習算法涉及了大量的統計學理論,與統計推斷聯系尤為緊密,所以也被稱為統計學習方法。
機器學習可以分為以下五個大類:
(1)監督學習:從給定的訓練數據集中學習出-一個函數,當新的數據到來時,可以根據這個函數預測結果。監督學習的訓練集要求是輸人和輸出,也可以說是特征和目標。訓練集中的目標是由人標注的。常見的監督學習算法包括回歸與分類。
(2)無監督學習:無監督學習與監督學習相比,訓練集沒有人為標注的結果。常見的無監督學習算法有聚類等。
(3)半監督學習:這是一”種介于監督學習與無監督學習之間的方法。
(4)遷移學習:將已經訓練好的模型參數遷移到新的模型來幫助新模型訓練數據集。
(5)增強學習:通過觀察周圍環境來學習。每個動作都會對環境有所影響,學習對象根據觀察到的周圍環境的反饋來做出判斷。
傳統的機器學習算法有以下幾種:
線性回歸模型、logistic回歸模型、k-臨近算法、決策樹、隨機森林、支持向量機、人工神經網絡、EM算法、概率圖模型等。
一句話說明機器學習(MachineLearning)
簡單的一句話:讓機器從數據中學習,進而得到一個更加符合現實規律的模型,通過對模型的使用使得機器比以往表現的更好,這就是機器學習。
詳解
數據:從現實生活抽象出來的一些事物或者規律的特征進行數字化得到。
學習:在數據的基礎上讓機器重復執行一套特定的步驟(學習算法)進行事物特征的萃取,得到一個更加逼近于現實的描述(這個描述是一個模型它的本身可能就是一個函數)。我們把大概能夠描述現實的這個函數稱作我們學到的模型。
Machine -> ML -> better
更好:我們通過對模型的使用就能更好的解釋世界,解決與模型相關的問題。
總結
以上是生活随笔為你收集整理的【机器学习】机器学习概述的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【机器学习】特征降维-特征选择
- 下一篇: 【机器学习】特征提取