机器学习之邹博笔记1
1、機器學習分為兩部分:建模和預測
建模:根據已有數據(文本,圖像,聲音等)并可能有標記值,提取出數據中的特征向量,使用某一個機器學習算法(最小二乘法),對模型進行訓練得出模型。
預測:現有新數據(文本,圖像,聲音等)并可能有標記值,提取出數據中的特征向量,根據模型對新的數據進行預測。
2、整體看機器學習就是模仿人識別事物的過程即:學習、提取特征、識別、分類
由于機器不能跟人類思維一樣根據事物特征自然而然的選擇分類方法,所以機器學習方法的選擇依然還需要人工選擇。目前,機器學習的方法主要有三種:監督學習、半監督學習和無監督學習。監督學習是利用一組已知類別的樣本調整分類器的參數,使其達到所要求性能的過程。白話一點,就是根據已知的,推斷未知的。代表方法有:Nave Bayes、SVM、決策樹、KNN、神經網絡以及Logistic分析等;半監督方法主要考慮如何利用少量的標注樣本和大量的未標注樣本進行訓練和分類的問題,也就是根據少量已知的和大量未知的內容進行分類。代表方法有:最大期望、生成模型和圖算法等。無監督學習是利用一組已知類別的樣本調整分類器的參數,使其達到所要求性能的過程。也就是及其自個兒學。代表方法有:Apriori、FP樹、K-means以及目前比較火的Deep Learning。從這三方面看,無監督學習是最智能的,有能實現機器主動意識的潛質,但發展還比較緩慢;監督學習是不太靠譜的,從已知的推斷未知的,就必須要把事物所有可能性全都學到,這在現實中是不可能的,人也做不到;半監督學習是“沒辦法中的辦法”,既然無監督學習很難,監督學習不靠譜,就取個折中,各取所長。目前的發展是,監督學習技術已然成熟,無監督學習還在起步,所以對監督學習方法進行修改實現半監督學習是目前的主流。但這些方法基本只能提取信息,還不能進行有效的預測。來源:https://www.cnblogs.com/xpNLP/p/4678636.html
3、鄒博將機器學習流程比作西紅柿炒蛋
4、清晰地理解各個算法原理、優缺點
針對新的數據新的問題,知道使用什么算法。
參考https://blog.csdn.net/u013369277/article/details/51645672
總結
以上是生活随笔為你收集整理的机器学习之邹博笔记1的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: vuex的个人理解
- 下一篇: matlab常用函数——矩阵函数