机器学习-Random Forest算法简介
生活随笔
收集整理的這篇文章主要介紹了
机器学习-Random Forest算法简介
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
Random Forest是加州大學伯克利分校的Breiman Leo和Adele Cutler于2001年發表的論文中提到的新的機器學習算法,可以用來做分類,聚類,回歸,和生存分析,這里只簡單介紹該算法在分類上的應用。
Random Forest(隨機森林)算法是通過訓練多個決策樹,生成模型,然后綜合利用多個決策樹進行分類。
隨機森林算法只需要兩個參數:構建的決策樹的個數t,在決策樹的每個節點進行分裂時需要考慮的輸入特征的個數m。
1. 單棵決策樹的構建:
(1)令N為訓練樣例的個數,則單棵決策樹的輸入樣例的個數為N個從訓練集中有放回的隨機抽取N個訓練樣例。
(2)令訓練樣例的輸入特征的個數為M,切m遠遠小于M,則我們在每顆決策樹的每個節點上進行分裂時,從M個輸入特征里隨機選擇m個輸入特征,然后從這m個輸入特征里選擇一個最好的進行分裂。m在構建決策樹的過程中不會改變。
(3)每棵樹都一直這樣分裂下去,直到該節點的所有訓練樣例都屬于同一類。不需要剪枝。
總結
以上是生活随笔為你收集整理的机器学习-Random Forest算法简介的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 机器学习中的数学(4)-线性判别分析(L
- 下一篇: ubuntu系统安装过程中出现 unab