随机森林_R代码及用法
生活随笔
收集整理的這篇文章主要介紹了
随机森林_R代码及用法
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
隨機森林(Random Forests)簡介
Nilsson在1965年提出:由多位專家組合而成,按一些特定的方式(如投票法,權重法)整合各位專家的意見進行決策,其得到的結果會比只有單個專家的效果更好。由于每位專家的擅長之處不同,因此通過組合的機制可以讓專家之間彼此互補,得到更好的結果。
隨機森林(Random Forests)屬于套袋法的一種,是基于決策樹所建立的,結合多個決策樹的預測結果,而每棵樹都是根據隨機森林的隨機向量的值所建立的。
隨機森林在影響因素探討上,現有研究表明,隨機森林不需要估計一般回歸分析面臨的多元共線性的問題,不需要做變量選擇,便于計算變量的非線性作用,而且可以評估自變量的重要性。
張雷, 王琳琳, 張旭東, 等. 隨機森林算法基本思想及其在生態學中的應用: 以云南松分布模擬為例. 生態學報, 2014, 34(3): 650-659.
隨機森林的估計過程
1)指定m值,即隨機產生m個變量用于節點上的二叉樹,二叉樹變量的選擇仍然滿足節點不純度最小原則;
2)應用Bootstrap自助法在原數據集中有放回地隨機抽取k個樣本集,組成k棵決策樹,而對于未被抽取的樣本用于單棵決策樹的預測;
3)根據k個決策樹組成的隨機森林對待分類樣本進行分類或預測,分類的原則是投票法,預測的原則是簡單平均。
隨機森林的兩個重要參數:
1.樹節點預選的變量個數:單棵決策樹決策樹的情況。<
總結
以上是生活随笔為你收集整理的随机森林_R代码及用法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 害!天天在公司写业务代码,面几家挂几家,
- 下一篇: 考粒子静态能源公式、太阳系天体运动原理.