随机森林的特征重要性原理
生活随笔
收集整理的這篇文章主要介紹了
随机森林的特征重要性原理
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
1、隨機森林得到的feature importance的原理?
答:
在隨機森林中某個特征X的重要性的計算方法如下:
1:對于隨機森林中的每一顆決策樹,使用相應的OOB(袋外數據)數據來計算它的袋外數據誤差,記為errOOB1.
2:? 隨機地對袋外數據OOB所有樣本的特征X加入噪聲干擾(就可以隨機的改變樣本在特征X處的值),再次計算它的袋外數據誤差,記為errOOB2.
3:假設隨機森林中有Ntree棵樹,那么對于特征X的重要性=∑(errOOB2-errOOB1)/Ntree,之所以可以用這個表達式來作為相應特征的重要性的度量值是因為:若給某個特征隨機加入噪聲之后,袋外的準確率大幅度降低,則說明這個特征對于樣本的分類結果影響很大,也就是說它的重要程度比較高。
參考于:http://www.cnblogs.com/justcxtoworld/p/3447231.html#3975497
總結
以上是生活随笔為你收集整理的随机森林的特征重要性原理的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 一个好用的在线画图工具 - 图表秀
- 下一篇: 随机森林重要性排序-R