分计算iv值_筛选变量的指标—IV值
生活随笔
收集整理的這篇文章主要介紹了
分计算iv值_筛选变量的指标—IV值
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
這一期咱們聊聊篩選變量的指標——IV值。
計算公式如下:
看公式有沒有很熟悉,大家沒有看錯,其中一部分就是WOE的計算公式。區(qū)別就在于WOE是對一個變量的每個分組的計算,IV值是對一個變量的統(tǒng)計指標。
如上圖所示,當前使用率的IV值為1.415。
IV值的作用就是衡量一個變量整體的預測能力,好處在于每個變量的IV值是可比的。所謂的IV值(informationvalue),指的是一個變量對于判定客戶屬于y1還是y0的信息貢獻,貢獻越大,IV值越大。
然而,我們僅從公式就可以看出,對于同一個變量來說,分組分的越多,它的IV值自然越大。但是分組過多會產(chǎn)生另外一個問題,每個分組的數(shù)據(jù)量會變少,導致每個分組不穩(wěn)定。所以我們在進行變量分箱時不能只考慮提高變量的IV,也要兼顧穩(wěn)定性與業(yè)務意義。
在進行變量初篩的時候,可以直接將IV值小于0.02的變量剔除,不參與后面的算法擬合過程。這些變量即使進入變量擬合庫,對判定客戶的貢獻也基本上等于沒有。
好了,這期就先聊到這里,下期再見!
總結
以上是生活随笔為你收集整理的分计算iv值_筛选变量的指标—IV值的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 表格长度_知道你的成绩单是怎么打印的吗?
- 下一篇: SpaceX星链第16批发射升空 总