ks 曲线_关于模型检验的ROC值和KS值的异同_ROC曲线和KS值
關(guān)于模型檢驗的ROC值和KS值的異同_ROC曲線和KS值
按我的理解,ROC曲線是累計壞占比曲線(圖中藍(lán)色曲線)下面的面積(>0.5),KS值是累計壞占比曲線-累計好占比曲線差值(圖中紅色曲線)的最大值。實際上他們都是一樣的?
不知道我的理解是否有誤?謝謝!
精彩解答:
ROC(Receiver Operating Characteristic Curve):接受者操作特征曲線。
ROC曲線及AUC系數(shù)主要用來檢驗?zāi)P蛯蛻暨M行正確排序的能力。ROC曲線描述了在一定累計好客戶比例下的累計壞客戶的比例,模型的分別能力越強,ROC曲線越往左上角靠近。AUC系數(shù)表示ROC曲線下方的面積。AUC系數(shù)越高,模型的風(fēng)險區(qū)分能力越強。
KS(Kolmogorov-Smirnov)檢驗:K-S檢驗主要是驗證模型對違約對象的區(qū)分能力,通常是在模型預(yù)測全體樣本的信用評分后,將全體樣本按違約與非違約分為兩部分,然后用KS統(tǒng)計量來檢驗這兩組樣本信用評分的分布是否有顯著差異。
其他解答:
ROC值一般在0.5-1.0之間。值越大表示模型判斷準(zhǔn)確性越高,即越接近1越好。ROC=0.5表示模型的預(yù)測能力與隨機結(jié)果沒有差別。
KS值表示了模型將+和-區(qū)分開來的能力。值越大,模型的預(yù)測準(zhǔn)確性越好。一般,KS>0.2即可認(rèn)為模型有比較好的預(yù)測準(zhǔn)確性。
解答:要弄明白ks值和auc值的關(guān)系首先要弄懂roc曲線和ks曲線是怎么畫出來的。其實從某個角度上來講ROC曲線和KS曲線是一回事,只是橫縱坐標(biāo)的取法不同而已。拿邏輯回歸舉例,模型訓(xùn)練完成之后每個樣本都會得到一個類概率值(注意是類似的類),把樣本按這個類概率值排序后分成10等份,每一份單獨計算它的真正率和假正率,然后計算累計概率值,用真正率和假正率的累計做為坐標(biāo)畫出來的就是ROC曲線,用10等分做為橫坐標(biāo),用真正率和假正率的累計值分別做為縱坐標(biāo)就得到兩個曲線,這就是KS曲線。AUC值就是ROC曲線下放的面積值,而ks值就是ks曲線中兩條曲線之間的最大間隔距離。由于ks值能找出模型中差異最大的一個分段,因此適合用于cut_off,像評分卡這種就很適合用ks值來評估。但是ks值只能反映出哪個分段是區(qū)分最大的,而不能總體反映出所有分段的效果,因果AUC值更能勝任。數(shù)據(jù)分析培訓(xùn)
完 謝謝觀看
總結(jié)
以上是生活随笔為你收集整理的ks 曲线_关于模型检验的ROC值和KS值的异同_ROC曲线和KS值的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Hadoop经典书籍资料收藏(35本)转
- 下一篇: 浅谈防火墙审计