r roc函数_一棵树专栏 | ROC分析时一定要告诉R分析谁
用到的軟件是:R語言
用到的R包是:pROC和ROCit1. 安裝R包
install.packages('pROC')
install.packages('ROCit')
score1=c(0.830410619,0.455829518,0.058478492,0.729325234,0.831480755,0.134660431,0.695320049,0.662420877,0.528904992,0.371757106,0.87803265,0.705919705,0.740182936,0.060545256,0.891066853,0.568020037,0.379067286)
score2=c(0.376703255,0.694968207,0.066650344,0.261298118,0.079832816,0.005758134,0.433320986,0.211177625,0.68847034,0.085216767,0.452439458,0.054711128,0.719909102,0.653851262,0.500626397,0.380789783,0.430002115)
class=c(1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0)
pROC::roc(predictor?=?score1,response?=?class)##?Setting?levels:?control?=?0,?case?=?1##?Setting?direction:?controls?####?Call:##?roc.default(response?=?class,?predictor?=?score1)####?Data:?score1?in?10?controls?(class?0)?##?Area?under?the?curve:?0.4714
使用ROCit包ROCit::rocit(score?=?score1,class?=?class)$AUC##?[1]?0.4714286
兩個(gè)包的AUC結(jié)果一致,都是0.4714。這種做法也是我們常規(guī)的做法。4. 不一致的ROC分析結(jié)果奇怪的事情馬上就要發(fā)生了!現(xiàn)在,我們?cè)賹?duì)score2和class做ROC分析,看一下他們的AUC。使用pROC包
pROC::roc(predictor?=?score2,response?=?class)##?Setting?levels:?control?=?0,?case?=?1##?Setting?direction:?controls?>?cases####?Call:##?roc.default(response?=?class,?predictor?=?score2)####?Data:?score2?in?10?controls?(class?0)?>?7?cases?(class?1).##?Area?under?the?curve:?0.6857
使用ROCit包ROCit::rocit(score?=?score2,class?=?class)$AUC##?[1]?0.3142857
這個(gè)時(shí)候pROC包計(jì)算的AUC是0.6857,而ROCit包計(jì)算的結(jié)果是0.3142,兩個(gè)差別很大啊。這是咋回事?相同的命令,換個(gè)數(shù)據(jù)結(jié)果就不一樣了?5. 為什么2個(gè)包的結(jié)果會(huì)矛盾我們?cè)倩仡^看,使用pROC包分析score1和class時(shí),有這樣一段提示##?Setting?direction:?controls?
同樣使用pROC包分析score2和class時(shí),也有這樣一段提示
##?Setting?direction:?controls?>?cases
同樣的class,兩次計(jì)算的方向竟然不同,第一次是controls < cases,而第二次是controls > cases,這個(gè)是什么意思呢?controls < cases:表示controls組的中位數(shù)小于cases組的中位數(shù),pROC包對(duì)cases組進(jìn)行ROC分析,計(jì)算cases組的AUC。controls > cases:表示controls組的中位數(shù)大于cases組的中位數(shù),pROC包對(duì)controls組進(jìn)行ROC分析,計(jì)算controls組的AUC。
我們先來看一下score1在class兩組的中位數(shù)。
c(controls=median(score1[class==0]),
?cases=median(score1[class==1]))##??controls?????cases##?0.6152205?0.6953200
再來看一下score2在class兩組的中位數(shù)。
c(controls=median(score2[class==0]),
?cases=median(score2[class==1]))##??controls?????cases##?0.4412208?0.2612981
很多時(shí)候,我們進(jìn)行ROC分析時(shí),默認(rèn)都是去計(jì)算class=1那組,也就是陽性組的AUC,而class=0,被我們默認(rèn)當(dāng)成了陰性組,也就是參考組。在ROCit包中就是這樣的,但是在大名鼎鼎的pROC包中,ROC分析的依據(jù)卻是中位數(shù)的大小。這一點(diǎn)千萬要注意。
如果你用pROC包做ROC分析,那么接下來的AUC和cutoff value都是要注意的,如果你不事先設(shè)置參考,得到的結(jié)果可能就搞不清楚是陰性組的AUC還是陽性組的AUC,僅僅是中位數(shù)高的那組的AUC,而你默認(rèn)都是當(dāng)成陽性組的AUC。千萬要注意這一點(diǎn)!7. 告訴R去ROC誰在pROC::roc()函數(shù)中,有2個(gè)參數(shù)是需要我們?cè)O(shè)置的levels和direction,levels表示結(jié)局變量中的數(shù)值水平,direction的值是大于號(hào)>或小于號(hào)
現(xiàn)在我們給levels賦值0和1,direction賦值小于號(hào)
pROC::roc(predictor?=?score2,response?=?class,
?????????levels?=?c(0,1),
?????????direction=')####?Call:##?roc.default(response?=?class,?predictor?=?score2,?levels?=?c(0,?????1),?direction?=?"####?Data:?score2?in?10?controls?(class?0)?##?Area?under?the?curve:?0.3143
這個(gè)時(shí)候得到結(jié)果0.314,和ROCit包的結(jié)果一致了。
在ROCit::rocit()函數(shù)中,我們通過給negref參數(shù)賦值0,設(shè)置ROC分析的陰性參考。
ROCit::rocit(score?=?score2,class?=?class,1
????????????negref?=?0)$AUC##?[1]?0.3142857
ROC分析函數(shù),不提供設(shè)置參考的參數(shù),可以考慮丟棄了!快,關(guān)注這個(gè)公眾號(hào),一起漲姿勢(shì)~
總結(jié)
以上是生活随笔為你收集整理的r roc函数_一棵树专栏 | ROC分析时一定要告诉R分析谁的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: idea本地跑如何看gc日志_牛逼了!用
- 下一篇: egg风格 什么意思_小小的“egg”,