机器学习性能度量 Equal Error Rate (EER)
機器學習性能度量Equal Error Rate (EER)
一、總結
一句話總結:
A、EER(the Equal Error Rate)是(一個分類器的)ROC曲線(接受者操作特性曲線)中錯分正負樣本概率相等的點(所對應的錯分概率值)。
B、這個點就是ROC曲線與ROC空間中對角線([0,1]-[1,0]連線)的交點
二、[ZZ] Equal Error Rate (EER)
轉自或參考:[ZZ] Equal Error Rate (EER)
http://www.cnblogs.com/cdeng/p/3471527.html">ROC曲線
1.混淆矩陣(confusion matrix)
針對預測值和真實值之間的關系,我們可以將樣本分為四個部分,分別是:
真正例(True Positive,TP):預測值和真實值都為1
假正例(False Positive,FP):預測值為1,真實值為0
真負例(True Negative,TN):預測值與真實值都為0
假負例(False Negative,FN):預測值為0,真實值為1
我們將這四種值用矩陣表示(圖片引自《machine learning:A Probabilistic Perspective》):
上面的矩陣就是混淆矩陣。
2.ROC曲線
通過混淆矩陣,我們可以得到真正例率(True Positive Rate , TPR):
我們還可以得到假正例率(False Positive Rate , FPR):
可以看到,TPR也就是我們所說的召回率,那么只要給定一個決策邊界閾值,我們可以得到一個對應的TPR和FPR值,然而,我們不從這個思路來簡單的得到TPR和FPR,而是反過來得到對應的,我們檢測大量的閾值,從而可以得到一個TPR-FPR的相關圖,如下圖所示(圖片引自《machine learning:A Probabilistic Perspective》):
圖中的紅色曲線和藍色曲線分別表示了兩個不同的分類器的TPR-FPR曲線,曲線上的任意一點都對應了一個值。該曲線就是ROC曲線(receiver operating characteristic curve)。該曲線具有以下特征:
一定經過(0,0)點,此時,沒有預測為P的值,TP和FP都為0
一定經過(1,1)點,此時,全都預測為P
最完美的分類器(完全區分正負樣例):(0,1)點,即沒有FP,全是TP
曲線越是“凸”向左上角,說明分類器效果越好
隨機預測會得到(0,0)和(1,1)的直線上的一個點
曲線上離(0,1)越近的點分類效果越好,對應著越合理的
從圖中可以看出,紅色曲線所代表的分類器效果好于藍色曲線所表示的分類器。
3.利用ROC的其他評估標準
AUC(area under thecurve),也就是ROC曲線的下夾面積,越大說明分類器越好,最大值是1,圖中的藍色條紋區域面積就是藍色曲線對應的 AUC
EER(equal error rate),也就是FPR=FNR的值,由于FNR=1-TPR,可以畫一條從(0,1)到(1,0)的直線,找到交點,圖中的A、B兩點。
在一個matlab論壇里找到了正解:
“the Equal Error Rate (EER) is the point on the ROC curve that corresponds to have an equal probability of miss-classifying a positive or negative sample. This point is obtained by intersecting the ROC curve with a diagonal of the unit square. ”
翻譯過來就是:EER是(一個分類器的)ROC曲線(接受者操作特性曲線)中錯分正負樣本概率相等的點(所對應的錯分概率值)。這個點就是ROC曲線與ROC空間中對角線([0,1]-[1,0]連線)的交點(如下圖所示)。
所以下圖表示的分類器的EER應該是藍色虛線和紅色ROC曲線的交點對應的橫坐標值,在0.17左右。
(關于什么是ROC曲線,請大家點鏈接看維基百科吧。)
http://blog.csdn.net/lcmssd/article/details/30803517
ERR 是 Bayesian決策中最佳閾值對應的錯誤率,此時False acceptance 和 False rejection是相等的,
ERR可以用來衡量算法的錯誤率,ERR越小表示算法錯誤率越低
http://www.webopedia.com/TERM/E/equal_error_rate.html
Abbreviated asEER. A biometric security system predetermines the threshold values for itsfalse acceptance rateand itsfalse rejection rate, and when the rates are equal, the common value is referred to as theequal error rate. The value indicates that the proportion of false acceptances is equal to the proportion of false rejections. The lower the equal error rate value, the higher the accuracy of the biometric system.
參考:
1.《machine learning:A Probabilistic Perspective》
2.wiki
我的旨在學過的東西不再忘記(主要使用艾賓浩斯遺忘曲線算法及其它智能學習復習算法)的偏公益性質的完全免費的編程視頻學習網站:
fanrenyi.com;有各種前端、后端、算法、大數據、人工智能等課程。
版權申明:歡迎轉載,但請注明出處
一些博文中有一些參考內容因時間久遠找不到來源了沒有注明,如果侵權請聯系我刪除。
博主25歲,前端后端算法大數據人工智能都有興趣。
大家有啥都可以加博主聯系方式(qq404006308,微信fan404006308)互相交流。工作、生活、心境,可以互相啟迪。
聊技術,交朋友,修心境,qq404006308,微信fan404006308
26歲,真心找女朋友,非誠勿擾,微信fan404006308,qq404006308
人工智能群:939687837
作者相關推薦
#fry_added_part .inspiration_content{
//max-height: 120px;
overflow: auto;
margin: 20px 0;
}
#fry_added_part .fry_inspiration .simple a{
margin-right: 25px;
}
感悟總結
其它重要感悟總結
感悟總結200813
最近心境200830
最近心境201019
201218-210205
總結
以上是生活随笔為你收集整理的机器学习性能度量 Equal Error Rate (EER)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 通过ABAP代码判断当前系统类型,BYD
- 下一篇: SqlServer ------ 求时间