分类模型的评估方法-F分数(F-Score)
前面介紹了機器學習中分類模型的精確率(Precision)和召回率(Recall)評估指標。對于Precision和Recall,雖然從計算公式來看,并沒有什么必然的相關性關系,但是,在大規模數據集合中,這2個指標往往是相互制約的。理想情況下做到兩個指標都高當然最好,但一般情況下,Precision高,Recall就低,Recall高,Precision就低。所以在實際中常常需要根據具體情況做出取舍,例如一般的搜索情況,在保證召回率的條件下,盡量提升精確率。而像癌癥檢測、地震檢測、金融欺詐等,則在保證精確率的條件下,盡量提升召回率。
所以,很多時候我們需要綜合權衡這2個指標,這就引出了一個新的指標F-score。這是綜合考慮Precision和Recall的調和值。
當β=1時,稱為F1-score,這時,精確率和召回率都很重要,權重相同。當有些情況下,我們認為精確率更重要些,那就調整β的值小于1,如果我們認為召回率更重要些,那就調整β的值大于1。
舉個例子:癌癥檢查數據樣本有10000個,其中10個數據祥本是有癌癥,其它是無癌癥。假設分類模型在無癌癥數據9990中預測正確了9980個,在10個癌癥數據中預測正確了9個,此時真陽=9,真陰=9980,假陽=10,假陰=1。
那么:
Accuracy = (9+9980) /10000=99.89%
Precision=9/19+10)= 47.36%
F1-score=2×(47.36% × 90%)/(1×47.36%+90%)=62.07%
F2-score=5× (47.36% × 90%)/(4×47.36%+90%)=76. 27%
總結
以上是生活随笔為你收集整理的分类模型的评估方法-F分数(F-Score)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 分类模型的评估方法-召回率(Recall
- 下一篇: 统计学---掌握数据的整体状态