分类模型的评估方法-召回率(Recall)
前2篇文章,介紹了正確率(Accuracy)和精確率(Precision)的評估方法。其中指出了正確率(Accuracy)雖然簡單直觀,但在很多時候并不是一個真正正確的評估指標。
那么精確率(Precision)可能會有什么問題呢?我們還是看看它的計算公式:
如果“假陽=0”,那么精確率就是100%,這很好,但有什么問題呢?
舉個例子:癌癥檢查數據樣本有10000個,其中10個數據樣本是有癌癥,其它是無癌癥。分類模型在無癌癥數據中全都預測正確,在10個癌癥數據中預測正確了1個,此時真陽=1,真陰=9990,假陽=0,假陰=9。根據精確率的計算公式:
顯然,這是不合理的。
因為”精確率“并沒有考慮到”假陰“的問題,即它只關心查出來的”癌癥”有多少是”真癌癥”,至于是癌癥但沒査出來的,認為不是“癌癥的”即”假陰“它管不著。但是,我們癌癥檢查的時候,有癌癥卻查出來”不是癌癥“,這是非常要命的。
所以考慮這種情況,那么就需要用到召回率(Recall),其計算公式為:
上面癌癥例子中,召回率的值為:
Recall=11+9=10%Recall=11+9=10%
即從召回率數值看,這個分類模型是不好的。
還是上面的例子:假設分類模型在無癌癥數據9990中預測正確了9980個,在10個癌癥數據中預測正確了10個。此時真陽=10,真陰=9980,假陽=10,假陰=0。則其精確度為10/(10+10)=50%,而召回率為10/(10+0)=100%。即精確度雖然不高,謊報了幾個癌癥,但是所有的真癌癥都沒有錯過,這是非常重要的。
所以,各種分類評估指標各有優缺點,我們具體采用什么指標來評估分類模型,關鍵還是看我們的具體應用。如果是地震、癌癥、欺詐交易等,我們寧愿有誤報,但不能錯過一個,這時就主要看召回率。如果是文檔搜索,我們并不關心搜的全不全,搜出來的都是我們想要的信息就夠了,那么就主要看精確率。
召回率(Recall)還有一個名稱,叫查全率。但是注意,查全率這個名稱主要用在信息檢索領域.例如一個論文數據庫,搜索”加器學習”相關論文,總共有100萬篇論文,其中與機器學習相關的論文有2萬篇,搜出來的文檔數量為1萬篇,其中真正與”機器學習”相關的文檔數量為9000篇,那么查全率就是9000/(9000+(20000-9000))=45%
總結
以上是生活随笔為你收集整理的分类模型的评估方法-召回率(Recall)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 分类模型的评估方法-精确率(Precis
- 下一篇: 分类模型的评估方法-F分数(F-Scor