行人重识别初学习
行人重識別(Person Re-identification)又被稱為行人再識別,如今被視為圖像檢索的一類關(guān)鍵子問題。它是利用計算機視覺算法對跨設(shè)備的行人圖像或視頻進行匹配,即給定一個查詢圖像,在不同監(jiān)控設(shè)備的圖像庫檢索出同一個行人,如圖1.1所示。由于對智能安防、視頻監(jiān)控等方面有巨大的應(yīng)用前景,行人重識別已經(jīng)成為計算機視覺領(lǐng)域的研究焦點。
行人重識別系統(tǒng)分為
特征提取:能夠?qū)W習(xí)并辨認不同攝像頭下行人的變化特征
度量學(xué)習(xí):將學(xué)習(xí)到的特征映射到新的空間使得想同的人更近,不同的人更遠
圖像檢索:根據(jù)圖片之間的距離進行排序,返回檢索結(jié)果
行人重識別數(shù)據(jù)集
- CUHK03
- Market1501
- DukeMTMC-reID
- MSMT17?
數(shù)據(jù)集分為訓(xùn)練集,驗證集也叫測試集,Query,GALLery
Query 測試需要一堆probe ,probe 可以理解為需要確定的目標人物,待檢索行人圖片
Gallery? 就是所有待檢索的總和,待檢索的倉庫,比如視頻中所有的人的照片 ,?一堆圖像庫,是probe的集合。
常用的人重識別評價標準
1 Rank-n
搜索結(jié)果中最靠前(置信度最高)的n張圖有正確結(jié)果的概率,rank 1, 就是第一次命中,rank k,就是在第k次以內(nèi)命中。
當(dāng)處理的大型數(shù)據(jù)集各個類別之間存在許多具有相似特征時,我們往往會增加一個rank-5準確度,也就是說我們不止關(guān)心rank-1準確度,也關(guān)心rank-5準確度。結(jié)合兩個準確度來以衡量神經(jīng)網(wǎng)絡(luò)的性能。理想情況下,隨著預(yù)測數(shù)據(jù)增加,希望rank-1準確度和rank-5準確度同比例增加。但是,在某些數(shù)據(jù)集上,情況往往并非總是如此。因此,我們也根據(jù)rank-5準確度檢驗?zāi)P?#xff0c;以確保我們的網(wǎng)絡(luò)在后面的迭代中仍然是“學(xué)習(xí)”的。在訓(xùn)練快結(jié)束時,rank-1準確度可能會停滯不前,但是當(dāng)我們的網(wǎng)絡(luò)學(xué)習(xí)到更多的識別特征(雖然沒有足夠的識別能力超過top1的預(yù)測)時,rank-5準確度會繼續(xù)提高。
2 Precision & Recall
一般來說,Precision就是檢索出來的條目(比如:文檔、網(wǎng)頁等)有多少是準確的,Recall就是所有準確的條目有多少被檢索出來了。
Precision:準確率 output為1中ground truth也為1的 占ground truth為1的概率
Recall:召回率 output為1中ground truth也為1的 占output為1的概率
正確率 = 提取出的正確信息條數(shù) / 提取出的信息條數(shù)
召回率 = 提取出的正確信息條數(shù) / 樣本中的信息條數(shù)
準確率和召回率都是針對同一類別來說的,并且只有當(dāng)檢索到當(dāng)前類別時才進行計算,比如在person re-id中,一個人的label為m1,在測試集中包含3張此人的圖像,檢索出來的圖像按照得分從高到低順序為m1、m2、m1、m3、m4、m1…。
我們當(dāng)然希望檢測的結(jié)果P越高越好,R也越高越好,但事實上這兩者在某些情況下是矛盾的。比如極端情況下,我們只檢測出了一個結(jié)果,且是準確的,那么Precision就是100%,但是Recall就很低;而如果我們把所有結(jié)果都返回,那么必然Recall必然很大,但是Precision很低。
因此在不同的場合中需要自己判斷希望P比較高還是R比較高。如果是做實驗研究,可以繪制Precision-Recall曲線來幫助分析。
3 F-score
綜合權(quán)衡Precision和Recall這2個指標,這就引出了一個新的指標F-score。這是綜合考慮Precision和Recall的調(diào)和值。
因為Precision和Recall是對立關(guān)系的,一般情況下,Precision高,Recall就低;Recall高,Precision就低。
所以在實際中常常需要根據(jù)具體情況做出取舍,例如一般的搜索情況,在保證召回率的條件下,盡量提升精確率 。
當(dāng)β=1時,稱為F1-score,這時,精確率和召回率都很重要,權(quán)重相同。當(dāng)有些情況下,我們認為精確率更重要些,那就調(diào)整β的值小于1,如果我們認為召回率更重要些,那就調(diào)整β的值大于1。
4 mAP
AP就是平均精準度,簡單來說就是對PR曲線上的Precision值求均值。對于pr曲線來說,我們使用積分來進行計算。
在實際應(yīng)用中,我們并不直接對該PR曲線進行計算,而是對PR曲線進行平滑處理。即對PR曲線上的每個點,Precision的值取該點右側(cè)最大的Precision的值。
mAP的全稱是mean Average Precision,意為平均精度均值(這個指標是多目標檢測和多標簽圖像分類中長常用的評測指標,因為這類任務(wù)中的標簽大多不止一個,所以不能用普通的單標簽圖像的分類標準,也就是mean Precision,平均精確確率這個指標。mAP是將多分類任務(wù)中的平均精度AP(Average Precision)求和再取平均。AP衡量的是模型在單個類別上判斷結(jié)果的好壞(效果好壞),mAP衡量的是模型在所有類別上的好壞。根據(jù)類別在訓(xùn)練集上的分布方式,AP值可能在某些類別上從很高(這有很好的訓(xùn)練數(shù)據(jù))變化到很低(對數(shù)據(jù)很少或不好的類別)。所以你的mAP可能是合適的,但你的模型可能對某些類別非常好而對某些類別非常差。因此當(dāng)分析你的模型結(jié)果時,觀察獨立類別的AP是明智的。這些值可能作為添加更多訓(xùn)練樣本的指示器。
5 CMC和ROC
CMC曲線全稱是Cumulative Match Characteristic (CMC) curve,也就是累積匹配曲線,ROC曲線Receiver Operating Characteristic (ROC) curve。
兩種曲線均是做模式識別的重要評價指標,一般將兩種曲線同時給出,能夠綜合評價出算法的好壞。CMC曲線綜合反映了分類器的性能,它的評價指標與現(xiàn)在deep learning中常用的top1 err或top5 err評價指標一樣的意思,不同的是這里Rank1 recognition rate表示的是正確率而不是錯誤率,兩者的關(guān)系是Rank1識別率=1-top1 err ,Rank5識別率=1-top5 ert
CMC將再識別問題看成是一種排序問題,CMC 曲線的具體含義是指:在候選行人庫(gallery)中檢索待查詢(probe)的行人,前 r 個檢索結(jié)果中包含正確匹配結(jié)果的比率。其中,第 1 匹配率 r=1 指標rank-1反映了最匹配候選目標剛好為待查詢圖片目標的概率,即該指標為真正的識別能力,因此很重要。但是當(dāng) r 值很小但大于1時,由于可以通過人眼進行輔助識別查找目標,因此也很有現(xiàn)實意義,如第 5 匹配率 r=5 指標反映前 5 個匹配候選目標中存在待查詢圖片目標的概率,如下圖:橫坐標表示排名等級r,縱坐標表示再識別的準確率。
Roc曲線:接收者操作特征(receiveroperating characteristic),roc曲線上每個點反映著對同一信號刺激的感受性。橫軸:負正類率(false postive rate FPR)特異度,劃分實例中所有負例占所有負例的比例;(1-Specificity)。縱軸:真正類率(true postive rate TPR)靈敏度,Sensitivity(正類覆蓋率)具體到識別任務(wù)中就是,ROC曲線上的每一點反映的是不同的閾值對應(yīng)的FP(false positive)和TP(true positive)之間的關(guān)系。通常情況下,ROC曲線越靠近(0,1)坐標表示性能越好。
總結(jié)
- 上一篇: Redis核心解读–集群管理工具(Red
- 下一篇: 韶音耳机连不上电脑_蓝牙耳机突然连接不上