CPNDet:Corner Proposal Network for Anchor-free, Two-stage Object Detection
CPNDet論文鏈接
一.背景
anchor-based方法將大量框密集分布在feature map上,在推理時,由于預(yù)設(shè)的anchor與目標差異大,召回率會偏低。而anchor-free不受anchor大小限制,在任意形狀上會更加靈活,但是像CornerNet這種,先進行角點檢測,將有效的角點枚舉組合成大量候選預(yù)測框,容易帶來大量的FP。而FCOS需要回歸關(guān)鍵點到邊界的距離,對于長寬大的物體也比較難以預(yù)測。
?
二.網(wǎng)絡(luò)介紹
1.網(wǎng)絡(luò)結(jié)構(gòu)以及l(fā)oss函數(shù)
Stage 1: Anchor-free Proposals with Corner Keypoints
假定每個目標都由兩個關(guān)鍵點進行定位,先根據(jù)CornerNet輸出一對左上右下的heatmap,選擇top-k個左上角點以及top-k個右下角點。將有效的關(guān)鍵點組合成目標的候選框,關(guān)鍵點組合是否有效主要有兩個判斷:
左上右下關(guān)鍵點是否屬于同一個類別
左上角點坐標比右上角點小
同時作者認為cornernet那種embedding向量組合不是保證能夠?qū)W習(xí)到的,在未見過的場景和目標挨得比較近時都會造成性能下降。
Stage 2: Two-step Classification for Filtering Proposals
由于產(chǎn)生heatmap的feature map較大,在角點進行組合時,雖然極大提高了召回率但同時特提升了誤檢率,還加大了過濾的計算量。所以先進行二分類,過濾掉80%候選框,然后在對剩下的框進行多分類。
首先在feature map上選用7*7RoIAlign提取每個候選框的特征,在使用1個32*7*7輸出二分類的分類score。
二分類loss采用focal loss變種。
N:正樣本數(shù)量;
IoUm:第m個候選框和所有g(shù)t box的IOU;
p m:第m個候選區(qū)域的分類score;
τ:IOU閾值,一般選擇0.7;
α :超參,為2,用來平滑loss函數(shù)。
第二步對剩下的框進行多分類,用一個256*7*7輸出C維向量,進行C分類,C分類loss也采用focal loss變種。
M?:上一步過濾后的候選框;
N?:正樣本框
IoU m,c:類別是c為第m個候選框和所有g(shù)t box的IOU;
qm,c:類別是c,第m個候選區(qū)域的分類score;
α,β:超參,為2,用來平滑loss函數(shù)
2.總的loss函數(shù)
Ldetcorner:角點定位和cornernet一樣;
Loffsetcorner:角點偏移
Lprop:二分類fcoal loss
Lclass:多分類fcoal loss
3.推理階段
第一個階段先使用0.2閾值,過濾掉大部分框,在對剩下的框進行多分類。在進行soft Nms即可。
s1:角點的分類score(兩個角點的平均)
s2:多分類的score
當(dāng)兩個中一個大于0.5時,才采用上述式子得出預(yù)測的類別score,在歸一化為[0,1]之間。
三.實驗結(jié)果
1.是否帶二分類的實驗結(jié)果對比
2.和各種檢測框架的實驗結(jié)果對比
3.速度和精度的對比
總結(jié)
以上是生活随笔為你收集整理的CPNDet:Corner Proposal Network for Anchor-free, Two-stage Object Detection的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 熵的基础知识,特征工程,特征归一化,交叉
- 下一篇: C语言ODBC连接MySQL数据库制作简