CVPR 2019 ATOM:《ATOM: Accurate Tracking by Overlap Maximization》论文笔记
目錄
- 簡介
- 動機
- 貢獻
- 方法
- 實驗
理解出錯之處忘不吝指正。
簡介
本文是MD在ECO系列之后的新paper,CVPR2019的oral,文章質量很高。
文章鏈接
代碼鏈接
動機
目前,目標跟蹤領域的研究重點集中于分類準確度,這導致目標分類效果好的模型,目標估計(target state estimation)低于預期,相反一些以前的模型能夠獲得更好的目標估計效果,但這些模型的目標分類效果差。
貢獻
方法
本文方法的整體架構如下圖所示,其實較為主要的是兩部分,藍色的IoU Modulation+藍色的IoU Predictor可以統稱為目標估計網絡,綠色的Classifier即為目標分類網絡。
目標估計網絡用于輸出當前幀的bbox的IoU,使用IoU-Net+Siamese架構得到,具體的如下圖所示。其中,PrPool是IoU-Net中提出的,如下下圖所示。文中提到,直接使用Siamese的架構無法得到很好的效果,作者提出了基于調制(Modulation)的方法。關于這里的“調制”,我的個人理解是,由于直接使用Siamese架構不能得到很好的結果,我們可以將Reference Branch的特征進行一下變化,使其能夠“適應”Test Branch的“信道”。
由于目標估計網格的判別能力不足,故引入目標分類網絡。這部分本文使用了兩層卷積,直接回歸出以目標為中心的高斯label,且使用online training實現target-specific。但是使用梯度下降法收斂速度過慢,作者將問題轉化為了高斯-牛頓最優化問題,可以使用共軛梯度法解決。具體步驟如下:
可以看下,本文的online training方法和梯度下降的比較。
具體的跟蹤流程為:
- 使用目標分類網絡計算置信度,置信度最高的位置記為(x,y)(x, y)(x,y),使用(x,y)(x, y)(x,y)+上一幀目標的www和hhh作為初始跟蹤結果BBB。
- 基于BBB生成10個候選bbox,利用目標估計網絡計算它們的IoU,取前三個作為候選結果。
- 將三個候選結果取均值,得到最終跟蹤結果。
實驗
首先是消融實驗,Multi-Scale代表多尺度搜索方法;No Classif.代表無在線目標分類分支;GD是梯度下降,和本文優化方法的“反向傳播”調用次數相同,即運算速度相同,同時GD的學習率和動量參數經過精心調整;GD++是5倍運算量版的梯度下降;No HN代表沒有難負樣本。
接下來,是在NFS和UAV123數據集上的實驗結果:
在TrackingNet數據集上的實驗結果:
在LaSOT數據集上的實驗結果:
在VOT2018上的實驗結果:
總結
以上是生活随笔為你收集整理的CVPR 2019 ATOM:《ATOM: Accurate Tracking by Overlap Maximization》论文笔记的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 正则化和范数
- 下一篇: CVPR 2019 GCT:《Graph