ECCV 2018 StructSiam:《Structured Siamese Network for Real-Time Visual Tracking》论文笔记
目錄
- 整體結(jié)構(gòu)
- 創(chuàng)新點(diǎn)
- 實(shí)驗(yàn)結(jié)果
? ? ? ?理解出錯(cuò)之處望不吝指正。
? ? ? ?文章鏈接
整體結(jié)構(gòu)
? ? ? ?本文的模型結(jié)構(gòu)如下圖所示:
創(chuàng)新點(diǎn)
? ? ? ?本文的改進(jìn)我覺(jué)得十分新穎:“每張?zhí)卣鲌D學(xué)習(xí)跟蹤目標(biāo)的一個(gè)局部結(jié)構(gòu)”,模板經(jīng)過(guò)卷積后得到1×1×40961\times 1\times 40961×1×4096大小的特征圖,每張?zhí)卣鲌D代表該物體的一個(gè)屬性(特征),基于此特征圖做相似計(jì)算。
? ? ? ?從上圖來(lái)看,我們可以知道,文中主要有三個(gè)新增加的部分,分別是“Local Pattern Detection”、“Context Modeling”和“Integration Module”。
? ? ? ?“Local Pattern Detection"部分是通過(guò)兩個(gè)卷積層(11×1111\times 1111×11和5×55\times 55×5)實(shí)現(xiàn)的,輸出的每張?zhí)卣鲌D代表一個(gè)局部特征。
? ? ? ?“Context Modeling”部分通過(guò)“消息傳遞”機(jī)制實(shí)現(xiàn),使用的是CRF(條件隨機(jī)場(chǎng))。作用是壓制背景噪聲、加強(qiáng)特征。
? ? ? ?“Integration Module”部分通過(guò)6×66\times 66×6卷積核實(shí)現(xiàn),將模板幀的特征圖由6×6×40966\times 6\times 40966×6×4096變?yōu)?span id="ze8trgl8bvbq" class="katex--inline">1×1×40961\times 1\times 40961×1×4096(其實(shí)就是變成了一個(gè)向量,向量中的每個(gè)值代表該物體的一個(gè)屬性,和全局均值池化類似)。
實(shí)驗(yàn)結(jié)果
? ? ? ?由于要學(xué)習(xí)部分特征,作者選擇使用ILSVRC2014和ALOV作為訓(xùn)練數(shù)據(jù)集,模型的實(shí)驗(yàn)結(jié)果如下所示:
? ? ? ?1.OTB-2013
? ? ? ?? ?87.4%??0.638??45FPS
? ? ? ?2.OTB-2015
? ? ? ?? ?85.1%??0.621??45FPS
? ? ? ?3.VOT-2016
總結(jié)
以上是生活随笔為你收集整理的ECCV 2018 StructSiam:《Structured Siamese Network for Real-Time Visual Tracking》论文笔记的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: ECCV 2018 《Triplet L
- 下一篇: 模型学习 - VAE(变分自编码)专题