M2Det: A Single-Shot Object Detector based on Multi-Level Feature Pyramid
論文鏈接:M2Det: A Single-Shot Object Detector based on Multi-Level Feature Pyramid
主要貢獻:
提出多級特征金字塔網(wǎng)絡(luò)MLFPN。
基于提出的MLFPN,結(jié)合SSD,提出一種新的Single-shot目標(biāo)檢測模型M2Det。
整體框架
M2Det使用主干網(wǎng)絡(luò)和MLFPN來提取特征,然后采用類似SSD的方式預(yù)測框和類別得分,通過NMS得到最后的檢測結(jié)果。
首先,通過FFM v1對主干網(wǎng)絡(luò)提取到的特征進行融合;
然后,通過TUM和FFM v2提取更有代表性的Multi-level&Mutli-scale特征;
最后,通過SFAM融合多級特征,得到多級特征金字塔用于最終階段的預(yù)測。
FFM
特征融合模塊FFM: 用于融合M2Det中不同級別的特征,先通過1x1卷積壓縮通道數(shù),再進行拼接。
FFMv1使用兩種不同尺度的特征圖作為輸入,所以在拼接之前加入了上采樣來調(diào)整大小;FFMv2的兩個輸入的尺度相同。
TUM
細化U型模塊TUM:使用了比FPN和RetinaNet更薄的U型網(wǎng)絡(luò)。在上采樣和元素相加操作后加上1x1卷積來加強學(xué)習(xí)能力和保持特征平滑度。TUM中每個解碼器的輸出共同構(gòu)成了多尺度輸出。每個TUM的輸出共同構(gòu)成了多級別、多尺度特征,前面的TUM提供低級別,后面的TUM提供高級別特征。
SFAM
尺度特征聚合模塊SFAM:旨在聚合TUMs產(chǎn)生的多級、多尺度特征,以構(gòu)造一個多級特征金字塔。
第一階段,沿通道維度將有相同尺度的特征圖進行拼接,這樣得到的每個尺度的特征包含了多個級別的信息。
第二階段,借鑒SENet的思想,加入channel-wise attention,以更好地捕捉有用的特征。
總結(jié)
以上是生活随笔為你收集整理的M2Det: A Single-Shot Object Detector based on Multi-Level Feature Pyramid的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 降水小波分析matlab程序,小波分析M
- 下一篇: 数学与计算机学院女生节标语,3.7女生节