M2Det算法详解
主要貢獻:提出MLFPN結構, backbone采用了VGG-16
為解決目標實例的尺度變化問題,主流做法有以下兩種:
? ? ? ? ? ? ?總結:使用多尺度的圖像來提高識別率,其實就是增加數據,讓數據更加豐富
各種不同的金字塔結構:
?
M2Det結構圖解:
注意:shallow medium deep 輸入SFAM層之后不是單獨預測,對于5*5的特征圖,它的來源是shallow medium deep這些層中5*5大小的特征圖,也就是說:5*5大小的預測特征圖中包含了shallow medium deep中5*5大小的特征圖
一、MLFPN包括三個部分:
1.FFM(特征融合模塊)
1.1 FFM1:融合BackBone network(主干網絡)的淺層和深層特征如上圖(a),因為尺寸不一樣使用了上采樣,對于通道不同一的問題使用了1*1卷積壓縮通道,得到了40*40*768大小的base feature map
詳解:圖(a)中上面的通道數最后是512,下面的通道數是256,所以最后輸出了768的通道,只是通道的合并,對應concat操作,還有就是多了上采樣的操作
Deconvolution、upsampling和unpooling的區別,看這里:
https://blog.csdn.net/stu_shanghui/article/details/91493591
1.2 FFMV2:融合base feature map和第一個TUM輸出的feature map
1.3 FFMV3:融合base feature map和第二個TUM輸出的feature map
? ? ? FFM2和FFM3的輸入尺寸都是一致的,所以不需要做上采樣操作
二、TUM(細化U型模塊)
最后都使用1*1卷積來加強學習能力
三、SFAM(尺度特征融合模塊)
作用:將TUM產生的不同多級多尺度特征聚合起來構造多級特征金字塔
Detail
只放一張結果圖吧
?
總結
- 上一篇: 【老生谈算法】matlab实现小波分析源
- 下一篇: 最新版Eclipse下载及安装(详细)