Mask-RCNN中的ROIAlign, ROIPooling及ROIWarp对比
RoI Pooling
實現從原圖ROI區域映射到卷積區域最后pooling到固定大小的功能,然后通過池化把該區域的尺寸歸一化成卷積網絡輸入的尺寸。
ROIAlign
上面RoI Pooling從原圖ROI映射到卷積區域,即原圖ROI與特征圖ROI之間的映射,使用了stride間隔的取整,使得特征圖ROI再映射回原圖ROI的時候有stride的誤差。尤其經過最大值池化后的特征與原ROI之間的空間不對齊就更加明顯了。?
因此,ROIAlign從原圖到特征圖直接的ROI映射直接使用雙線性插值,不取整,這樣誤差會小很多,經過池化后再對應回原圖的準確性也更高些。?
這里假設得到的浮點型坐標為(x,y),取其周圍最近的四個點,在Y方向內插兩次,再在X方向內插一次,得到新的值。ROI的形狀是不變化的。?
但是下面的warp是先改變形狀的,這也是這兩種操作的不同之處。
RoI Warping Layer
在pooling層前面,添加一層,將特征圖crop一塊,然后warp到固定的尺寸,這里的warp采用長度和寬度兩個方向的雙線性插值。?
具體參考如下網址:http://dubur.github.io/
align?一致嗎?個人覺得信息的降維,必然會有一定的損失即使是ROIAlign也不可能完全對齊,只能相對精確罷了。
---------------------?
作者:lanyuxuan100?
來源:CSDN?
原文:https://blog.csdn.net/lanyuxuan100/article/details/71124596?utm_source=copy?
版權聲明:本文為博主原創文章,轉載請附上博文鏈接!
總結
以上是生活随笔為你收集整理的Mask-RCNN中的ROIAlign, ROIPooling及ROIWarp对比的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 深度学习: 从 RoIPooling 到
- 下一篇: 目标检测特殊层:ROI Align层详解