【深度学习】——如何处理输入图像大小不一样的情况
生活随笔
收集整理的這篇文章主要介紹了
【深度学习】——如何处理输入图像大小不一样的情况
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
這里一般有常見的幾種方法:
1)將圖像縮放成大小一致后再輸入,如RCNN算法
2)roi pooling:這里允許輸入圖像的大小不一樣,后續(xù)根據(jù)指定的固定大小來(lái)求解池化的核大小,以此來(lái)得到相同大小的特征圖,如我目標(biāo)是得到7*7的特征圖,這時(shí)候我有一個(gè)圖像是14*14,有一個(gè)圖像是21*21,則前一個(gè)圖像的池化卷積核為2*2,后一個(gè)池化卷積核為3*3這樣就保證了最后得到的特征圖都是7*7,這種方法稱之為roi pooling,但是會(huì)出現(xiàn)浮點(diǎn)數(shù),這種方法直接取整,導(dǎo)致特征不完整,主要用在FASTER RCNN,在MASKrcnn中有所改進(jìn),用的是roi align算法,保留了浮點(diǎn)數(shù)然后根據(jù)雙線性插值后取值。
總結(jié)
以上是生活随笔為你收集整理的【深度学习】——如何处理输入图像大小不一样的情况的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 【深度学习】——pytorch搭建模型及
- 下一篇: 【leetcode】16 3Sum Cl