stn,spatial transformer network总结
對整篇paper的一個總結:https://blog.csdn.net/xbinworld/article/details/69049680
github:1.https://github.com/Dive-frank/caffe_stn 有prototxt,并且prototxt看起來寫的還不錯
?????????? 2.https://github.com/christopher5106/last_caffe_with_stn,最原始的用caffe寫stn的
?
stn就是一個模塊,可以加在任何兩個卷積之間,是無監督學習的.通過localisation net學theta參數,6個值用來做仿射變換.可以這樣認為,localisation net之前是輸入,暫且叫feature map i,之后就是輸出,暫且叫feature map o.必須清楚一點是:經過stn處理之后,feature map的大小保持不變,localisation net之后的feature map雖然沒有像素值,但是是有坐標值的.這些localisation net之后的feature map(里面所有的坐標點)通過仿射變換找到在輸入feature map上的坐標點,然后從這些坐標點取出像素值給輸出的feature map,一一對應.可以這樣理解,其實輸出的feature map就是從輸入的feature map里面摳出的一部分放大,所以,輸出的feature map的所有點都會在輸入上有相應的映射點.這時你在想,實際上輸入輸出是一樣大的,把輸出的所有點映射到輸入的一部分區域,那肯定在輸出落在輸入的點肯定不全是整數點,因為個數不夠,所以會有許多浮點數的點,這個時候就利用插值來求這些點的像素值了.
?
stn這種主要是解決分類問題,因為是整張圖來做,如果用在detection,我覺得可以把那個物體摳出來單獨做stn
總結
以上是生活随笔為你收集整理的stn,spatial transformer network总结的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: iOS 问题整理04----Runtim
- 下一篇: 工程师如何解决穿衣搭配烦恼?——滴搭平台