深入理解最大池化为什么能够实现不变性?
生活随笔
收集整理的這篇文章主要介紹了
深入理解最大池化为什么能够实现不变性?
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
池化層主要有兩個作用
(1) translation invariance(平移不變性):
這里舉一個直觀的例子(數字識別),假設有一個16x16的圖片,里面有個數字1,我們需要識別出來,這個數字1可能寫的偏左一點(圖1),這個數字1可能偏右一點(圖2),圖1到圖2相當于向右平移了一個單位,但是圖1和圖2經過max pooling之后它們都變成了相同的8x8特征矩陣,主要的特征我們捕獲到了,同時又將問題的規模從16x16降到了8x8,而且具有平移不變性的特點。圖中的a(或b)表示,在原始圖片中的這些a(或b)位置,最終都會映射到相同的位置。
(2)rotation invariance(旋轉不變性):
下圖表示漢字“一”的識別,第一張相對于x軸有傾斜角,第二張是平行于x軸,兩張圖片相當于做了旋轉,經過多次max pooling后具有相同的特征。
(3)scale invariance(尺度不變性):
下圖表示數字“0”的識別,第一張的“0”比較大,第二張的“0”進行了較小,相當于作了縮放,同樣地,經過多次max pooling后具有相同的特征。
總結
以上是生活随笔為你收集整理的深入理解最大池化为什么能够实现不变性?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 产品经理跌下神坛?
- 下一篇: 互联网日报 | 7月15日 星期四 |