二维卷积详细解释
其中,矩陣A和B的尺寸分別為ma*na即mb*nb
① 對矩陣A補(bǔ)零,
第一行之前和最后一行之后都補(bǔ)mb-1行,
第一列之前和最后一列之后都補(bǔ)nb-1列
(注意conv2不支持其他的邊界補(bǔ)充選項,函數(shù)內(nèi)部對輸入總是補(bǔ)零);
之所以都是-1是因為卷積核要在圖像A上面移動,移動的時候需要滿足兩者至少有一列或者一行是重疊的.
② 將卷積核繞其中心旋轉(zhuǎn)180度;
③ 滑動旋轉(zhuǎn)后的卷積核,將卷積核的中心位于圖像矩陣的每一個元素,并求乘積和
(即將旋轉(zhuǎn)后的卷積核在A上進(jìn)行滑動,然后對應(yīng)位置相乘,最后相加);
下面分別是shape=full, same, valid時取輸出圖像大小的情況,
其中:位置1表示輸出圖像的值從當(dāng)前核的計算值開始(對應(yīng)輸出圖像左上角),
位置2表示到該位置結(jié)束(對應(yīng)輸出圖像右下角)
?總結(jié):
A*B,A補(bǔ)零,B旋轉(zhuǎn)180°,然后B沿著A逐行遍歷一遍,
遍歷的時候,B和A重疊部分進(jìn)行矢量積運算(例如圖中的(2,1)和(1,2)進(jìn)行矢量積得到為4),得到的值就是最終結(jié)果矩陣中的元素,舉例:
python2.7代碼驗證:
import numpy as np A=np.array([[1,2,3,4],[5,6,7,8],[9,8,7,6]]) B=np.array([[1,2,3],[-1,0,1],[2,1,2]]) import scipy.signal print scipy.signal.convolve(A,B) print scipy.signal.convolve(B,A)輸出結(jié)果為:
[[ 1 ?4 10 16 17 12]
?[ 4 14 32 38 40 28]
?[ 6 25 58 57 50 34]
?[ 1 ?9 32 37 29 22]
?[18 25 40 35 20 12]]
[[ 1 ?4 10 16 17 12]
?[ 4 14 32 38 40 28]
?[ 6 25 58 57 50 34]
?[ 1 ?9 32 37 29 22]
?[18 25 40 35 20 12]]
可知符合手工計算,同時也滿足交換律
?
這里會看到,運算結(jié)果的維度比原先的矩陣更大,但是CNN中卷積的結(jié)果比原先矩陣更小。
這是因為卷積有三種模式:
full、same、valid
這里講解的是full模式,CNN中采用的是valid模式,所以CNN中的卷積結(jié)果是越來越小。
?
總結(jié)
- 上一篇: 一维卷积详细解释(转载+自己笔记)
- 下一篇: NLTK自带的词干提取器