机器学习入门(18)— 卷积网络中的池化层实现
生活随笔
收集整理的這篇文章主要介紹了
机器学习入门(18)— 卷积网络中的池化层实现
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
1. 池化層實現
池化層的實現和卷積層相同,都使用 im2col 展開輸入數據。不過,池化的情況下,在通道方向上是獨立的,這一點和卷積層不同。具體地講,如圖 7-21 所示,池化的應用區域按通道單獨展開。
像這樣展開之后,只需對展開的矩陣求各行的最大值,并轉換為合適的形狀即可(圖7-22)。
上面就是池化層的 forward 處理的實現流程。下面來看一下實現示例。
class Pooling:def __init__(self, pool_h, pool_w, stride=1, pad=0):self.pool_h = pool_hself.pool_w = pool_wself.stride = strideself.pad = padself.x = Noneself.arg_max = Nonedef forward(self, x):N, C, H, W = x.shapeout_h = int(1 + (H - self.pool_h) / self.stride)out_w = int(1 + (W - self.pool_w) / self.stride)# 展開col = im2col(x, self.pool_h, self.pool_w, self.stride, self.pad)col = col.reshape(-1, self.pool_h*self.pool_w)# 最大值arg_max = np.argmax(col, axis=1)out = np.max(col, axis=1)# 轉換out = out.reshape(N, out_h, out_w, C).transpose(0, 3, 1, 2)self.x = xself.arg_max = arg_maxreturn outdef backward(self, dout):dout = dout.transpose(0, 2, 3, 1)pool_size = self.pool_h * self.pool_wdmax = np.zeros((dout.size, pool_size))dmax[np.arange(self.arg_max.size), self.arg_max.flatten()] = dout.flatten()dmax = dmax.reshape(dout.shape + (pool_size,)) dcol = dmax.reshape(dmax.shape[0] * dmax.shape[1] * dmax.shape[2], -1)dx = col2im(dcol, self.x.shape, self.pool_h, self.pool_w, self.stride, self.pad)return dx
最大值的計算可以使用 NumPy 的 np.max 方法。np.max 可以指定 axis 參數,并在這個參數指定的各個軸方向上求最大值。比如,如果寫成 np.max(x, axis=1),就可以在輸入 x 的第 1 維的各個軸方向上求最大值。
總結
以上是生活随笔為你收集整理的机器学习入门(18)— 卷积网络中的池化层实现的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 机器学习入门(17)— 输入 4 维数据
- 下一篇: 找一部小时候看过的电视剧,谢谢大家帮忙了