论文简读(一)
Alexnet:CNN論文簡略解讀
- 論文: 論文連接
沖啊。。。
流程
- 任務背景
- Alexnet框架是什么
- 論文的創新點及其作用是什么
- 得出的結論是什么
- keras代碼實現
任務背景
- ILSVRC-2012競賽,當時有150million圖像,22,000個種類
Alexnet框架
論文的創新點及其作用是什么
- 加快訓練速度和減小錯誤率
- relu激活函數的提出
- 根據論文介紹,相同條件下,相比于之前的tanh非線性激活函數,relu函數的計算速度是tanh函數的6倍,防止梯度消失,同時,還不影響網絡的非線性表達能力
- 局部歸一化normlizational的使用
- 根據論文的實驗結果能有效減小模型結果的錯誤率,達到1.4%–1.2%,
- pooling層
- 同樣能有效減小模型的錯誤率,到達0.4%–0.3%
- relu激活函數的提出
- 防止過擬合
- 數據增強
- 一種方式是對圖片進行平移和水平翻轉,另一種方式是變換顏色通道,結果是錯誤率較少了1%以上。
- Dropout的使用
- 在網絡的全連接層加入dropout層,使隨機去除一部分神經元
- 數據增強
得出的結論是什么
- ILSVRC-2012的這次競賽,top-5(前五個的預測結果)的錯誤率為15.3%,第二名的top-5為26.2%
keras代碼實現
# -*- coding:utf-8 -*- from keras.layers import Input,Dense,Conv2D,MaxPool2D,Flatten,BatchNormalization,Dropout from keras.models import Model from keras.utils import plot_model import warnings warnings.filterwarnings("ignore")inputs = Input(shape=(224,224,3))# layer 1 net = Conv2D(filters=48,kernel_size=11,strides=4,padding="same",activation="relu",kernel_initializer="uniform")(inputs) net = BatchNormalization()(net) net = MaxPool2D(pool_size=3,strides=2,padding="valid")(net)# layer 2 net = Conv2D(filters=128,kernel_size=3,strides=1,padding="same",activation="relu",kernel_initializer="uniform")(net) net = BatchNormalization()(net) net = MaxPool2D(pool_size=3,strides=2,padding="valid")(net)#layer 3 net = Conv2D(filters=196,kernel_size=3,strides=1,padding="same",activation="relu",kernel_initializer="uniform")(net)# layer 4 net = Conv2D(filters=196,kernel_size=3,strides=1,padding="same",activation="relu",kernel_initializer="uniform")(net)# layer 5 net = Conv2D(filters=128,kernel_size=3,strides=1,padding="same",activation="relu",kernel_initializer="uniform")(net)# layer 6 (fully connect 1) net = Flatten()(net) net = Dense(units=2048,activation="relu")(net) net = Dropout(rate=0.5)(net)# layer 7 (fully connect 2) net = Dense(units=2048,activation="relu")(net) net = Dropout(rate=0.5)(net)# layer 8 (fully connect 3) outputs = Dense(units=1000,activation="softmax")(net)# build model = Model(inputs=[inputs],outputs=[outputs]) model.summary()參考文獻
https://blog.csdn.net/wei18791957243/article/details/84258875
深度學習(花書)
總結
- 上一篇: CV之路 —— Opencv学习
- 下一篇: CV之路——opencv基本操作