VGG-16网络结构解析
VGG,也叫做VGG-16網(wǎng)絡。這個網(wǎng)絡結(jié)構(gòu)很有意思,相必實現(xiàn)這個網(wǎng)絡的作者是有點強迫癥,不然整個網(wǎng)絡為什么能夠如此的協(xié)調(diào)一致。基本上每一次的內(nèi)容都大同小異,2層或3層卷積層,激活一下,池化一下,就接下一層了。
值得注意的一點是,VGG-16網(wǎng)絡沒有那么多超參數(shù),這是一種只需要專注于構(gòu)建卷積層的簡單網(wǎng)絡。首先用3×3,步幅為1的過濾器構(gòu)建卷積層,padding參數(shù)為same。然后用一個2*2,步幅為2的過濾器構(gòu)建最大池化層。因此VGG網(wǎng)絡的一大優(yōu)點是它確實簡化了神經(jīng)網(wǎng)絡結(jié)構(gòu)。
假設要識別一張圖像224×224×3,在最開始的兩層用64個3×3,步幅為1,padding參數(shù)為same的過濾器對輸入圖像進行卷積,輸出結(jié)果是224×224×64,網(wǎng)絡結(jié)構(gòu)如下:
?注記:
1。VGG-16的這個數(shù)字16,就是指在這個網(wǎng)絡中包含16個卷積層和全連接層。確實是個很大的網(wǎng)絡,總共包含1.38億個參數(shù),即便以現(xiàn)在的標準來看都是非常大的網(wǎng)絡。但VGG-16結(jié)構(gòu)并不復雜,這點非常吸引人,而且這種網(wǎng)絡結(jié)構(gòu)很規(guī)整,都是幾個卷積層后面跟著可以壓縮圖像大小的池化層,池化層縮小圖像的高度和寬度。同時,卷積層的過濾器數(shù)量變化存在一定的規(guī)律,由
作者可能認為512已經(jīng)足夠大了,所以后面的層就不再翻倍了。無論如何,每一步都進行翻倍,或者說在每一組卷積層進行過濾器翻倍操作,正是設計此種網(wǎng)絡結(jié)構(gòu)的另一個簡單原則。這種相對一致的網(wǎng)絡結(jié)構(gòu)對研究者很有吸引力,而它的主要缺點是需要訓練的特征數(shù)量非常巨大。文中揭示了,隨著網(wǎng)絡的加深,圖像的高度和寬度都在以一定的規(guī)律不斷縮小,每次池化后剛好縮小一半,而通道數(shù)量在不斷增加,而且剛好也是在每組卷積操作后增加一倍。也就是說,圖像縮小的比例和通道數(shù)增加的比例是有規(guī)律的。從這個角度來看,這篇論文很吸引人。
總結(jié)
以上是生活随笔為你收集整理的VGG-16网络结构解析的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 视频工时测量软件哪个好,为什么越来越多的
- 下一篇: 图像处理: 超像素(superpixel