卷积神经网络--假期---2020.1.31
detection偵查,發現目標
segmentation:分割; 劃分; 分割成(或劃分成)的部分;? 顯卡GPUTitanX /1080
卷積提取特征,越亮越重要
90年代手寫識別
圖像描述生成(Image Caption)是一個融合計算機視覺、自然語言處理和機器學習的綜合問題,它類似于翻譯一副圖片為一段描述文字。該任務對于人類來說非常容易,但是對于機器卻非常具有挑戰性,它不僅需要利用模型去理解圖片的內容并且還需要用自然語言去表達它們之間的關系。除此之外,模型還需要能夠抓住圖像的語義信息,并且生成人類可讀的句子。
? ?由卷積神經網絡和cnn+LSTM
深度貫穿始終
輸入層:data
卷積層:filter(助手和輸入深度對應相同)進行特征提取,32*32*3(深度)最后叫特征圖,區域一一對應
可以指定filter的個數,都壓縮在一起得到特征結果,n層特征圖。得到卷積輸出結果。
迭代:得到的結果還可以進行下一次操作,在結果上也可以提取特征,不斷提取,不斷壓縮,對結果進行分類回歸,找到最好的W0,進行卷積網絡的前向傳播和反向傳播。
1.選個核大小和filter大小一樣
2.每層對應紅色藍色求內積,矩陣點乘,對應位置相乘,對應深度要找好,(最后一位,w0)
3.filter有w也有b? ? WX +b? w1=f11+f12+f13? ?b是單值(問題,咋構建合適的filter)?
4.窗口劃滑滑,步長stride為2,希望特征多一點好,即stride小
不能太大也不能太小,不合適容易造成像素點浪費;而且有的像素點利用次數不同
(methods:)邊緣提取,添加pading項,一圈都加0,n pad為n圈?
5.計算輸出
輸入:7*7,(h*W)求輸出的h和w是多大
h0=(hi-filtersize+2p)/stride+1
w0=(wi-filtersize+2p)/stride+1
神經元都有自己的參數,每層可以有不同個數的神經元,全連接的弊端,神經元上有很多參數。
32*32上的神經元個數為其乘積,輸入某點對應后邊的某個小區域
5*5*3為一個神經元相連的,每一個神經元對應75個權重參數,有75萬參數,幾百萬參數不好學習
權重共享,所有點都有權重共享的特性。w1 有75個,一層只有75個
b為偏制為輸出層數的個數
通道RGB
構造矩陣,有大小,filter有大小(完全由自己設定,最后也得喝輸入的通道數相同(深度))
全連接層
?
激活函數:之前有介紹
池化層:pooling,對特征濃縮,max方式對4個值進行壓縮,使特征圖大小急劇下降。
?
找窗口,對特征進行壓縮,相對簡單,沒有參數
maxpooling ;找其中最大的一個
minpooling:求和取平均
下采樣操作,
總結
以上是生活随笔為你收集整理的卷积神经网络--假期---2020.1.31的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: lucas定理 学习笔记
- 下一篇: 2020-2021年CFA一二三级/FR