吴恩达深度学习笔记13-Course4-Week4【人脸识别和神经风格转换】
人臉識別(Face Recognition)
一、人臉識別簡介(What is face recognition?)
- 人臉驗證:輸入一張帶人名/ID的人臉圖片,驗證是不是那個人。一對一問題。
- 人臉識別:輸入任一張人臉圖片,判斷人名/ID。要求更高的準確率。
二、一次學習(One Shot Learning)
數(shù)據(jù)庫中,通常每個人只有一個帶標簽的樣本,這是不足以訓練一個穩(wěn)健的卷積神經(jīng)網(wǎng)絡(luò)來進行人的識別。而且,在有新的樣本成員加入的時候,往往還需要對網(wǎng)絡(luò)進行重新訓練,不現(xiàn)實。所以我們不能以傳統(tǒng)的方法來實現(xiàn)識別系統(tǒng)。這就要用one shot learning 來解決,即單樣本學習。
one shot learning :
- 通過大型的數(shù)據(jù)庫訓練出把圖片變成另一種好的編碼格式的CNN。
- 輸入時通過該CNN轉(zhuǎn)化圖片編碼,然后和數(shù)據(jù)庫中的各經(jīng)過編碼的圖片進行比較,相似度最高的就是預測結(jié)果。
- 如果有新成員加入,則只需將其一張圖片添加至數(shù)據(jù)庫即可。
學習“similarity”函數(shù):
衡量兩個樣本編碼間的差別有多大。同一標簽樣本之間的“similarity”函數(shù)值小,不同一標簽樣本的之間的大。
三、Siamese Network
- Siamese網(wǎng)絡(luò)其實是一個CNN,只是最后輸出的是圖像的編碼,不是識別的結(jié)果。
- 一旦從大型數(shù)據(jù)庫學習到這個CNN,CNN的參數(shù)就變成固定的了,和我們數(shù)據(jù)庫無關(guān)。
學習的目標:同一標簽樣本的編碼差別小,不同標簽樣本的編碼差別大。
四、三元組損失函數(shù)(Triplet Loss)
三元組損失函數(shù):
損失函數(shù)中樣本組合(A, P, N),少選那些很容易區(qū)分的組合,多選那些不容易區(qū)分的組合,這樣才能學得更準確。
五、臉部驗證和二分類(Face Verification and Binary Classification)
學習“similarity”函數(shù)時,也可以用二分類的方法來學習。
神經(jīng)風格轉(zhuǎn)換(Neural Style Transfer)
六、神經(jīng)風格轉(zhuǎn)換簡介(What is neural style transfer?)
七、卷積神經(jīng)網(wǎng)絡(luò)在學習什么(What are deep ConvNets learning?)
八、損失函數(shù)(Cost Function)
把要生成的帶風格圖像的所有像素值當做要學習的參數(shù),隨機初始化,用梯度下降法去更新圖像的像素值。
Cost Function:
Content Cost Function:
Style Cost Function:
九、一維和三維的卷積(1D and 3D Generalizations)
一維卷積:
三維卷積:
總結(jié)
以上是生活随笔為你收集整理的吴恩达深度学习笔记13-Course4-Week4【人脸识别和神经风格转换】的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: lan pci 联想开机_微软承认KB4
- 下一篇: URL传Base64 造成报错 Ille