當(dāng)前位置：首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

详解下一代神经网络-无监督对比学习框架SimCLR

發(fā)布時(shí)間：2025/4/5 编程问答 20 豆豆

生活随笔收集整理的這篇文章主要介紹了详解下一代神经网络-无监督对比学习框架SimCLR 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

背景

今天介紹下SimCLR，也是Hinton老爺子在今年提出的工作。首先介紹下為什么下一代神經(jīng)網(wǎng)絡(luò)需要無(wú)監(jiān)督對(duì)比學(xué)習(xí)。目前整個(gè)人工智能行業(yè)的落地，其實(shí)都依賴(lài)于監(jiān)督學(xué)習(xí)模式，無(wú)論是OCR、ASR、TTS、ImageDetection，如果沒(méi)有大量的標(biāo)注，是很難訓(xùn)練出商業(yè)化程度的模型的。這個(gè)模式需要被打破，因?yàn)槭澜缟洗嬖谔嗟奈粗獔?chǎng)景，完全依賴(lài)人肉標(biāo)注是不行的。

所以未來(lái)無(wú)監(jiān)督學(xué)習(xí)大勢(shì)所趨。其實(shí)在這方面之前已經(jīng)有了一些工作，比如Bert模型，就可以基于大量的unlabeled數(shù)據(jù)訓(xùn)練，然后在小數(shù)據(jù)集上Fintune來(lái)取得效果。類(lèi)似Bert這一類(lèi)的訓(xùn)練模式叫做自監(jiān)督學(xué)習(xí)。這種模式在NLP領(lǐng)域會(huì)有比較好的效果，但是在圖像領(lǐng)域效果不明顯，因?yàn)閳D像的數(shù)據(jù)表示會(huì)比語(yǔ)意復(fù)雜得多。

舉個(gè)簡(jiǎn)單例子，“喜歡_ _ _ _的人都會(huì)關(guān)注凡人機(jī)器學(xué)習(xí)”，這句話(huà)雖然空了4個(gè)字，但是根據(jù)上下文不難猜出這4個(gè)字是“機(jī)器學(xué)習(xí)”。所以在NLP領(lǐng)域，自監(jiān)督是比較好實(shí)現(xiàn)的。但是在圖像方面，假設(shè)戴了墨鏡，你能根據(jù)一個(gè)人的鼻子、嘴和耳朵推測(cè)出這個(gè)人墨鏡后面的樣子么？所以圖像領(lǐng)域的無(wú)監(jiān)督學(xué)習(xí)要難的多。

SimCLR基本原理

SimCLR使用無(wú)監(jiān)督對(duì)比學(xué)習(xí)模式在圖像領(lǐng)域取得了突破性的成果，可以看下在ImageNet數(shù)據(jù)集的表現(xiàn)。

那SimCLR究竟是怎么實(shí)現(xiàn)的呢，我們分步驟介紹下，看下圖：

第一步：Augmentation

無(wú)監(jiān)督對(duì)比學(xué)習(xí)的本質(zhì)其實(shí)是讓模型通過(guò)不同的類(lèi)別數(shù)據(jù)的對(duì)比學(xué)習(xí)出相同類(lèi)別的屬性。所以為了增強(qiáng)同一類(lèi)別的數(shù)據(jù)的特征表現(xiàn)，需要做Augmentation，包含數(shù)據(jù)裁剪、翻轉(zhuǎn)、顏色轉(zhuǎn)換等。

第二步：CNN

可以選用CNN的Resnet網(wǎng)絡(luò)，做數(shù)據(jù)的向量表示。Resnet也是最終的分類(lèi)器模型。

第三步：MLP

通過(guò)MLP，也就是全連接層，可以學(xué)習(xí)出數(shù)據(jù)的非線(xiàn)性信息，是對(duì)上一步的一個(gè)增強(qiáng)。通過(guò)這一步的學(xué)習(xí)就可以得出同一類(lèi)別數(shù)據(jù)的共同信息特點(diǎn)。如下圖所示：

第四步：Optimization

在Optimization這一步，Lossfunction的求法就是要讓相同類(lèi)別的數(shù)據(jù)對(duì)比的Loss最小。比如同是來(lái)源于“貓”的圖片，他們之間的Loss需要很小，這個(gè)Loss的計(jì)算需要通過(guò)L(貓，貓)去除以L(fǎng)(貓，貓)+L(貓，其它類(lèi)別)的和。

最終通過(guò)Loss去優(yōu)化CNN和MLP，CNN的輸出結(jié)果就可以作為最終的模型輸出結(jié)果了。

參考文獻(xiàn)：

[1]https://ai.googleblog.com/2020/04/advancing-self-supervised-and-semi.html

[2]https://blog.csdn.net/u011984148/article/details/106233313/

《新程序員》：云原生和全面數(shù)字化實(shí)踐50位技術(shù)專(zhuān)家共同創(chuàng)作，文字、視頻、音頻交互閱讀

總結(jié)

以上是生活随笔為你收集整理的详解下一代神经网络-无监督对比学习框架SimCLR的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇：浅析人类最贵、最大的机器学习模型GPT-
下一篇：开源在线机器学习Online Learn