无监督学习:从基本概念到四种实现模型
http://www.sohu.com/a/117638113_465975
這是今年 6 月份普渡大學副教授 Eugenio Culurciello 寫的一篇關于無監督學習的概述性文章。除了基本概念,本文還介紹了無監督學習的四種實現模型:聚類學習、自動編碼器、生成模型、PredNet。前幾日,Culurciello 教授根據最近無監督學習的發展對此篇文章進行了更新與調整,機器之心對此進行了編譯。文中提到的論文可點擊「閱讀原文」下載。
無監督學習可謂是深度學習的圣杯,其目標是建立可兼容小數據集進行訓練的通用系統,即便是很少的數據。
如今深度學習模型往往在大型監督型數據集上訓練。所謂監督型數據集,即每條數據都有一個對應的標簽。比如流行的 ImageNet 數據集,有一百萬張人為標記的圖像。一共有 1000 個類,每個類有 1000 張圖像。創建這樣的數據集需要花費大量的精力,同時也需要很多的時間?,F在想象創建一個有 1M 個類的數據集。試想一下,對有 100M 數據幀的視頻數據集的每一幀進行分類。該任務量簡直不可估量。
現在,回想一下你在小時候是如何進行學習的。是的,那時候會有人指導你,你的父母會告訴你這是一個「貓」,但是他們不會在你余生的每一分每一秒都告訴你這是一只「貓」!如今的監督學習也是這樣:我一次一次地告訴你,什么是「貓」,也許高達 100 萬次。然后你的深度學習模型就學會了。
理想情況下,我們希望有一個模型,它的表現與我們的大腦非常相似。只需少量的標簽便可理解這個多類的世界。這里所說的類,主要是指對象類、動作類、環境類、對象組成類等等。
基本概念
無監督學習研究的主要目標是預訓練一個模型(稱作「識別」或「編碼」)網絡,供其他任務使用。編碼特征通常能夠用到分類任務中:例如在 ImageNet 上訓練會表現出很好的結果,這與監督模型非常接近。(拿啥訓練呀???)
迄今為止,監督模型總是比無監督的預訓練模型表現的要好。其主要原因是監督模型對數據集的特性編碼的更好。但如果模型運用到其他任務,監督工作是可以減少的。在這方面,希望達到的目標是無監督訓練可以提供更一般的特征,用于學習并實現其它任務。
自動編碼器(auto-encoders)(這到底是無監督還是有監督呀,
轉載于:https://www.cnblogs.com/neverguveip/p/9457240.html
總結
以上是生活随笔為你收集整理的无监督学习:从基本概念到四种实现模型的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: jquery-1 jquery几个小实
- 下一篇: War包与配置文件分离