无监督学习?Yann LeCun说:或许应该叫它预测性学习
新智元報道
來源:danrose
編輯:白峰
【新智元導讀】隨著機器學習的不斷發展,無監督學習在近年來備受關注。Yann LeCun 提出賦予無監督學習新的名字——預測性學習。
隨著機器學習的不斷發展,無監督學習在近年來備受關注。近日,有人提出賦予無監督學習新的名字——預測性學習。推崇這次改名的正是前些日子在推特「大火」的 Facebook 的首席 AI 科學家,Yann LeCun。
Yann LeCun 將「預測性學習」稱為「下一個 AI 前沿」。因為在過去的十年中,監督學習有著豐碩的成果。而接下來的十年,無監督學習,即預測性學習可能會變得越來越流行。
監督學習、無監督學習和強化學習:機器學習的三駕馬車
認識無監督學習的新名字之前,我們來看一看機器學習多樣的組成元素。最廣泛用于應用和業務用途的機器學習類別是監督學習。監督學習需要標記非常非常多的數據,也因此在給定情況下教給模型較為正確的答案。
無監督學習和監督學習恰恰相反,使用未標記的數據訓練 AI,通常僅用于對數據進行聚類和分組。無監督學習的質量自然不如監督學習。因此,近些年半監督學習也時常被褒獎。半監督學習可以看做監督學習和無監督學習的折中狀態。
機器學習中還有一個「重要的玩家」強化學習。強化學習主要用于實驗和研究案例,到目前為止在商業中使用不多。有科學家指出 AlphaGo 是一個很好的例子,通常通過加強學習來完成游戲模型的教學,但 Alphago 確切架構沒有公布,這僅僅是一種猜想。
昂貴且復雜的數據標記讓監督學習變得困難
去年,監督學習取得了長足的發展。例如在 GPU 上進行訓練,更多可用的標記訓練數據。以及一些技術進步,比如說 ReLU(神經網絡中最具成本效益的解決方案)。
但是獲取標簽數據仍然是一個問題。這是非常昂貴的,并且始終會有偏差的數據。偏差的數據會使模型產生偏差,因此開發者始終需要了解模型行為異常的極端情況。科學家們解決這個問題的方法是:如果可以避免使用帶標簽的數據,而改為使用無標簽的數據,則可以以更低的成本和更少的偏差機會去處理更多的數據。
如果將人類智慧與人工智能進行比較,人們意識到很多人類智慧是不受監督的。在我們了解的事物中,很少有學習示例可以教的。因此,即使監督學習給我們帶來了巨大的成就,它也有其局限性。無監督學習日益受到重視。
無監督學習(預測性學習)正在登上歷史舞臺
正如 YannLeCun 所說,無監督學習是「填補空白」。填補空白不僅僅是將相似的事物歸類,填補空白就像是想象。在訓練預測學習模型時,目的是了解當前的世界。
一個很好的例子是圖像完成問題。圖像不完整時,模型想「填補空白」。預測性學習可以做到這一點。
該模型可以預測上下文中可能缺少的內容。另一個非常好的例子是來自 OpenAI 的 GPT-3。GPT-3 是一種語言模型,未經大量數據訓練就可以接受訓練,并且在此基礎上再加上一點點監督學習,就可以擁有一個非常有效的模型。但是,這里預測性學習是模型是基于神經網絡的深度學習模型。較早的無監督模型不基于神經網絡。
「預測性學習」可能會改變我們的未來
過去,當需要一個解決方案時,我們通常會用監督學習去訓練模型。但是監督學習是昂貴的。無監督學習可以為我們提供一種有效的,非常有價值的方式去訓練模型,并得到預測性的結果。
拍攝廣告時,這可以被用于將多余的游客從我們的度假圖片或背景物體中刪除。它會填補很多地方的空白。另一方面,預測性學習還能用于檢測出何時出現異常情況。
GPT-3 的流行就展示了無監督學習,或者說預測性學習對于科技社會產生的巨大影響。我們有理由相信,正如 YannLeCun 所說,「預測性學習」將成為「下一個 AI 前沿」。
總結
以上是生活随笔為你收集整理的无监督学习?Yann LeCun说:或许应该叫它预测性学习的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 8年后再起波澜 上海小i机器人起诉苹果S
- 下一篇: 林洋能源:拟转让下属子公司股权及部分项目