如何看待深度学习门槛低的说法?
鏈接:https://www.zhihu.com/question/321031804
編輯:深度學(xué)習(xí)與計(jì)算機(jī)視覺
聲明:僅做學(xué)術(shù)分享,侵刪
作者:Serendipity
https://www.zhihu.com/question/321031804/answer/1331269931
做出這個(gè)推論是完全可以理解的
如果你正在自學(xué)深度學(xué)習(xí),那么很有可能像我一樣去學(xué)習(xí)一些在線課程,當(dāng)然可能也實(shí)操過一些小項(xiàng)目,學(xué)習(xí)這些課程或者跟隨教程去做實(shí)操可能會(huì)讓深度學(xué)習(xí)看起來很容易,個(gè)人覺得基于以下原因:
1.首先,這些課程中有很多都利用TensorFlow或Keras之類的框架來實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)和諸如梯度下降之類的優(yōu)化算法。我想,如果嘗試僅通過NumPy或SciPy實(shí)現(xiàn)這些,我們還是覺得容易嗎?再杠一點(diǎn),如果不用庫呢?
2.許多課程著重于對(duì)數(shù)學(xué)的“直觀”理解,而不是實(shí)際的核心知識(shí)。我曾經(jīng)也在朋友推薦下看過吳恩達(dá)(Andrew Ng)著名的ML課程,該課程在許多情況下都顯示了多個(gè)方程式的含義,而不是描述它們的推導(dǎo)方式,如果想要明白完整推導(dǎo)過程是需要自己親自思考的,但很多人卻不去做,這更使得DL看起來“容易”。(PS:此處絕無抹黑吳恩達(dá)老師的意思)
3.最后,很多人通常無法理解良好的數(shù)據(jù)集在深度學(xué)習(xí)和機(jī)器學(xué)習(xí)中的重要性。這意味著我們將需要花費(fèi)大量的時(shí)間來獲取,清理和表示或編碼數(shù)據(jù)。特征方面既要積累專業(yè)知識(shí)又要花費(fèi)大量時(shí)間去嘗試選擇,還是很不容易的。如果一直在使用來自在線存儲(chǔ)庫的準(zhǔn)備好的數(shù)據(jù)集來實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò),那么就可以理解為什么所有這些對(duì)DL學(xué)習(xí)者來說似乎都很“容易”的。培訓(xùn)建立適當(dāng)?shù)臄?shù)據(jù)集的工作量很多時(shí)候起碼要占一份完整工作的50%。而提出并理解這些結(jié)構(gòu)背后的內(nèi)容則更加困難。我們需要對(duì)概率論,信息論,微積分等有充分的了解,才能掌握其主要思想,而這些工作很多人一開始根本卻就沒有接觸過orz
到目前為止,深度學(xué)習(xí)在性能方面的進(jìn)步的確令人印象深刻。
我們作為該領(lǐng)域的新手,很多時(shí)候無法看到深度學(xué)習(xí)的全貌,然而卻因?yàn)槲覀儍e幸能夠在最先進(jìn)的領(lǐng)域中與最著名的研究人員做類似的工作而沾沾自喜,這就是我們的錯(cuò)誤之所在了。
就個(gè)人而言,我覺得嚴(yán)格的數(shù)學(xué)證明和統(tǒng)計(jì)學(xué)是必須的,并且我還想回到那些原始舊論文中找出其背后的原始想法與目的,而非僅僅是做一個(gè)快樂的調(diào)參黨。
作者:殺掉那只貓
https://www.zhihu.com/question/321031804/answer/813712320
嘲諷不解決問題。深度學(xué)習(xí)門檻真的很低,嚴(yán)謹(jǐn)一點(diǎn),門檻低是對(duì)比十年前機(jī)器學(xué)習(xí)領(lǐng)域。現(xiàn)實(shí)就是機(jī)器學(xué)習(xí)領(lǐng)域的問題,現(xiàn)在隨便用個(gè)開源包,數(shù)據(jù)包,基本上能超過 10 年前世界領(lǐng)先實(shí)驗(yàn)室的水平,而實(shí)際應(yīng)用對(duì)機(jī)器學(xué)習(xí)的要求卻沒有提高那么多。這是科技發(fā)展的客觀事實(shí),就好比沒計(jì)算器的時(shí)候在紙上開立方那得數(shù)學(xué)大牛,但計(jì)算器出現(xiàn)了,這門檻變低不是很正常嗎?現(xiàn)在不但工具先進(jìn)了,而且知識(shí)教授的途徑和方式也先進(jìn)了,那么多深度學(xué)習(xí)入門到精通,總有一個(gè)適合你學(xué)習(xí)。
當(dāng)然,繼續(xù)研究發(fā)展深度學(xué)習(xí)技術(shù)還是很不容易,但這是深造,跟門檻低沒關(guān)系啊。人類開發(fā)技術(shù)不就是為了降低門檻,讓專業(yè)人士變成大白菜,然后瘋狂競(jìng)爭(zhēng),導(dǎo)致新的技術(shù)產(chǎn)生。
作者:深度學(xué)習(xí)運(yùn)營(yíng)
https://www.zhihu.com/question/321031804/answer/2100813695
作為一個(gè)在這個(gè)行業(yè)工作了兩年的人,我覺得入門的門檻確實(shí)在降低,現(xiàn)在各種框架都非常好用了,也集成了眾多的功能,導(dǎo)致了入門的門檻非常低,但同時(shí)也導(dǎo)致了泥沙俱下。深度學(xué)習(xí)的應(yīng)用在落地的時(shí)候會(huì)有非常多的問題,例如現(xiàn)場(chǎng)環(huán)境、項(xiàng)目工期等等一些列問題,所以在深度學(xué)習(xí)的應(yīng)用開發(fā)中應(yīng)該做到快速部署,并且能夠有一個(gè)較好的模型表現(xiàn)。例如我們公司最近正在使用的百度BML平臺(tái),就能夠做到模型的快速迭代,并且訓(xùn)練好的模型能夠非常快速的部署,包括云部署、本地私有化部署。能夠提供SDK包,并且能夠做到自動(dòng)數(shù)據(jù)回流,使模型快速的迭代起來。
回到問題,深度學(xué)習(xí)的門檻確實(shí)是在降低,不斷有容易上手的框架出現(xiàn),并且現(xiàn)在也出現(xiàn)了例如百度BML這樣的一站式AI開發(fā)平臺(tái),能夠非常有效的讓大家快速上手,但從長(zhǎng)遠(yuǎn)角度來說,還是需要努力修煉自己的內(nèi)功,無論門檻高低與否。
作者:匿名用戶
https://www.zhihu.com/question/321031804/answer/1331319890
深度學(xué)習(xí)入門很簡(jiǎn)單,學(xué)習(xí)門檻很低,但本身的門檻并不低。
我本科的時(shí)候,最開始的研究方向是基于啟發(fā)式算法的運(yùn)籌優(yōu)化。做了大概有一年,讀了很多該領(lǐng)域的頂刊文章,在組會(huì)里分享等等,對(duì)于啟發(fā)式算法解運(yùn)籌優(yōu)化問題有了一個(gè)初步的理解,讀論文也越來越熟悉套路,但……你讓我用C++實(shí)現(xiàn)一個(gè)算法,不能說不會(huì),但可能要吭哧很久很久。
畢業(yè)設(shè)計(jì)因?yàn)檠芯可鲠t(yī)學(xué)圖像方向,選了基于深度學(xué)習(xí)的醫(yī)學(xué)圖像分割。在此前只跟著視頻用tensorflow寫過房?jī)r(jià)預(yù)測(cè)的基礎(chǔ)上,在數(shù)據(jù)集準(zhǔn)備完成的情況下,我僅僅用了一個(gè)星期就完成了從文獻(xiàn)閱讀、環(huán)境搭建、pytorch框架學(xué)習(xí)、算法實(shí)現(xiàn)、代碼調(diào)試到完成訓(xùn)練的一整套流程,完成了初代算法的實(shí)現(xiàn)。
深度學(xué)習(xí)學(xué)習(xí)門檻之所以低,是因?yàn)榭蚣艿拇嬖?。?shí)現(xiàn)算法的時(shí)候,網(wǎng)絡(luò)模型不會(huì)改了,百度一下“pytorch自定義網(wǎng)絡(luò)”;損失函數(shù)不會(huì)改了,百度一下“pytorch自定義損失函數(shù)”……等等,甚至不用google,墻內(nèi)關(guān)于現(xiàn)有框架的資源足夠解決大部分問題了。
但是你說這叫學(xué)習(xí)深度學(xué)習(xí)嗎?叫,也不叫。之所以叫,是因?yàn)槟愦_實(shí)在學(xué)深度學(xué)習(xí);之所以不叫,是因?yàn)檫@其實(shí)只是實(shí)現(xiàn)了一次深度學(xué)習(xí)。
早就不是改改網(wǎng)絡(luò)參數(shù)、損失函數(shù),隨便調(diào)調(diào)超參數(shù)就能玩轉(zhuǎn)深度學(xué)習(xí)的時(shí)代了。想真正學(xué)會(huì)深度學(xué)習(xí),只靠框架這么搞是遠(yuǎn)遠(yuǎn)不夠的。
作者:AIRobotics
https://www.zhihu.com/question/321031804/answer/2017954999
這就好比你認(rèn)得了汽車,坐過車之后說:“車不就是四個(gè)輪子兩張沙發(fā)嘛?!?真正深入研究后,至少我絲毫不覺得這個(gè)領(lǐng)域的門檻低。
上面有的回答說了,大廠提出了很多不錯(cuò)的模型/數(shù)據(jù)庫/封裝好的代碼。你可以輕易上github上clone一個(gè)項(xiàng)目的代碼就拿來用,同時(shí)由于AI這個(gè)名詞太多次出現(xiàn)在公眾視野,知識(shí)需求急劇上升,所以產(chǎn)生了很多淺層的基礎(chǔ)的學(xué)習(xí)資料。
DL作為一種工具,應(yīng)當(dāng)越易于使用越好,這是很多從業(yè)者推動(dòng)的,也是很多人覺得DL好學(xué)、簡(jiǎn)單的原因。但從research出發(fā),弄清楚每一個(gè)實(shí)現(xiàn)細(xì)節(jié),嚴(yán)格的推理和數(shù)學(xué)證明,或者是針對(duì)特定場(chǎng)景的一些經(jīng)驗(yàn)主義、煉丹技巧(tricks)是更重要的事。這些都是需要大量項(xiàng)目經(jīng)驗(yàn)和時(shí)間積累的。并且隨著人數(shù)增多,好的idea越來越難產(chǎn)出,愈發(fā)考驗(yàn)創(chuàng)造知識(shí)的能力。
大概按照我的認(rèn)知和給自己設(shè)的標(biāo)準(zhǔn),跑跑MNIST/ImageNet,學(xué)會(huì)ctrl c代碼算是會(huì)了helloworld;然后搭環(huán)境自己debug跑通,做些小修小補(bǔ)能算是入門了;能完全讀懂?dāng)?shù)十篇前沿的頂刊頂會(huì),然后提出一些新想法(不一定work)然后自己實(shí)現(xiàn)它,算是很了解了;等到自己能在頂會(huì)發(fā)個(gè)oral啥的,也勉強(qiáng)算是精通了;能獲得業(yè)內(nèi)的廣泛認(rèn)可,或是有三巨頭/kaiming那種劃時(shí)代成果的話,才算得上大家吧(我還是太菜了)
☆ END ☆
如果看到這里,說明你喜歡這篇文章,請(qǐng)轉(zhuǎn)發(fā)、點(diǎn)贊。微信搜索「uncle_pn」,歡迎添加小編微信「 woshicver」,每日朋友圈更新一篇高質(zhì)量博文。
↓掃描二維碼添加小編↓
總結(jié)
以上是生活随笔為你收集整理的如何看待深度学习门槛低的说法?的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 百度云ROM移植教程
- 下一篇: mysql分表id维护_MySQL分表自