自学机器学习、深度学习、人工智能学习资源推大聚合
想要解決如何自學(xué)機(jī)器學(xué)習(xí)、深度學(xué)習(xí)和人工智能這一問題,首先要了解三個概念以及它們之間的關(guān)系。
人工智能:人工智能英文縮寫為AI,它是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。人工智能是計(jì)算機(jī)科學(xué)研究領(lǐng)域的一個重要分支,又是眾多學(xué)科的一個交叉學(xué)科,它企圖了解智能的實(shí)質(zhì),并生產(chǎn)出一種新的能以人類智能相似的方式做出反應(yīng)的智能機(jī)器,該領(lǐng)域的研究包括語音識別、圖像識別、機(jī)器人、自然語言處理、智能搜索和專家系統(tǒng)等等。這種智能是從何而來的?這就要講到下一層——機(jī)器學(xué)習(xí)。
機(jī)器學(xué)習(xí):機(jī)器學(xué)習(xí)是人工智能領(lǐng)域的一個小分支。機(jī)器學(xué)習(xí)專門研究計(jì)算機(jī)怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獲取新的知識或技能,重新組織已有的知識結(jié)構(gòu)使之不斷改善自身的性能。機(jī)器學(xué)習(xí)最基本的做法是使用算法來解析數(shù)據(jù)、從中學(xué)習(xí),然后對真實(shí)世界中的事件做出決策和預(yù)測。
深度學(xué)習(xí):深度學(xué)習(xí)就是一種實(shí)現(xiàn)機(jī)器學(xué)習(xí)的技術(shù)。深度學(xué)習(xí)是學(xué)習(xí)樣本數(shù)據(jù)的內(nèi)在規(guī)律和表示層次,它的最終目標(biāo)是讓機(jī)器能夠像人一樣具有分析學(xué)習(xí)能力,能夠識別文字、圖像和聲音等數(shù)據(jù)。深度學(xué)習(xí)使得機(jī)器學(xué)習(xí)能夠?qū)崿F(xiàn)眾多的應(yīng)用,并拓展了人工智能的領(lǐng)域范圍。但與機(jī)器學(xué)習(xí)不同,深度學(xué)習(xí)是利用深度的神經(jīng)網(wǎng)絡(luò),將模型處理得更為復(fù)雜,從而使模型對數(shù)據(jù)的理解更加深入。
簡要地用一張圖解釋它們的關(guān)系:
對它們的學(xué)習(xí)建議遵循這樣的順序:入門課程->框架研究->方向選擇->實(shí)戰(zhàn)訓(xùn)練。
按照這個順序,接下來推薦一些我認(rèn)為值得放在收藏夾的自學(xué)網(wǎng)站:
l 網(wǎng)課系列:基礎(chǔ)+應(yīng)用
l 筆記系列
l 工具系列
l 實(shí)戰(zhàn)系列
網(wǎng)課系列
——基礎(chǔ)篇
李宏毅的機(jī)器學(xué)習(xí)中文課程——臺灣大學(xué)李宏毅的講課風(fēng)格風(fēng)趣幽默,風(fēng)格獨(dú)樹一幟,且用中文進(jìn)行授課,不少人會選擇它作為機(jī)器學(xué)習(xí)的入門課程。這門課程重點(diǎn)講解了深度學(xué)習(xí),可以作為進(jìn)階機(jī)器學(xué)習(xí)的開山斧。目前官網(wǎng)更新至2021春季課程。
吳恩達(dá)的機(jī)器學(xué)習(xí)課程——機(jī)器學(xué)習(xí)經(jīng)典課程之一,課程廣泛介紹機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘和模式識別等內(nèi)容,內(nèi)容覆蓋全面,在Coursera上可以找到課程內(nèi)容,且16w人打出了4.9/5.0的超高分。這門課的特點(diǎn)是它側(cè)重于概念理解而不是數(shù)學(xué),即使有數(shù)學(xué)推導(dǎo)與公式也并不復(fù)雜。
貪心科技的人工智能與機(jī)器學(xué)習(xí)實(shí)戰(zhàn)課程——作為AI教育獨(dú)角獸公司貪心的機(jī)器學(xué)習(xí)基礎(chǔ)課程,適合用來夯實(shí)AI基礎(chǔ)。課程講解覆蓋全面,包含所有核心機(jī)器學(xué)習(xí)算法,且每一項(xiàng)技術(shù)都配備了來自醫(yī)療、生物、社會科學(xué)等十幾個不同領(lǐng)域的實(shí)戰(zhàn)案例。課程的一大特色是實(shí)用性強(qiáng),學(xué)完后即可應(yīng)用到工作或科研項(xiàng)目中。在貪心科技官網(wǎng)可以報名該課程。
李文哲:人工智能和知識圖譜領(lǐng)域?qū)<摇T谓鹑诳萍吉?dú)角獸公司的首席科學(xué)家、美國亞馬遜的高級工程師,先后負(fù)責(zé)過聊天機(jī)器人、量化交易、自適應(yīng)教育、金融知識圖譜等項(xiàng)目,并在AAAI、KDD、AISTATS等頂會上發(fā)表過15篇以上論文,并榮獲IAAI,IPDPS的最佳論文獎。
Jerry Yuan:人工智能、分布式系統(tǒng)、云計(jì)算專家。擁有14年人工智能、推薦系統(tǒng)、自然語言處理、數(shù)字圖像和視頻處理項(xiàng)目經(jīng)驗(yàn),主導(dǎo)多款核心推薦系統(tǒng)的研發(fā),曾師從中國科學(xué)院王守覺院士從事人臉識別研究、共同發(fā)表論文。在美國博士期間,主要研究NASA支持的基于人工智能的空間天氣預(yù)測項(xiàng)目。
主講老師的共同點(diǎn)是都具有不同領(lǐng)域的豐富的項(xiàng)目經(jīng)驗(yàn),會在課程中講解并帶領(lǐng)學(xué)員完成各類項(xiàng)目案例,實(shí)現(xiàn)理論與實(shí)戰(zhàn)的結(jié)合。
l 人工智能基礎(chǔ)
l 線性回歸
l 邏輯回歸
l 模型的泛化
l 樸素貝葉斯
l 決策樹
l 隨機(jī)森林
l 提升樹
l K-Means
l 主成分分析
l 神經(jīng)網(wǎng)絡(luò)
l 支持向量機(jī)
機(jī)器學(xué)習(xí)的基本思路是把現(xiàn)實(shí)生活中的問題抽象成數(shù)學(xué)模型,再利用數(shù)學(xué)方法對這個數(shù)學(xué)模型進(jìn)行求解,從而解決現(xiàn)實(shí)生活中的問題。
依據(jù)這個思路,課程將算法按照學(xué)習(xí)方式分類進(jìn)行學(xué)習(xí),監(jiān)督式學(xué)習(xí)講解了決策樹、樸素貝葉斯、K-Means等,無監(jiān)督學(xué)習(xí)有主成分分析等算法,接著運(yùn)用各章節(jié)學(xué)習(xí)的算法完成對配備的相應(yīng)真實(shí)案例的建模與求解練習(xí)。
與前兩個課程相比,貪心的機(jī)器學(xué)習(xí)基礎(chǔ)課程實(shí)戰(zhàn)性更強(qiáng),在每章的理論部分講解結(jié)束后,都會輔以相應(yīng)的案例進(jìn)行練習(xí)。如果對機(jī)器學(xué)習(xí)領(lǐng)域的研究方向選擇還有迷茫,可以在該課程的項(xiàng)目案例實(shí)踐中找到自己希望深入學(xué)習(xí)的方向。
就研究方向而言,當(dāng)前深度學(xué)習(xí)已經(jīng)在語音識別、圖像處理等方面取得了階段性的成果。從七八年前開始,也在自然語言處理領(lǐng)域出現(xiàn)深度學(xué)習(xí)的大批應(yīng)用。關(guān)于深度學(xué)習(xí)的方向可以參考學(xué)者們的相關(guān)文獻(xiàn)綜述與專著,例如圖靈獎大佬Yoshua Bengio的《Learning Deep Architectures
for AI》,提綱挈領(lǐng)地總結(jié)了深度學(xué)習(xí)架構(gòu)中學(xué)習(xí)算法的動機(jī)和原理,為相關(guān)的研究提供了理論指導(dǎo); 2012年的關(guān)于表示學(xué)習(xí)的綜述文章《Representation Learning: A Review and New Perspectives》,在CSDN上搜索文章關(guān)鍵詞也能找到綜述翻譯總結(jié)。
目前較為熱門的領(lǐng)域是NLP、CV和ML,在貪心的機(jī)器學(xué)習(xí)基礎(chǔ)課程中都可以找到相應(yīng)的經(jīng)典案例與前沿案例,以NLP和CV為例:
NLP項(xiàng)目案例:
情感分析項(xiàng)目:它的任務(wù)是給定一個文本,讓模型自動判斷這個文本所表達(dá)的情感是正面還是負(fù)面。通過完成這個項(xiàng)目,可以掌握中文分詞、分布式表示、詞向量、BERT的使用、句子向量等核心技術(shù)。還可以舉一反三解決各種文本分類問題,如新聞主題分類、垃圾郵件分類、意圖分類等。
聊天機(jī)器人中的意圖識別:意圖識別任務(wù)實(shí)際上就是識別出用戶的意圖是什么,該技術(shù)廣泛應(yīng)用在對話系統(tǒng)、機(jī)器人等場景中。在對話的場景中,基于文本的意圖識別是第一步,也是最核心的一步,幾乎任何的對話系統(tǒng)都包含意圖識別模塊,它是后續(xù)執(zhí)行對話的基礎(chǔ)。但實(shí)際上,意圖識別也是經(jīng)典文本分類任務(wù)。通過完成此項(xiàng)目,可以掌握SVM、詞向量、BERT、文本處理等技術(shù)。
CV項(xiàng)目案例:
基于PCA的人臉識別:結(jié)合PCA和分類技術(shù)來做精簡版的人臉識別程序,并分析通過PCA得出來的eigenface的形狀是如何的,涉及的知識模塊有PCA、特征臉(EigenFace)等。
基于神經(jīng)網(wǎng)絡(luò)的人臉識別:采用稍微復(fù)雜一點(diǎn)的人臉識別數(shù)據(jù),并通過搭建多層神經(jīng)網(wǎng)絡(luò)來識別人臉。在搭建過程中,會涉及到神經(jīng)元個數(shù)的原則、過擬合問題的考慮、圖像處理等一系列細(xì)節(jié)。 涉及的知識模塊有多層神經(jīng)網(wǎng)絡(luò)、PCA、圖像處理等。
貪心課程為線上授課模式,具體學(xué)習(xí)進(jìn)度自我安排,自由度高。平臺學(xué)習(xí)全程在線環(huán)境下操作,無需再下載任何軟件。貪心科技有一套完整的上課系統(tǒng),視頻、文字、圖片、編程、項(xiàng)目相結(jié)合,案例和項(xiàng)目都可以在云端平臺上完成,快速上手,告別被動學(xué)習(xí)。
貪心課程的授課特色是互動性高,有專業(yè)的算法科學(xué)家作為助教在線提供答疑和項(xiàng)目幫助,提交的項(xiàng)目練習(xí)作業(yè)會及時給予批注與糾錯,給出評語作為項(xiàng)目的整體學(xué)習(xí)建議,幫助學(xué)員快速進(jìn)步。
網(wǎng)課系列
——應(yīng)用篇
Udacity——Udacity的教育內(nèi)容包含人工智能、自動駕駛、自然語言處理、計(jì)算機(jī)視覺、AI量化投資、區(qū)塊鏈等,與 Google、Facebook、Amazon
等全球頂尖技術(shù)公司聯(lián)合開發(fā)了一系列的專業(yè)認(rèn)證項(xiàng)目,也與百度、騰訊、滴滴出行等中國前沿技術(shù)企業(yè)開發(fā)了一系列的課程項(xiàng)目。
項(xiàng)目示例:
AI for Healthcare(醫(yī)療AI):學(xué)習(xí)構(gòu)建、評估和集成能夠改變患者結(jié)果的預(yù)測模型。對2D和3D醫(yī)學(xué)圖像進(jìn)行分類和分割,然后使用電子健康記錄對患者結(jié)果進(jìn)行建模以優(yōu)化臨床試驗(yàn)決策。最后構(gòu)建算法來估計(jì)佩戴者在運(yùn)動時的脈搏率。
Marketing Analytics(營銷分析): 在課程中學(xué)習(xí)基礎(chǔ)數(shù)據(jù)技能,深入了解Google Analytics和營銷分析。學(xué)習(xí)使用Excel、Data Studio分析數(shù)據(jù)和構(gòu)建模型,并使用Tableau完成信息豐富的數(shù)據(jù)可視化。
Self Driving Car Engineer(自動駕駛汽車工程師):將計(jì)算機(jī)視覺和深度學(xué)習(xí)應(yīng)用于汽車問題,包括檢測車道線、預(yù)測轉(zhuǎn)向角等。接著學(xué)習(xí)傳感器融合,使用它來過濾來自傳感器陣列的數(shù)據(jù)以感知環(huán)境。有機(jī)會在Udacity的自動駕駛汽車上模擬運(yùn)行代碼。
筆記系列
機(jī)器學(xué)習(xí)基本概念筆記:包含學(xué)習(xí)經(jīng)驗(yàn)與技巧,該網(wǎng)站講得比較簡練,可以作為模型與算法的查閱筆記資料。詳見GitHub@CreateMoMo的筆記《Super Machine Learning Revision Notes》
李宏毅機(jī)器學(xué)習(xí)筆記:學(xué)習(xí)筆記的選擇主要是看前期聽了哪門課,李宏毅機(jī)器學(xué)習(xí)筆記可以配合之前推薦的李宏毅機(jī)器學(xué)習(xí)課程使用。詳見GitHub@datawhalechina的筆記《leeML-notes》。
工具系列
PyTorch:一個開源的Python機(jī)器學(xué)習(xí)庫
TensorFlow:一個端到端開源機(jī)器學(xué)習(xí)平臺
Keras:由Python編寫的開源人工神經(jīng)網(wǎng)絡(luò)庫
在官方網(wǎng)站上都能找到guide、resources甚至blog。
實(shí)戰(zhàn)系列
Kaggle——進(jìn)行數(shù)據(jù)發(fā)掘和預(yù)測競賽的在線平臺
如果你是從未獨(dú)立做過項(xiàng)目的新手,建議先選擇難度較低的練習(xí)賽,參考官方給出的方案,來對比改善自己的結(jié)果。
這里為你推薦幾篇文章,手把手教你入門經(jīng)典練習(xí)項(xiàng)目。
1.泰坦尼克之災(zāi)
中文教程:CSDN@寒小陽《機(jī)器學(xué)習(xí)系列(3)_邏輯回歸應(yīng)用之Kaggle泰坦尼克之災(zāi)》
英文教程:Kaggle官網(wǎng)項(xiàng)目“Titanic”
2.房價預(yù)測
教程:Kaggle官網(wǎng)項(xiàng)目“House Prices: Advanced Regression Techniques”
阿里天池——天池大數(shù)據(jù)競賽是由阿里巴巴集團(tuán)主辦,面向全球科研工作者的高端算法競賽。官網(wǎng)也開放海量數(shù)據(jù)和分布式計(jì)算資源,整理AI學(xué)習(xí)知識庫,開設(shè)新人學(xué)習(xí)賽,供新手在起步階段練習(xí)。
總結(jié)
以上是生活随笔為你收集整理的自学机器学习、深度学习、人工智能学习资源推大聚合的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 榕树贷提现一直没到账
- 下一篇: 国美易卡申请条件