大数据 深度 分页_机器学习、深度学习、大数据 ?傻傻分不清楚?
? ? ? 提起機(jī)器學(xué)習(xí)四個(gè)字,不知你的腦海中是否會(huì)有一絲印象?畢竟身處信息時(shí)代,在日常生活中,無論通過什么媒介,接觸到這個(gè)名詞概念的機(jī)會(huì)還是挺大的。與之類似,還有以下這些名詞概念:數(shù)據(jù)分析、數(shù)據(jù)挖 掘、深度學(xué)習(xí)、人工智能、大數(shù)據(jù)等等。這些概念都是什么意思?都是做什么的?有什么價(jià)值?最重要的是,他們之間的關(guān)聯(lián)關(guān)系以及區(qū)別是什么呢?
? ? ? 就我個(gè)人而言,對這些名詞概念也僅僅局限于聽說過而已,傻傻分不清楚。而且理解水平大概還是停留在這樣的一個(gè)層次:【注:個(gè)人理解,僅供參考】
? ? ? 1、這些都是對海量數(shù)據(jù)進(jìn)行操作的,所謂大數(shù)據(jù),數(shù)據(jù)量肯定小不了。
? ? ? 2、數(shù)據(jù)分析,對數(shù)據(jù)進(jìn)行建模,從不同緯度分析數(shù)據(jù),得到有價(jià)值的結(jié)論。
? ? ? 3、數(shù)據(jù)挖掘,大學(xué)時(shí)期王老師講過一些,不過早已經(jīng)還給他了。不過從字面意思不難理解,往深了挖嘛,在表面數(shù)據(jù)的基礎(chǔ)上通過科學(xué)方法,探尋深層次的數(shù)據(jù)關(guān)系以及暗藏的規(guī)律,將數(shù)據(jù)的隱含價(jià)值(比如發(fā)展趨勢)得以展示。
? ? ? 4、至于深度學(xué)習(xí)和機(jī)器學(xué)習(xí),以前了解一點(diǎn),只記得深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)具體分支,主要邏輯是利用計(jì)算機(jī)算法進(jìn)行建模運(yùn)算,將得到的結(jié)果再次作為初始數(shù)據(jù)源,進(jìn)行迭代,最終得到最理想化的數(shù)據(jù)理論或結(jié)果。最直白的例子來說,就是剛洗完的衣服,滿是泡沫,再進(jìn)行一次次的循環(huán)漂洗,直到你覺得涮干凈了。
? ? ? 5、人工智能,直觀感受就是例如機(jī)器人,利用計(jì)算機(jī)算法服務(wù)于社會(huì)生產(chǎn)生活,同時(shí)具有自主學(xué)習(xí)演化的能力,貌似和上面的機(jī)器學(xué)習(xí)有重合點(diǎn)。
? ? ? 6、大數(shù)據(jù),我覺得這個(gè)概念不應(yīng)該具體指向某一個(gè)功能,而是應(yīng)該指向一個(gè)行業(yè)、產(chǎn)業(yè)的生態(tài)圈,可以說,上面的幾個(gè)概念都可以理解為大數(shù)據(jù)。至于說大數(shù)據(jù)就是大量的數(shù)據(jù)這一觀點(diǎn),沒毛病,但是未免有點(diǎn)狹隘,應(yīng)該更寬泛一點(diǎn)。
? ? ? 我最開始知道大數(shù)據(jù)是在剛畢業(yè)那年,第一印象也是大數(shù)據(jù)就是海量數(shù)據(jù)的處理,涉及到的一些技術(shù)例如Hadoop、HBase、Spark等等,當(dāng)時(shí)還在王府井的書店買本書,照著在本地Vmware搭建了一套Hadoop分布式環(huán)境接觸一下,當(dāng)時(shí)大數(shù)據(jù)這個(gè)概念炒的很火,只不過后來沒在繼續(xù)研究,畢竟不是主要的工作方向。后來這兩年又新興起了人工智能、機(jī)器學(xué)習(xí)等概念。之前總感覺這些東西好像是一夜之間冒出來似的,很陌生,其實(shí)只是之前沒有接觸到的原因,你不知道并不代表之前它不存在,天外有天嘛。無論是社會(huì)炒作也好,還是他們自身彪悍也罷,作為信息時(shí)代的一員,對其有一個(gè)系統(tǒng)性的認(rèn)識,擴(kuò)展下視野,還是很有必要的,而且對于后續(xù)的學(xué)習(xí)理解也有著指導(dǎo)意義,磨刀不誤砍柴工。否則可能就真的落后于時(shí)代了。那么接下來,就和我一起,來學(xué)習(xí)了解、認(rèn)識這些新朋友吧。
前面已經(jīng)提到過,困惑主要有以下兩點(diǎn):?
??? ??1、每一個(gè)名詞具體的解釋。?
? ? ? 2、它們之間的關(guān)系以及區(qū)別。?
? ? ? 接下來就通過查閱資料,然后再進(jìn)行理解總結(jié)的方式來進(jìn)行吧。雖然最后很有可能,上面的我的自行理解要被啪啪打臉了,不過,那又有何妨呢?
★參考文章一:
標(biāo)題:科普:大數(shù)據(jù)、人工智能、機(jī)器學(xué)習(xí)與深度學(xué)習(xí)都是什么?有什么關(guān)系?
鏈接:https://blog.csdn.net/zw0pi8g5c1x/article/details/80768132
內(nèi)容1、大數(shù)據(jù)
內(nèi)容2、人工智能
??? ??人工智能是計(jì)算機(jī)科學(xué)的一個(gè)分支,目的是開發(fā)一種擁有智能行為的機(jī)器。
內(nèi)容3、機(jī)器學(xué)習(xí)?
? ? ? 機(jī)器學(xué)習(xí)是一門人工智能的科學(xué),該領(lǐng)域的主要研究對象是人工智能,特別是如何在經(jīng)驗(yàn)學(xué)習(xí)中改善具體算法的性能,是對能通過經(jīng)驗(yàn)自動(dòng)改進(jìn)的計(jì)算機(jī)算法不斷優(yōu)化性能的研究。
? ? ? ??關(guān)鍵詞:算法、經(jīng)驗(yàn)、性能
? ? ?機(jī)器學(xué)習(xí)是使數(shù)據(jù)通過算法構(gòu)建出模型,然后對模型性能進(jìn)行評估,評估后的指標(biāo),如果達(dá)到要求就用這個(gè)模型測試新數(shù)據(jù),如果達(dá)不到要求就要調(diào)整算法重新建立模型,再次進(jìn)行評估,如此循環(huán)往復(fù),最終獲得滿意結(jié)果。
下面再擴(kuò)展一點(diǎn)機(jī)器學(xué)習(xí)的一點(diǎn)知識:
? ? ? 機(jī)器學(xué)習(xí)的任務(wù):
? ? ? ? ? ? 機(jī)器學(xué)習(xí)基于數(shù)據(jù)并以此獲取新知識、技能。它的任務(wù)有很多,分類是其基本任務(wù)之一。
? ? ? 分類:
? ? ? ? ? ? 將新數(shù)據(jù)劃分到合適的類別中,一般用于類別型的目標(biāo)特征,如果目標(biāo)特征為連續(xù)型,則往往采用回歸方法。回歸,是對新目標(biāo)特征進(jìn)行預(yù)測,是機(jī)器學(xué)習(xí)中使用非常廣泛的法之一.
? ? ? 分類和回歸:
? ? ? ? ? ? 都是先根據(jù)標(biāo)簽值或目標(biāo)值建立模型或規(guī)則,然后利用這些帶有目標(biāo)值的數(shù)據(jù)形成的模型或規(guī)則,對新數(shù)據(jù)進(jìn)行識別或預(yù)測。這兩種方法都屬于監(jiān)督學(xué)習(xí)。與監(jiān)督學(xué)習(xí)相對是無監(jiān)督學(xué)習(xí),無監(jiān)督學(xué)習(xí)不指定目標(biāo)值或預(yù)先無法知道目標(biāo)值,它可以將把相似或相近的數(shù)據(jù)劃分到相同的組里,聚類就是解決這一類問題的方法之一。
除了監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)這兩種最常見的方法外,還有半監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等方法,這里我們就不展開了,下圖展示了這些基本任務(wù)間的關(guān)系。
內(nèi)容4、深度學(xué)習(xí)
? ? ? 深度學(xué)習(xí)解決的核心問題之一就是自動(dòng)地將簡單的特征組合成更加復(fù)雜的特征,并利用這些組合特征解決問題。深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)分支,它除了可以學(xué)習(xí)特征和任務(wù)之間的關(guān)聯(lián)以外,還能自動(dòng)從簡單特征中提取更加復(fù)雜的特征。
內(nèi)容5、關(guān)系與區(qū)分:
- 大數(shù)據(jù) ? ? ?是人工智能的基礎(chǔ)。
- 機(jī)器學(xué)習(xí) ? 是人工智能的核心,是使機(jī)器具有類似人的智能的根本途徑,是使大數(shù)據(jù)轉(zhuǎn)變?yōu)橹R或生產(chǎn)力的工具。
- 機(jī)器學(xué)習(xí) ? 要以大數(shù)據(jù)量? 為基礎(chǔ),發(fā)掘其中蘊(yùn)含的有用信息。其處理的數(shù)據(jù)越多,機(jī)器學(xué)習(xí)就越能體現(xiàn)出優(yōu)勢,如語言識別、圖像識別、天氣預(yù)測等等。
- 深度學(xué)習(xí)? ?是機(jī)器學(xué)習(xí)的一個(gè)分支,能夠自動(dòng)地將簡單的特征組合成更加復(fù)雜的特征,因?yàn)楫吘箤C(jī)器學(xué)習(xí)來說,特征提取不是一件簡單的事情。
- 人工智能? 是一類非常廣泛的問題,機(jī)器學(xué)習(xí)是解決這類問題的一個(gè)重要手段,深度學(xué)習(xí)則是機(jī)器學(xué)習(xí)的一個(gè)分支。在很多人工智能問題上,深度學(xué)習(xí)的方法突破了傳統(tǒng)機(jī)器學(xué)習(xí)方法的瓶頸,推動(dòng)了人工智能領(lǐng)域的快速發(fā)展.。
擴(kuò)展內(nèi)容:如何選擇合適算法:
? ? ? 當(dāng)我們接到一個(gè)數(shù)據(jù)分析或挖掘的任務(wù)或需求時(shí),如果希望用機(jī)器學(xué)習(xí)來處理,首要任務(wù)是根據(jù)任務(wù)或需求選擇合適算法,選擇哪種算法較合適?分析的一般步驟為:
? ? ? 充分了解數(shù)據(jù)及其特性,有助于我們更有效地選擇機(jī)器學(xué)習(xí)算法。采用以上步驟在一定程度上可以縮小算法的選擇范圍,使我們少走些彎路,但在具體選擇哪種算法方面,一般并不存在最好的算法或者可以給出最好結(jié)果的算法,在實(shí)際做項(xiàng)目的過程中,這個(gè)過程往往需要多次嘗試,有時(shí)還要嘗試不同算法。不過先用一種簡單熟悉的方法,然后,在這個(gè)基礎(chǔ)上不斷優(yōu)化,時(shí)常能收獲意想不到的效果。
=>綜上個(gè)人總結(jié):
? ? ? 人工智能是一個(gè)大的生態(tài)面,也可以說是個(gè)行業(yè),這個(gè)行業(yè)給我們生活提供了很大的便利,比如無人駕駛、語音識別等,這些是怎么實(shí)現(xiàn)的呢?要用到機(jī)器學(xué)習(xí)的技術(shù),使用機(jī)器學(xué)習(xí)通過大量數(shù)據(jù)的算法訓(xùn)練【注:看來原文是把大數(shù)據(jù)作為大數(shù)據(jù)量、海量數(shù)據(jù)來理解的】構(gòu)建模型。但是機(jī)器學(xué)習(xí)有不足之處,那就是對特征的提取并不簡單。在一些復(fù)雜問題上,要花費(fèi)大量時(shí)間精力通過人工的方式設(shè)計(jì)有效的特征集合,所以從機(jī)器學(xué)習(xí)延伸出深度學(xué)習(xí)的分支來彌補(bǔ)了這個(gè)不足。
? ? ? 總得來說,這篇文章對人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)的解釋我還是很滿意的,清晰了然。但是他把大數(shù)據(jù)直接作為大數(shù)據(jù)量來解釋,用于闡釋機(jī)器學(xué)習(xí)的基礎(chǔ),這一點(diǎn)我覺得還是有點(diǎn)太狹隘,可能文章的重點(diǎn)在于機(jī)器學(xué)習(xí)而不是大數(shù)據(jù)的原因吧,就把大數(shù)據(jù)一筆帶過了。文章中也擴(kuò)展介紹了一點(diǎn)別的知識,比如機(jī)器學(xué)習(xí)本身的內(nèi)容、算法的選擇等,可以作為具體了解這項(xiàng)技術(shù)的入門資料。
★參考文章二:
標(biāo)題:知乎:數(shù)據(jù)挖掘與數(shù)據(jù)分析的主要區(qū)別是什么?
鏈接:https://www.zhihu.com/question/20127962
? ? ? ??排在首位的回答獲贊最多,我看了下覺得說的很不錯(cuò),也沒什么難理解的。版權(quán)原因無法復(fù)制截圖,這里我口述一下作者的意思,大致是這樣的:
? ? ? ??數(shù)據(jù)分析:一般目的性比較明確,想要從數(shù)據(jù)集中分析出想要的結(jié)果。重點(diǎn)是觀察數(shù)據(jù),需要人工 ?建模。
? ? ? ??數(shù)據(jù)挖掘:就是從海量的數(shù)據(jù)中找到其中暗含的隱藏的規(guī)則關(guān)系,可以將發(fā)現(xiàn)的規(guī)則關(guān)系直接應(yīng)用到新數(shù)據(jù)樣本的預(yù)測,直接自動(dòng)完成了數(shù)學(xué)建模。
作者也舉了個(gè)簡單的例子:
? ? ? ? 有一些人總是不及時(shí)向電信運(yùn)營商繳錢,如何發(fā)現(xiàn)它們?
? ? ? ? 數(shù)據(jù)分析:通過對數(shù)據(jù)的觀察,我們發(fā)現(xiàn)不及時(shí)繳費(fèi)人群里的貧困人口占82%。所以結(jié)論是收入低的人往往會(huì)繳費(fèi)不及時(shí)。結(jié)論就需要降低資費(fèi)。
? ? ? ? 數(shù)據(jù)挖掘:通過編寫好的算法自行發(fā)現(xiàn)深層次的原因。原因可能是,家住在五環(huán)以外的人,由于環(huán)境偏遠(yuǎn)不及時(shí)繳費(fèi)。結(jié)論就需要多設(shè)立一些營業(yè)廳或者自助繳費(fèi)點(diǎn)。
=>小結(jié):
? ? ? ? 其實(shí),僅從字面意思也不難理解二者的側(cè)重點(diǎn)是不同的,沒什么難理解的地方。一個(gè)側(cè)重分析,就會(huì)有分析出的結(jié)論。一個(gè)側(cè)重挖掘,側(cè)重于探尋未知。這兩者也是需要大量的數(shù)據(jù)樣本集的,就好比做統(tǒng)計(jì),樣本量都不夠,得出的結(jié)論怎么能夠說服人呢?
? ? ? ? 寫到這里,我們也注意到了,無論哪一種技術(shù),還是理念,貌似都離不開一個(gè)前提,就是要有海量的數(shù)據(jù)集作為數(shù)據(jù)支撐,即體現(xiàn)了大數(shù)據(jù)的量大的特性,但是這些技術(shù)、理念不都是作為工具去處理生活中的問題的嗎?什么問題呢?新時(shí)期的大量數(shù)據(jù)導(dǎo)致的傳統(tǒng)常用的一般方法、工具無法滿足高效處理進(jìn)而得出結(jié)果用于生產(chǎn)生活的問題。所以,我在本文開頭就認(rèn)為,大數(shù)據(jù)不應(yīng)只是指數(shù)據(jù)量大,數(shù)據(jù)范圍大,更應(yīng)該指信息時(shí)代產(chǎn)生的海量數(shù)據(jù)導(dǎo)致的一系列社會(huì)生產(chǎn)生活問題以及對問題的探究、處理過程的研究發(fā)展。從而衍生發(fā)展出了這些相關(guān)技術(shù)、概念理論去實(shí)踐、驗(yàn)證、解決。(這里并不是求證理解觀點(diǎn)的對錯(cuò),畢竟是理解類的問題,因人而異,有差異很正常。)所以,這個(gè)大數(shù)據(jù)的概念我覺得是一個(gè)虛的、寬泛的概念,類似的人工智能也是一個(gè)虛擬的概念,很明顯,大數(shù)據(jù)的層次范圍應(yīng)該在人工智能之上。對于大數(shù)據(jù)這一類的概念,了解大致方向,對個(gè)人認(rèn)識有指引作用即可,不必較真去深究,重點(diǎn)還是應(yīng)該放在機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等這一類具體技術(shù)、方法的理解上來,因?yàn)樗鼈儾攀墙鉀Q大數(shù)據(jù)問題的具體實(shí)現(xiàn)、應(yīng)用的關(guān)鍵。
? ? ? 如果仍然對大數(shù)據(jù)的理解有疑惑,可以參考以下百度百科的解釋:
接下來,有必要來看下數(shù)據(jù)分析、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)它們之間的橫向聯(lián)系:
★參考文章三:
相關(guān)文章鏈接:?
http://innovaleur.com/the-data-science-puzzle-explained/ 【首選推薦,可用chrome翻譯閱讀】
https://www.zhihu.com/question/20954873
先看下圖:
Artificial Intelligence? 人工智能
Machine Learning? 機(jī)器學(xué)習(xí)
Deep Learning ? 深度學(xué)習(xí) ? ? ? ? ??
Data Mining? 數(shù)據(jù)挖掘 ? ? ? ?
Data Science 數(shù)據(jù)科學(xué)
=>參考文章內(nèi)容總結(jié)概括:
? ? ? 機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘是有很大一部分的交叉地帶的,二者有著復(fù)雜的關(guān)系:數(shù)據(jù)挖掘是一個(gè)過程,在此過程中,機(jī)器學(xué)習(xí)算法被用作工具來提取數(shù)據(jù)集中保存的潛在有價(jià)值的模式。
? ? ? 機(jī)器學(xué)習(xí):
? ? ? ? ? ? ??機(jī)器學(xué)習(xí)本質(zhì)上是跨學(xué)科的,并且采用了計(jì)算機(jī)科學(xué),統(tǒng)計(jì)學(xué)和人工智能等領(lǐng)域的技術(shù)。? ? ? ??
? ? ? ? ? ? ? 機(jī)器學(xué)習(xí)研究的主要產(chǎn)物是算法,它可以根據(jù)經(jīng)驗(yàn)自動(dòng)促進(jìn)改進(jìn)算法,這些算法可應(yīng)用于各種不同的領(lǐng)域。
? ? ? 數(shù)據(jù)挖掘:
? ? ? ? ? ? ??是一門交叉性很強(qiáng)的學(xué)科,可以用到機(jī)器學(xué)習(xí)算法以及傳統(tǒng)統(tǒng)計(jì)的方法,最終的目的是要從數(shù)據(jù)中挖掘到需要的內(nèi)容,從而指導(dǎo)人們的活動(dòng)。數(shù)據(jù)挖掘的重點(diǎn)在于算法的應(yīng)用,而不是算法本身,用何種算法并不是很重要,關(guān)鍵是能夠滿足實(shí)際應(yīng)用背景。而機(jī)器學(xué)習(xí)則偏重于算法本身的設(shè)計(jì)。
? ? ? ? ———————————-
? ? ? ? 該文中其它相關(guān)內(nèi)容擴(kuò)展:
? ? ? ? ?深度學(xué)習(xí):
? ? ? ??? ? ? 它是應(yīng)用深度神經(jīng)網(wǎng)絡(luò)技術(shù)(即具有多個(gè)隱藏層的神經(jīng)網(wǎng)絡(luò)體系結(jié)構(gòu))來解決? 問題的過程。深度學(xué)習(xí)就像數(shù)據(jù)挖掘一樣是一個(gè)過程,采用深度神經(jīng)網(wǎng)絡(luò)架構(gòu),屬? 于機(jī)器學(xué)習(xí)算法的特定類型。深度學(xué)習(xí)可以通過其他流程和工具來幫助解決問題,從而為數(shù)據(jù)科學(xué)提供了非常多的幫助。從這種角度來看,深度學(xué)習(xí)是對數(shù)據(jù)科學(xué)領(lǐng)域非常有價(jià)值的補(bǔ)充。
? ? ? ? 人工智能:
? ? ? ??? ? ? 原文作者大意:作者認(rèn)為這個(gè)概念是隨著時(shí)間的推進(jìn),在不同階段有著不同的理解的。人工智能是一個(gè)準(zhǔn)繩,一個(gè)移動(dòng)的目標(biāo),一個(gè)無法實(shí)現(xiàn)的目標(biāo)。每當(dāng)我們踏上通往AI成就的道路時(shí),這些成就似乎都會(huì)以某種方式轉(zhuǎn)化為其他事物。
=>個(gè)人看法:
? ? ? ? 這篇文章中對數(shù)據(jù)挖掘和數(shù)據(jù)和機(jī)器學(xué)習(xí)的區(qū)別關(guān)系描述的不錯(cuò),直觀描述了各自的側(cè)重點(diǎn),一個(gè)側(cè)重算法設(shè)計(jì),一個(gè)側(cè)重算法應(yīng)用。但是該文中擴(kuò)展的內(nèi)容,我覺得不滿意,由于是機(jī)翻,可能有差別。感覺作者只是描述了相關(guān)概念的特性,沒有點(diǎn)出本質(zhì)性的內(nèi)容。所以,上面內(nèi)容擴(kuò)展我只記錄了深度學(xué)習(xí)和人工智能的段落。深度學(xué)習(xí)這一段話,沒有什么特別新穎的觀點(diǎn),基本和前文的介紹一致。人工智能這一段話,也只是表達(dá)了一個(gè)對其理解是隨著時(shí)間推移而不斷變化的特點(diǎn),沒有介紹AI的內(nèi)容,所以我認(rèn)為在這些方面此文描述的有些不理想。
? ? ? ??綜上,通過對這幾個(gè)概念的闡述,相信你對這些所謂的名詞術(shù)語已經(jīng)有了一個(gè)大致的了解,最起碼不會(huì)再傻傻分不清楚了吧!這讓我想起了一件往事,就是在大學(xué)期末考試的時(shí)候,計(jì)算機(jī)網(wǎng)絡(luò)、操作系統(tǒng)的這一類試卷,總是會(huì)有一種題型叫做名詞解釋,讓你回答解釋一些專有名詞。當(dāng)時(shí)真是痛苦,因?yàn)橛憛挶痴b這些東西,其實(shí),還是一個(gè)用心不用心的問題,用心去思考,就會(huì)有自己的想法,從自己的思維去嘗試?yán)斫狻7駝t,只能是單純的機(jī)械式的重復(fù)背誦記憶,并沒有真正的掌握相關(guān)知識。
? ? ? ??通過這次梳理吧,最起碼腦子里不再是一團(tuán)漿糊了,對各自有了明確的概念認(rèn)識,所以我認(rèn)為這次梳理還是很有必要的。如果你對文中觀點(diǎn)有不同意見或者理解,歡迎留言交流,若發(fā)現(xiàn)錯(cuò)誤之處還望批評指正。
注:文中圖片來源于網(wǎng)絡(luò)截圖!
總結(jié)
以上是生活随笔為你收集整理的大数据 深度 分页_机器学习、深度学习、大数据 ?傻傻分不清楚?的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python数组排序sort_详解pyt
- 下一篇: android复杂列表滑动卡顿,Andr