一眼看清高科技,深度解析人工智能技术脉络
現(xiàn)在有非常多的大公司在做人工智能方面的研究,包括Google、IBM、Facebook、Apple、百度等,也有數(shù)不盡的小型創(chuàng)業(yè)團(tuán)隊(duì)進(jìn)入,使得人工智能方面變得熱鬧非凡。每一家公司都有自己的研究思路,也取得了不同程度的進(jìn)展,比如百度李彥宏就透露,百度大腦已經(jīng)相當(dāng)于2~3歲小孩的智力水平,而按照我們對(duì)自己人工智能系統(tǒng)的模擬測(cè)試結(jié)果,可以達(dá)到12歲中學(xué)生的智力水平,大幅度領(lǐng)先百度深度學(xué)習(xí)研究院。下邊在不泄露技術(shù)機(jī)密的前提下,簡(jiǎn)要分享我們?nèi)斯ぶ悄芟到y(tǒng)的設(shè)計(jì)思路與背后基于的原理。
?
1、文字與編程語(yǔ)言(視頻、圖片、文字與程序的結(jié)構(gòu)化分析)
1)文字的發(fā)明與價(jià)值
在介紹人工智能之前,我們首先來(lái)簡(jiǎn)單認(rèn)識(shí)一下“文字”。在人類(lèi)看來(lái),文字是人類(lèi)約定創(chuàng)造的視覺(jué)形式,可以說(shuō)文字是一個(gè)視覺(jué)系統(tǒng),它以最簡(jiǎn)單方式將視覺(jué)場(chǎng)景圖案再現(xiàn),并且富有便于口語(yǔ)聲音表達(dá)的特點(diǎn),因而更加清晰,可以反復(fù)閱讀,可以突破時(shí)間和空間的限制。
更準(zhǔn)確的說(shuō),文字使人類(lèi)突破口語(yǔ)受到時(shí)間和空間的限制,把時(shí)空的影像變化轉(zhuǎn)碼成視覺(jué)可見(jiàn)的符號(hào)系統(tǒng),并通過(guò)書(shū)面語(yǔ)的方式傳承下來(lái),使后人能通過(guò)間接的文字想象出畫(huà)面,了解歷史和學(xué)習(xí)技術(shù)經(jīng)驗(yàn),從而提高自己的智慧,發(fā)展科學(xué)技術(shù),并最終促使人類(lèi)能進(jìn)入有歷史記錄的文明社會(huì)。
2)編程語(yǔ)言與文字的區(qū)別
在了解完文字后,我們?cè)賮?lái)簡(jiǎn)單的看一下自然語(yǔ)言(文字)與計(jì)算機(jī)編程語(yǔ)言之間的區(qū)別。顯然,自然語(yǔ)言是更高級(jí)的編程語(yǔ)言,其每一個(gè)字都有特定的含義,在現(xiàn)實(shí)世界中映射非常龐大視覺(jué)影像,并且具備較高容錯(cuò)率的特點(diǎn),而現(xiàn)有的計(jì)算機(jī)編程語(yǔ)言是簡(jiǎn)單的命令序列與邏輯組合,本質(zhì)上說(shuō),這兩者之間差別巨大。
由于在計(jì)算機(jī)語(yǔ)言的內(nèi)在邏輯無(wú)法映射到現(xiàn)實(shí)事物,于是在計(jì)算機(jī)看來(lái),文字是人類(lèi)用來(lái)記錄語(yǔ)言的符號(hào)系統(tǒng),僅僅是符號(hào),沒(méi)有任何意義。于是,當(dāng)計(jì)算機(jī)識(shí)別到“樹(shù)”這個(gè)字時(shí),它沒(méi)有任何“樹(shù)”真實(shí)樣子、信息的概念與數(shù)據(jù),也就無(wú)法理解“樹(shù)”這個(gè)字的真正含義。
其實(shí),這也說(shuō)明計(jì)算機(jī)和現(xiàn)實(shí)的接口沒(méi)有打通,所以,人工智能的關(guān)鍵環(huán)節(jié)即為幫助計(jì)算機(jī)將符號(hào)與真實(shí)視覺(jué)影響之間建立聯(lián)系,即補(bǔ)全每一個(gè)詞語(yǔ)背后的真實(shí)對(duì)象數(shù)據(jù),填補(bǔ)計(jì)算機(jī)文字符號(hào)與現(xiàn)實(shí)影像數(shù)據(jù)之間的鴻溝。
現(xiàn)在技術(shù)突破方向是通過(guò)建立知識(shí)圖譜與事物組合圖譜,試圖將現(xiàn)實(shí)世界的景象與知識(shí)組織起來(lái)。當(dāng)然,這僅僅是第一步,只有將其與自然語(yǔ)言解析、視覺(jué)解析結(jié)合到一起時(shí),再結(jié)合大數(shù)據(jù)統(tǒng)計(jì),才能實(shí)現(xiàn)真正的突破。
?
2、人工智能發(fā)展限制因素的誤解
雖然基于現(xiàn)有計(jì)算機(jī)發(fā)展人工智能技術(shù)仍舊面臨或多或少的限制,但將其歸結(jié)于計(jì)算性能、編程方式等原因,顯然是不正確的,因?yàn)檫@些都可以基于現(xiàn)有技術(shù)來(lái)解決,下邊依次簡(jiǎn)要說(shuō)明。
1)計(jì)算機(jī)計(jì)算性能限制的誤解
許多人認(rèn)為,雖然現(xiàn)在處于科技發(fā)達(dá)的互聯(lián)網(wǎng)時(shí)代,但現(xiàn)有計(jì)算機(jī)的計(jì)算能力非常有限,如果要完成自然語(yǔ)言解析這種高海量計(jì)算的工程,或許只能依靠超級(jí)計(jì)算機(jī)、量子計(jì)算機(jī)、光子計(jì)算機(jī)、生物工程計(jì)算機(jī)等更先進(jìn)的技術(shù)解決。其實(shí)這種想法是不對(duì)的,因?yàn)樽约翰荒苷业浇鉀Q人工智能的解決方案,而將其歸咎于現(xiàn)有硬件性能低下,是一種錯(cuò)誤的邏輯。雖然計(jì)算能力的提升有助于更簡(jiǎn)單的解決人工智能問(wèn)題,但計(jì)算能力并非限制人工智能發(fā)展的核心問(wèn)題,而且計(jì)算能力可以靠大規(guī)模服務(wù)器集群有效解決。
2)現(xiàn)有編程方式與計(jì)算體制的誤解
許多人認(rèn)為,現(xiàn)有的計(jì)算機(jī)語(yǔ)言僅僅是簡(jiǎn)單的命令序列與邏輯集合,而自然語(yǔ)言解析所需要的編程方式注重的是視覺(jué)、聽(tīng)覺(jué)、嗅覺(jué)、觸覺(jué)、味覺(jué)等為一體的編程體制,因此其并不適合解決自然語(yǔ)言與人工智能方面的問(wèn)題,這也就意味著如果想高效的實(shí)現(xiàn)人工智能技術(shù),最好開(kāi)發(fā)出全新的編程模式,開(kāi)發(fā)一款全新的計(jì)算機(jī)架構(gòu)。
是的,我承認(rèn)如果能夠開(kāi)發(fā)出更加優(yōu)秀的編程體制,能夠?qū)⒄麄€(gè)系統(tǒng)的計(jì)算量降低超過(guò)50%,大幅度降低硬件、人力等技術(shù)設(shè)施的投入,從而使得整個(gè)過(guò)程的運(yùn)算更加高效,響應(yīng)速度提高一倍,但這并不意味著現(xiàn)有的編程體制解決不了所面臨的問(wèn)題。
雖然IBM公司已經(jīng)發(fā)布了基于人腦特征的全新計(jì)算架構(gòu),號(hào)稱基于此的新生態(tài)系統(tǒng)將為市場(chǎng)帶來(lái)高參數(shù)化的神經(jīng)模型,能形成類(lèi)人腦計(jì)算的基礎(chǔ)信息處理單位,以及具備對(duì)空間、時(shí)間和多模態(tài)化環(huán)境的識(shí)記、感知,或者是做出行動(dòng)的能力,從而讓下一代應(yīng)用在感知、行為和認(rèn)知方面的效率堪比人腦,但這種計(jì)算架構(gòu)仍不成熟,在現(xiàn)實(shí)使用過(guò)程中,仍面臨非常多的技術(shù)問(wèn)題。
?
3、深度學(xué)習(xí)與知識(shí)單元
1)深度學(xué)習(xí)
深度學(xué)習(xí)的原理是通過(guò)多層次的學(xué)習(xí)而得到對(duì)于原始數(shù)據(jù)的不同抽象層度的表示,進(jìn)而提高分類(lèi)和預(yù)測(cè)等任務(wù)的準(zhǔn)確性。即針對(duì)某一個(gè)“事物”,對(duì)于其圖像(或物體、聲音、嗅覺(jué)、觸覺(jué)、味覺(jué))進(jìn)行參量分解與組合,然后通過(guò)大量同類(lèi)事物來(lái)重復(fù)操作,從而驗(yàn)證每種參量(或參量組合)重要性(或?qū)哟涡?#xff09;,最終獲得一組識(shí)別該事物識(shí)別數(shù)據(jù)包的一種機(jī)制。
深度學(xué)習(xí)整個(gè)訓(xùn)練過(guò)程非常簡(jiǎn)單,以機(jī)器學(xué)會(huì)在圖片上識(shí)別狗為例,我們不需要人為事先給出狗的特征定義,只需要提供足夠的相關(guān)圖片,用以劃上一個(gè)大致的識(shí)別邊界,然后機(jī)器將所看到的圖像或圖片分解成10億多個(gè)不同的參量,對(duì)這些參量的層次、權(quán)重進(jìn)行概率統(tǒng)計(jì),并將這些參量按照其可能性進(jìn)行各種“組合”,并對(duì)這些組合的層次、權(quán)重進(jìn)行概率統(tǒng)計(jì),并最終形成識(shí)別數(shù)據(jù)包。
舉個(gè)簡(jiǎn)單例子,機(jī)器反復(fù)學(xué)習(xí)桃花的特征后,就會(huì)自己找到判定一朵桃花的方法,它會(huì)將這類(lèi)有顏色、有花瓣、有花蕊的物體自動(dòng)和花這個(gè)單詞聯(lián)系到一起,并最終形成一個(gè)特定的識(shí)別數(shù)據(jù)包,再依據(jù)這種“識(shí)別包的數(shù)據(jù)”,就可以從千萬(wàn)張圖片或視頻中識(shí)別出桃花來(lái)。
深度學(xué)習(xí)最大的特點(diǎn)是分層級(jí),即在進(jìn)行事物識(shí)別時(shí),由于事物的不同特征的重要性、空間位置、時(shí)間順序等是不同的,需要對(duì)事物特征建立層級(jí)來(lái)深度認(rèn)知事物,背后的理論在于,你應(yīng)當(dāng)有一種模式來(lái)反映想要學(xué)習(xí)的自然現(xiàn)象的層級(jí)。
借助這種分層級(jí)的特征識(shí)別提取機(jī)制,機(jī)器能夠像人的大腦一樣可以從多角度識(shí)別搜索目標(biāo),甚至可識(shí)別多樣且被扭曲的圖像,即當(dāng)圖像發(fā)生傾斜、倒置、扭曲時(shí),仍然具有一定的識(shí)別效果。
深度學(xué)習(xí)最終得到的是一個(gè)針對(duì)某一事物的數(shù)據(jù)識(shí)別包。當(dāng)然,這個(gè)數(shù)據(jù)識(shí)別包也存在局限,就比如衣服這類(lèi)物體很容易發(fā)生形變,機(jī)器通過(guò)學(xué)習(xí)雖然能夠?qū)W習(xí)判斷長(zhǎng)袖短袖等衣服類(lèi)型,然而形變過(guò)大必然降低識(shí)別概率,但即便是識(shí)別率較低的數(shù)據(jù)包,仍然具有價(jià)值。
2)三維建模
深度學(xué)習(xí)是一向基于信息提取的技術(shù),但產(chǎn)生人工智能需要的基礎(chǔ)“數(shù)據(jù)識(shí)別”,仍需要搭配另一套技術(shù)體系,即三維建模相關(guān)技術(shù),這是因?yàn)楝F(xiàn)實(shí)世界中的事物大多是三維的,因此在“數(shù)據(jù)識(shí)別包”提取的過(guò)程中,需要基于三維真實(shí)的事物。
最終,數(shù)據(jù)識(shí)別包要符合以下要求:
①?能夠滿足事物在不同空間位置、視角、動(dòng)作的識(shí)別機(jī)制,即具備在不同情況下識(shí)別概率的描述。
②?針對(duì)同一事物,在特定的視角之下,要具備柔性識(shí)別的數(shù)據(jù),比如可以提供99%、98%、97%……30%……1%等一系列識(shí)別概率的數(shù)據(jù)。
③?事物的意境展現(xiàn),即當(dāng)出現(xiàn)“蘋(píng)果”詞語(yǔ)時(shí),能夠迅速給出“蘋(píng)果”的各種普通立體圖,并支持各種簡(jiǎn)單操作。(畫(huà)面展現(xiàn))
由蘋(píng)果詞語(yǔ)映射出來(lái)的各種結(jié)果
?
3)知識(shí)單元
然而,深度學(xué)習(xí)與三維建模等技術(shù)僅僅是針對(duì)某一元素進(jìn)行深入分析的工具,能夠針對(duì)某一事物分層次的提取其特征庫(kù),并能夠基于此識(shí)別其它景象是否存在這一事物,這僅僅屬于“知識(shí)單元”模型中的一個(gè)必要部分。
因此,我們需要將深度學(xué)習(xí)技術(shù)輸出的結(jié)果構(gòu)建模型以使符合我們“知識(shí)單元”的范式要求,只有這樣,我們才能正確的使用這些數(shù)據(jù),從而實(shí)現(xiàn)后續(xù)“知識(shí)圖譜”、“事物組合圖譜”、“視覺(jué)解析引擎”、“語(yǔ)境解析引擎”等的構(gòu)建。
知識(shí)單元是我們搭建的一個(gè)基于事物自身相關(guān)屬性的知識(shí)組合,為了便于以后在知識(shí)單元基礎(chǔ)上進(jìn)行更深入的數(shù)據(jù)分析操作,知識(shí)單元所應(yīng)具備以下基礎(chǔ)功能:
① 物體“二維”、“三維”識(shí)別功能;
② 將文字符號(hào)與畫(huà)面建立連接的展現(xiàn)功能;
③ 物體多種名稱及“名稱與屬性”的對(duì)應(yīng)關(guān)系;
如果更詳細(xì)的話,知識(shí)單元在構(gòu)建時(shí)需要包含以下幾個(gè)特點(diǎn):
1、視覺(jué)識(shí)別方面,需要分層次化的特征識(shí)別體系。
在數(shù)據(jù)識(shí)別包方面,要形成一種分層次的識(shí)別數(shù)據(jù)包,不僅要識(shí)別出整個(gè)事物,也要提供識(shí)別事物某一部分的識(shí)別數(shù)據(jù)包,比如:識(shí)別一朵桃花,既要提供整個(gè)花朵的數(shù)據(jù)識(shí)別包,也要提供針對(duì)花瓣的數(shù)據(jù)識(shí)別包。
2、知識(shí)單元屬性方面,事物的屬性要做的盡可能全面,分類(lèi)要盡可能的精細(xì)化,這是后期在知識(shí)單元之間建立聯(lián)系的基礎(chǔ)。
3、知識(shí)單元的概念名稱、屬性表述可能有多種,需要詳細(xì)的羅列出來(lái),而且概念、屬性要與所對(duì)應(yīng)的視覺(jué)特性識(shí)別數(shù)據(jù)包形成一一對(duì)應(yīng)關(guān)系,這是后期自然語(yǔ)言理解的基礎(chǔ)。
4、識(shí)別數(shù)據(jù)包要具備還原功能,也即當(dāng)出現(xiàn)“桃花”這個(gè)詞時(shí),能夠提供桃花的標(biāo)準(zhǔn)圖(普通圖)。
5、知識(shí)單元中的相關(guān)識(shí)別數(shù)據(jù)包最好是基于三維真實(shí)事物的特征采樣,這樣的數(shù)據(jù)更加真實(shí)、自然,也更加有效。
6、知識(shí)單元中的元素包括:視覺(jué)識(shí)別數(shù)據(jù)包、聲音識(shí)別包、嗅覺(jué)識(shí)別包、觸覺(jué)識(shí)別包、味覺(jué)識(shí)別包,以及事物的各種概念、屬性、行為等文字特征信息。
7、基于統(tǒng)計(jì)學(xué)進(jìn)行優(yōu)化。當(dāng)我們搭建完知識(shí)單元的初級(jí)模型后,仍舊需要根據(jù)大規(guī)模數(shù)據(jù)統(tǒng)計(jì)的方法來(lái)逐步改善、優(yōu)化知識(shí)單元的設(shè)計(jì)模型,因此,在要建立數(shù)據(jù)自動(dòng)修改優(yōu)化機(jī)制。
8、識(shí)別數(shù)據(jù)包是一個(gè)空間范圍內(nèi)的識(shí)別結(jié)果,也即無(wú)論物體發(fā)生了變形、扭曲、拉伸、視角變換等一系列處理,仍能識(shí)別出來(lái),雖然識(shí)別成功率不同,但這些具備一定識(shí)別率的數(shù)據(jù)仍舊具備一定的價(jià)值。
9、知識(shí)單元必須帶有空間、時(shí)間、物體、聲音、觸覺(jué)、組合等一系列信息,也即這個(gè)單元是否具有空間屬性?是否具有隨時(shí)間變化的屬性?是否是一個(gè)物體?是否具有聲音屬性?是否具有觸覺(jué)屬性?是否是一系列物體的組合?……
……
知識(shí)單元也即為知識(shí)圖譜的基元,后續(xù)視覺(jué)分析、自然語(yǔ)言分析、計(jì)算引擎等進(jìn)行計(jì)算時(shí)直接在此調(diào)取數(shù)據(jù),因此其設(shè)計(jì)模型至關(guān)重要,這直接決定著整個(gè)人工智能工程的成敗。
?
4、知識(shí)圖譜
1)知識(shí)圖譜的價(jià)值與意義
將眾多知識(shí)單元組合在一起,并挖掘不同知識(shí)單元之間的關(guān)聯(lián)屬性,以此為基礎(chǔ)使知識(shí)單元之間建立深入而廣泛的關(guān)聯(lián),最終形成一張龐大的、具有廣泛聯(lián)系的知識(shí)單元關(guān)系網(wǎng),這張網(wǎng)就是知識(shí)圖譜。
比如說(shuō)一個(gè)明星(是一個(gè)知識(shí)單元)可以通過(guò)深度學(xué)習(xí)技術(shù)得到她的視覺(jué)特征庫(kù)(識(shí)別數(shù)據(jù)包),并基于此搜尋她所有演過(guò)的電影和唱過(guò)的歌(每一部電影、每一首歌曲都是一個(gè)知識(shí)單元),并在彼此之間建立關(guān)聯(lián),最終通過(guò)這種模式逐漸將知識(shí)單元關(guān)聯(lián)起來(lái)。
2)知識(shí)單元分組歸類(lèi)
知識(shí)單元聚合成知識(shí)圖譜的過(guò)程并非是簡(jiǎn)單的加法過(guò)程,而是一個(gè)2的N次方的相乘過(guò)程,這個(gè)過(guò)程中能找到許多歸類(lèi)的同類(lèi)項(xiàng),從而使它們之間建立較為廣泛的簡(jiǎn)單聯(lián)系。
舉個(gè)簡(jiǎn)單的例子,菊花、油菜花、桃花、荷花、迎春花、葵花、石榴花、梅花、槐花、玫瑰這十種花,如果按照顏色的角度來(lái)看,通過(guò)尋找同類(lèi)項(xiàng),其中,顏色偏向黃色的花為迎春花、桃花、油菜花、梅花、菊花、葵花等,顏色偏向紅色的有荷花、石榴花、玫瑰花。如果按照開(kāi)花的季節(jié)來(lái)看,春季開(kāi)花的有迎春花、油菜花、桃花、槐花,夏季開(kāi)花的有荷花、葵花、石榴花、玫瑰,秋天開(kāi)花的有菊花,冬天開(kāi)花的有梅花。以類(lèi)似的方法,可以在彼此之間建立非常多的關(guān)聯(lián)。
3)量化世界
知識(shí)圖譜可以說(shuō)是在“量化世界”,讓以前模糊的世界變得更加清晰,這也是人類(lèi)文明進(jìn)步的關(guān)鍵一步,曾經(jīng)人類(lèi)發(fā)明了語(yǔ)言文字,用戶符號(hào)代表世界上各種事物,進(jìn)而加以認(rèn)識(shí)與區(qū)分,知識(shí)圖譜是在這個(gè)基礎(chǔ)上的巨大創(chuàng)新,從而達(dá)到量化世界的效果,讓整個(gè)世界都進(jìn)入數(shù)據(jù)化時(shí)代。
另外,知識(shí)圖譜是視覺(jué)解析引擎與自然語(yǔ)言解析引擎的基礎(chǔ),只有將知識(shí)圖譜做好,才能在此基礎(chǔ)上發(fā)展事物組合圖、視覺(jué)解析引擎和自然語(yǔ)言解析引擎,因此,知識(shí)圖譜是人工智能的基礎(chǔ)環(huán)節(jié)。
?
5、事物組合圖譜
“事物組合圖譜”是以知識(shí)圖譜為基礎(chǔ)建立的另一個(gè)異常龐大的知識(shí)庫(kù),甚至說(shuō)是比“知識(shí)圖譜”大100倍的知識(shí)體系,這個(gè)東西是人工智能的另一個(gè)基礎(chǔ)。
那什么是“事物組合”呢?通俗的說(shuō)只要是兩個(gè)或多個(gè)事物組合在一起,發(fā)生的任何事件、情況等等,均是“事物組合”,小到“水和水龍頭”,大到“上萬(wàn)人組成的騰訊公司”,都是事物組合。
1)事物組合圖譜的價(jià)值
知識(shí)圖譜是通過(guò)深度學(xué)習(xí)等方法,搭建起基于視覺(jué)數(shù)據(jù)包、三維模型、語(yǔ)言符號(hào)、深層關(guān)系等為一體的知識(shí)單元,但在真實(shí)的視覺(jué)識(shí)別、自然語(yǔ)言解析過(guò)程中,知識(shí)圖譜在很多方面都存在數(shù)據(jù)不足的特點(diǎn),為了彌補(bǔ)這個(gè)缺陷,我們需要深度挖掘事物之間的關(guān)聯(lián),以獲得更加豐富的數(shù)據(jù),這也就意味著“事物組合圖譜”的誕生。
“事物組合圖譜”更多的是根據(jù)知識(shí)圖譜上邊知識(shí)單元,基于現(xiàn)實(shí)世界的真實(shí)組合情況,而形成的機(jī)器可以運(yùn)算的數(shù)據(jù),基于這些數(shù)據(jù)的進(jìn)一步運(yùn)算會(huì)做很多推理的事情,并產(chǎn)生更大的價(jià)值,甚至是后續(xù)視覺(jué)解析引擎和自然語(yǔ)言解析引擎的基礎(chǔ)。所以,“事物組合圖譜”的一個(gè)非常重要的應(yīng)用即為做精準(zhǔn)化推算。
2)事物組合概率統(tǒng)計(jì)
人每關(guān)注一個(gè)事物或場(chǎng)景(多個(gè)事物的組合),大腦都會(huì)對(duì)相關(guān)事物進(jìn)行一次記錄,記憶程度取決于相關(guān)參量的記錄次以及記憶時(shí)間,著重記錄那些(或事物的組合)出現(xiàn)概率高的事物景象,而對(duì)于那些不經(jīng)常出現(xiàn)的事物(或事物的組合),記憶中的特征也將隨著時(shí)間的流逝而逐漸減弱,這說(shuō)明人是根據(jù)景象出現(xiàn)次數(shù)、時(shí)間的遠(yuǎn)近、事物組合特點(diǎn)等來(lái)決定記憶與權(quán)重。
人工智能也是基于類(lèi)似的運(yùn)作原理,需要將所有的事物放到一塊,基于大量的真實(shí)、自然的生活數(shù)據(jù),來(lái)分析其各種事物組合到一起的可能性概率,這種概率數(shù)據(jù)將對(duì)后期的人工智能運(yùn)算起到關(guān)鍵作用,尤其是視覺(jué)解析、自然語(yǔ)言解析等領(lǐng)域。
對(duì)于事物組合情況的統(tǒng)計(jì),除了需要獲取某些事物組合在一起的概率之外,更重要的是獲得這些事物組合在一起所具備的某些特點(diǎn),比如過(guò)程的特點(diǎn)、過(guò)程的來(lái)源、過(guò)程的走向,以及相關(guān)環(huán)節(jié)體現(xiàn)的特點(diǎn),這些數(shù)據(jù)非常有用,在后續(xù)人工智能體系中將產(chǎn)生巨大的價(jià)值。
事物組合圖譜主要包含三大基本功能:
① 統(tǒng)計(jì)各種事物所形成的各種真實(shí)組合,包括事物之間的組合、事物的空間位置、時(shí)間變換等等,并得出每個(gè)事物出現(xiàn)在各種組合中的概率;
② 統(tǒng)計(jì)各種組合所在過(guò)程中所具備的某些特點(diǎn),無(wú)論是過(guò)程特點(diǎn)、來(lái)源、走向、分析等,都需要統(tǒng)計(jì)相關(guān)數(shù)據(jù);
③ 將各種組合按各種類(lèi)別分類(lèi),并將其結(jié)果分析數(shù)據(jù)匯總出來(lái);
舉個(gè)簡(jiǎn)單的例子:水杯與其它物體組合在一起的概率?
水(46.27%)
桌子(17.62%)
塑料(12.39%)
玻璃(8.18%)
……
舉個(gè)稍微復(fù)雜的例子:獲取“女孩的跑步”特點(diǎn)的識(shí)別包?
顯然,“女孩的跑步”是由三個(gè)事物,即人、空間、時(shí)間組成的一個(gè)過(guò)程組合,通過(guò)對(duì)上述場(chǎng)景的大量深度學(xué)習(xí),可以得到隨著時(shí)間、空間變換的整個(gè)動(dòng)作撲捉過(guò)程,并獲取相關(guān)的數(shù)據(jù)識(shí)別包,如果將“女孩跑步”定義為一個(gè)事物的話,則可以將相關(guān)數(shù)據(jù)模型化形成一個(gè)知識(shí)單元。
再舉個(gè)更復(fù)雜的例子:“女孩”、“失蹤”是過(guò)去一段時(shí)間新聞報(bào)道比較熱衷的話題,根據(jù)這些新聞報(bào)道,以最簡(jiǎn)的方式,統(tǒng)計(jì)出下邊一個(gè)四表格的數(shù)據(jù)。如果又出現(xiàn)了一個(gè)女孩失去聯(lián)系了,根據(jù)這個(gè)簡(jiǎn)單的表格數(shù)據(jù),則該女孩有可能被囚禁、搶劫或殺害的可能性,這就是一個(gè)簡(jiǎn)單的判斷。
有人會(huì)產(chǎn)生疑問(wèn),這世界上有上億個(gè)事物主體,上億個(gè)事物按照平均10個(gè)組合在一起,也就是C10個(gè)組合,即10億的十次方,最終的結(jié)果是1080次方,這是一個(gè)天文數(shù)字,現(xiàn)在計(jì)算量不可完成的。
但真實(shí)世界中的真實(shí)情況并非如此,而是不同元素之間經(jīng)常是成組出現(xiàn)的,比如水杯與水等常見(jiàn)事物的出現(xiàn)組合,幾乎占到水杯與其它所有事物組合的概率上的90%以上,至于那些事物之間組合到一塊的概率過(guò)低,則不必進(jìn)行統(tǒng)計(jì)。
3)概率統(tǒng)計(jì)某一具體事物的所有相關(guān)信息
以前很難準(zhǔn)確的了解某一個(gè)人,但是在人工智能大數(shù)據(jù)統(tǒng)計(jì)分析的情況下,這個(gè)解決起來(lái)就太簡(jiǎn)單了。以某一事物為主體,通過(guò)大量的數(shù)據(jù)進(jìn)行分析,按照概率相關(guān)程度進(jìn)行統(tǒng)計(jì),可以很快得出與這一事物關(guān)系最近的一系列相關(guān)事物。
比如,以學(xué)生群體為例,可以很快得出99%的學(xué)生,每天早晨起床、洗刷、吃飯、上課、午休、上課、放學(xué)回家、吃飯、洗刷、睡覺(jué)……,因此,很容易判定“周一上午十點(diǎn)它們大多數(shù)都在上課”。如果以單個(gè)學(xué)生為例,通過(guò)匯總這個(gè)學(xué)生的所有生活信息,可以很快分析出這個(gè)學(xué)生的所有生活習(xí)性、愛(ài)好、思維方式,以及可能的行為等等。
4)構(gòu)建全人類(lèi)數(shù)據(jù)庫(kù)
在知識(shí)圖譜的基礎(chǔ)上,進(jìn)行相關(guān)“事物組合”的概率分析,是努力去構(gòu)建一個(gè)更復(fù)雜、龐大的且基于全人類(lèi)的知識(shí)系統(tǒng),其核心主要基于三點(diǎn):
①?基于自然語(yǔ)言解析引擎來(lái)閱讀并理解互聯(lián)網(wǎng)內(nèi)容,然后對(duì)其有價(jià)值的相關(guān)資料進(jìn)行提取,并將其歸入到知識(shí)圖譜與事物組合圖譜里邊;
②?基于視覺(jué)解析技術(shù)能夠使計(jì)算機(jī)能夠理解所有視覺(jué)場(chǎng)景內(nèi)的信息,并將這些信息逐一統(tǒng)計(jì)分析,并將其歸入知識(shí)圖譜和事物組合圖譜;
③?對(duì)人群進(jìn)行精細(xì)分類(lèi),然后基于每種類(lèi)型的人給出特定的事物組合圖譜。
5)組合概率引擎的分化
在自然語(yǔ)言解析的那部分,我們說(shuō)到“當(dāng)一個(gè)句子還原成一個(gè)語(yǔ)境后,會(huì)出現(xiàn)非常多的語(yǔ)義可能,并通過(guò)語(yǔ)境限制因素與大規(guī)模數(shù)據(jù)統(tǒng)計(jì)來(lái)獲取定向語(yǔ)義”,但有一點(diǎn)需要提出的,那就是當(dāng)基于不同的解析方向、內(nèi)容類(lèi)型時(shí),最終會(huì)出現(xiàn)不同的解析語(yǔ)義,從而形成種類(lèi)繁多的面向特定知識(shí)的語(yǔ)境解析引擎,這就像不同的人看同一場(chǎng)景“一株玫瑰花枝上開(kāi)著一朵玫瑰花”,最終得到的卻是不同的結(jié)果,有的人說(shuō)“花中有刺”,而有的人卻說(shuō)“刺中有花”,其實(shí)從本質(zhì)上講,他們看到的場(chǎng)景是一樣的,但是后續(xù)的思維加工、思維計(jì)算過(guò)程卻不一致,因?yàn)樗麄冊(cè)谒季S計(jì)算過(guò)程中分別強(qiáng)調(diào)了不同的因素,前者強(qiáng)調(diào)了“刺”,而后者強(qiáng)調(diào)了“花”。因此在后期,將針對(duì)特定人群,推出特定的組合概率識(shí)別引擎,以提升分析的成功率。
?
6、視覺(jué)解析引擎
1)視覺(jué)范圍內(nèi)單個(gè)物體識(shí)別
“視覺(jué)解析引擎”是基于知識(shí)圖譜和事物組合圖譜的數(shù)據(jù),按照一定的分析方法對(duì)視覺(jué)范圍內(nèi)的事物進(jìn)行解析的系統(tǒng),通過(guò)“視覺(jué)識(shí)別引擎”對(duì)場(chǎng)景內(nèi)事物的逐一識(shí)別,以及事物之間的組合分析,最終全部理解視覺(jué)場(chǎng)景信息的一種技術(shù)。
具體來(lái)說(shuō),通過(guò)深層學(xué)習(xí)來(lái)構(gòu)建可視化知識(shí)圖譜,并通過(guò)知識(shí)圖譜的多層特征體制來(lái)分析圖片中的事物,進(jìn)而我們可以解析出場(chǎng)景中的所有事物(不一定都準(zhǔn)確),由于在同一類(lèi)場(chǎng)景中,不同事物形成的組合往往具有相互限制的作用(事物組合數(shù)據(jù)),因此我們可以通過(guò)這種限制作用(事物組合數(shù)據(jù))來(lái)分析事物,最終全部解析場(chǎng)景信息的一種技術(shù),這一過(guò)程涉及到了大量基于數(shù)據(jù)的推理判斷。
如果是視頻,具有時(shí)間線緯度,那就可以獲取更多的分析數(shù)據(jù)。當(dāng)場(chǎng)景跟隨著時(shí)間而漸進(jìn)變動(dòng)時(shí),我們就可以從多個(gè)視角來(lái)觀察目標(biāo)場(chǎng)景中的每一個(gè)事物,從而獲取更豐富的視覺(jué)數(shù)據(jù),這將增加分析的準(zhǔn)確度。
2)通過(guò)“事物組合圖譜”數(shù)據(jù)來(lái)對(duì)場(chǎng)景進(jìn)行深度分析
視野場(chǎng)景中具有眾多事物,這些事物之間往往具有相互聯(lián)系,甚至部分事物可以構(gòu)成一個(gè)組合,或者說(shuō)這些事物往往以組合的方式出現(xiàn),比如茶杯中的熱水與冒出的熱氣,因此可以通過(guò)它們之間的組合在一起的概率非常高,而其它可能性卻非常低,可以通過(guò)這種模式來(lái)分析事物。再比如說(shuō),一個(gè)人在一個(gè)秤上秤體重,我們很容易想到的是這個(gè)人在稱體重,而不是這個(gè)人在觀察這個(gè)秤是否美觀,是不是容易壞,它多貴,因?yàn)榍耙环N可能性出現(xiàn)的概率要遠(yuǎn)高于后者。
系統(tǒng)性的分析場(chǎng)景內(nèi)的所有事物,以及這些事物之間的常見(jiàn)可能性組合,基于類(lèi)似組合的可能性走向或特點(diǎn),就可以理解圖片信息。
3)識(shí)別步驟
場(chǎng)景識(shí)別過(guò)程大致分為以下五個(gè)步驟:
①?針對(duì)圖像主體元素的識(shí)別,得出圖像的場(chǎng)景主題、主要構(gòu)成元素。
②?針對(duì)每一個(gè)元素進(jìn)行逐一詳細(xì)識(shí)別。
③?基于事物組合圖譜的數(shù)據(jù),將各個(gè)事物重新組合到一起,并對(duì)所有元素的組合結(jié)構(gòu)、視覺(jué)呈現(xiàn)等進(jìn)行分析,從而完成對(duì)圖片的完整分析。
④?如果這是一個(gè)自然、真實(shí)生活中的案例,則將這個(gè)案例的相關(guān)數(shù)據(jù)進(jìn)行簡(jiǎn)要?dú)w檔,也即歸入相關(guān)知識(shí)單元與知識(shí)圖譜里邊,對(duì)曾經(jīng)的知識(shí)圖譜進(jìn)行優(yōu)化。
⑤?如果這種強(qiáng)調(diào)圖片中的那些點(diǎn),則需要對(duì)這些點(diǎn)進(jìn)行詳細(xì)的識(shí)別、分析。
4)基于類(lèi)似場(chǎng)景分析圖片的含義
一般而言,分析場(chǎng)景的含義,都是通過(guò)同類(lèi)場(chǎng)景的相似性來(lái)理解預(yù)測(cè)現(xiàn)在所面對(duì)的場(chǎng)景的,從而理解場(chǎng)景所表達(dá)的真實(shí)意義。
在大多情況下,同類(lèi)“事物組合”或同類(lèi)場(chǎng)景的最終可能走向,或者它們的來(lái)源于情況,或者會(huì)帶來(lái)那些結(jié)果,或者整個(gè)過(guò)程的價(jià)值(特點(diǎn)),這就是圖像的真正含義。
人們?yōu)槭裁纯吹綉已?#xff0c;會(huì)害怕?
答:因?yàn)樵谶@里發(fā)生意外的可能性比較大,一不小心跌落,就沒(méi)命了,于是害怕,也即出于對(duì)一種可能性危險(xiǎn)結(jié)果的擔(dān)心。
男士為什么喜歡和陌生美女聊天?
答:因?yàn)楹湍吧琅奶旖涣?#xff0c;或許有許多進(jìn)一步發(fā)生的可能,比如成為朋友、一起吃飯、看電影等一系列后續(xù)的可能。
?
舉例:三口之家的郊外旅游
步驟一:
通過(guò)對(duì)這張圖片進(jìn)行簡(jiǎn)單識(shí)別,可以得出這張圖片大致包含的元素為四類(lèi):
① 、人(3個(gè)人);
② 、草坪、樹(shù)木、天空;
③ 、熱氣球;
④ 、文字(logo)。
通過(guò)這四個(gè)元素的組合分析,可以得出,這張圖大致是一個(gè)郊外游玩圖。
步驟二:
針對(duì)圖像中的某些元素組合進(jìn)行具體的分析,比如以“人”這個(gè)元素為例,很顯然能夠分析出圖中一共有3個(gè)人,進(jìn)行更具體的分析,可以得出一個(gè)男士、一個(gè)女士、還有一個(gè)小女孩,如果機(jī)器能夠識(shí)別出她們是手牽手,再加上男士、女士、小女孩這樣的結(jié)構(gòu),可以得出這很可能是一個(gè)三口之家。
以類(lèi)似方式完成對(duì)自然景觀(草坪、樹(shù)木、天空)、熱氣球、文字的分析。
步驟三:
這是一幅什么樣的場(chǎng)景?
答:三口之家歡快的郊外旅游圖,“歡快”怎么來(lái)?,因?yàn)榛陬?lèi)似場(chǎng)景的統(tǒng)計(jì)分析,郊外旅游一般都是一件開(kāi)心的事。
?
7、語(yǔ)境解析引擎
語(yǔ)句解析簡(jiǎn)要流程
1)人基于什么進(jìn)行交流?
人的所有交流都基于以下五類(lèi)真實(shí)的素材:
①?視覺(jué)層面:可視化方面,素材、圖畫(huà)、動(dòng)作、圖景隨時(shí)間變化……
②?味覺(jué)層面:味覺(jué)感官,如:甜、苦、澀、酸……
③?聽(tīng)覺(jué)層面:聽(tīng)覺(jué)感官,如:音質(zhì)連續(xù)、間斷、跳躍、清晰、模糊、洪亮、清脆……
④?觸覺(jué)層面:皮膚感官,如:柔軟、堅(jiān)硬、摩擦……
⑤?嗅覺(jué)層面:嗅覺(jué)感官,如:臭、香……
2)基于語(yǔ)境展現(xiàn)的語(yǔ)句分析
人類(lèi)所有的交流都是基于事實(shí)的、能夠真實(shí)感受到的事物來(lái)進(jìn)行的,當(dāng)機(jī)器解析自然語(yǔ)言時(shí),也需要將其轉(zhuǎn)成事實(shí)的、能夠真實(shí)感受到的事物。因此,“語(yǔ)境解析引擎”主要是將語(yǔ)言還原成一幅真實(shí)的圖畫(huà),并基于“知識(shí)圖譜”、“事物組合圖譜”對(duì)其進(jìn)行深度解析的一種技術(shù)。
基于語(yǔ)境解析引擎的自然語(yǔ)言理解主要包括以下幾個(gè)部分:
①?基于事物組合圖譜尋找話語(yǔ)語(yǔ)境中的類(lèi)似事物組合場(chǎng)景;
②?用類(lèi)似事物場(chǎng)景的各種屬性特點(diǎn)去理解話語(yǔ)場(chǎng)景;
③?如果針對(duì)話語(yǔ)語(yǔ)境中的某些點(diǎn)需要著重分析,則調(diào)取“知識(shí)圖譜”或“事物組合圖譜”數(shù)據(jù)進(jìn)行深入分析。
舉例1:“狗走進(jìn)了房間,他是毛絨絨的。”
“狗走進(jìn)了房間,它布滿了家具。”
毛絨絨是狗的“外形表述”,家具是一個(gè)物體,房間更多是一個(gè)空間區(qū)域,布滿則是物體擺放的位置,因此,基于人工智能技術(shù),我們很容易通過(guò)語(yǔ)境來(lái)理解語(yǔ)句的語(yǔ)義。
要基于事物組合圖譜進(jìn)行可視化動(dòng)態(tài)聯(lián)想,將一句話展現(xiàn)為一幅動(dòng)態(tài)簡(jiǎn)約語(yǔ)境圖畫(huà),如下邊例子所示:
舉例2:“詠鵝”古詩(shī)用圖畫(huà)表示出來(lái)
詠鵝
鵝,鵝,鵝,曲項(xiàng)向天歌。
白毛浮綠水,紅掌撥清波。
基于語(yǔ)境解析技術(shù)將古詩(shī)語(yǔ)境用圖畫(huà)展示出來(lái),如下圖所示:
3)語(yǔ)境分析引擎
任何一幅語(yǔ)境圖畫(huà)所展現(xiàn)的內(nèi)容都是無(wú)窮多的,這無(wú)窮多的可能會(huì)帶來(lái)成千上萬(wàn)種語(yǔ)義可能,通過(guò)將語(yǔ)境所有事物按照可能性組合在一起,對(duì)這種事物組合的類(lèi)似場(chǎng)景進(jìn)行分析,來(lái)獲取最有可能表達(dá)的那種語(yǔ)義,并最終獲取某一語(yǔ)句表達(dá)的真實(shí)語(yǔ)義。
當(dāng)然,語(yǔ)境中的事物可能會(huì)出現(xiàn)多種組合形式,每一種組合形式都可能會(huì)對(duì)應(yīng)相應(yīng)的語(yǔ)義。但語(yǔ)境具有糾錯(cuò)機(jī)制,隨著語(yǔ)句的持續(xù),當(dāng)發(fā)現(xiàn)前邊的理解有誤時(shí),即前邊的某一語(yǔ)句表達(dá)的并不是概率最高的那個(gè)語(yǔ)義時(shí),可以糾正前邊的語(yǔ)句語(yǔ)義理解。
其實(shí)從另一方面來(lái)講,“話語(yǔ)”本身是能表達(dá)多種含義的,而語(yǔ)境對(duì)語(yǔ)義具有限制作用,將一句話限制在某一確定的語(yǔ)義,也即話語(yǔ)能夠表達(dá)多種不同的含義A/B/C/D,每種含義的概率分別是35%、30%、25%、10%,語(yǔ)境將語(yǔ)義限制在其中的某一種,比如B。
語(yǔ)境對(duì)語(yǔ)義的制約有多種情況,比如,同樣一句話,不同身份的人所表達(dá)的語(yǔ)義不同。例如:
一位教師說(shuō):“明天上午八點(diǎn)我去上課。”
一個(gè)學(xué)生說(shuō):“明天上午八點(diǎn)我去上課。”
上面的兩個(gè)例句中,教師和學(xué)生雖然都說(shuō)同樣的話,由于教師和學(xué)生的職務(wù)身份不同而決定了同樣一句話的語(yǔ)義不同,教師說(shuō)這句話的意思是“去講課”,而學(xué)生說(shuō)句話的意思是“去聽(tīng)課”。
按照傳統(tǒng)的語(yǔ)句邏輯分析,很難解決這種語(yǔ)義分歧錯(cuò)誤,但是在人工智能大數(shù)據(jù)統(tǒng)計(jì)分析的情況下,這個(gè)解決起來(lái)就太簡(jiǎn)單了,通過(guò)大量的數(shù)據(jù)分析發(fā)現(xiàn),“學(xué)生”與“上課”這兩個(gè)事物組合到一起,99.9%的概率是去學(xué)生去聽(tīng)課,So easy!
再比如,同樣的一句話,在不同的時(shí)間、地點(diǎn)、場(chǎng)合,就有不同的語(yǔ)義。
例如:“都八點(diǎn)了!”
按照傳統(tǒng)的語(yǔ)句解析技術(shù),這句話很難理解,由于缺乏語(yǔ)境,它的語(yǔ)義很難確定。但是按照人工智能技術(shù),這個(gè)問(wèn)題很簡(jiǎn)單,通過(guò)大數(shù)據(jù)分析,可以直接給出,這句話出現(xiàn)在各種場(chǎng)景中的概率:
①?快點(diǎn)走,否則飛機(jī)晚點(diǎn)了(0.1%)
②?快點(diǎn)走,否則上班時(shí)間要遲到了(15.1%)
③?快點(diǎn)走,否則上課要遲到了(11.1%)
④?你沒(méi)有時(shí)間概念(14%)
……
至于最終表達(dá)的是一種什么樣的含義,無(wú)所謂,隨著語(yǔ)境的持續(xù)而自然解決。
舉例:交通事故
一位剛學(xué)會(huì)騎自行車(chē)的姑娘,因有急事飛駛在郊外的大馬路上。這時(shí),她發(fā)現(xiàn)前面有個(gè)老人在路邊散步,她心里很慌亂,便在背后大聲叫道:“老大爺,站一下,請(qǐng)站住別動(dòng)!”老人隨即站住,沒(méi)有回頭,只等姑娘過(guò)去。但不幸得很,姑娘三歪兩歪一下子撞在老人身上,老人摔倒了。老人爬起來(lái)說(shuō):“我說(shuō)你讓我站住干什么,原來(lái)你是要瞄準(zhǔn)呀!”
整個(gè)段子的語(yǔ)言解析的字?jǐn)?shù)比本文所有字?jǐn)?shù)還多,簡(jiǎn)略起見(jiàn),僅對(duì)其第一句話進(jìn)行解析:“一位剛學(xué)會(huì)騎自行車(chē)的姑娘,因有急事飛駛在郊外的大馬路上。”
①?“姑娘”是“女孩”的另一種稱呼,這點(diǎn)通過(guò)知識(shí)圖譜可以得到;
②?“自行車(chē)”是一種物體,通過(guò)知識(shí)圖譜可以查到;
③?“馬路”是“公路”或“泊油路”的另一種稱呼,是一個(gè)事物,通過(guò)知識(shí)圖譜可以查到;
④?“郊外”是一個(gè)“事物組合”,通常指麥田、道路、野草、村落等組成的場(chǎng)景,通過(guò)“事物組合圖譜”可以查到;
⑤?“騎自行車(chē)”是“人”與“自行車(chē)”兩種事物組合在一起的一種運(yùn)動(dòng)狀態(tài),在“事物組合圖譜”里邊可以
⑥?“剛學(xué)會(huì)騎自行車(chē)”是“人”與“自行車(chē)”兩種事物組合在一起的一種運(yùn)動(dòng)狀態(tài)的子集,這在“事物組合圖譜”里邊可以查到;
⑦?“有急事”是“人”與“事情”兩種事物組合在一的一種狀態(tài)子集,這在“事物組合圖譜”里可以查到;
⑧?“飛馳”是車(chē)輛等事物運(yùn)動(dòng)過(guò)程中的一種描述,這在“事物組合圖譜”里可以查到;
⑨?基于上述這些理解與數(shù)據(jù),通過(guò)“語(yǔ)境解析引擎”,很容易將這句話解析出來(lái),最后給出的是一個(gè)還原的簡(jiǎn)略過(guò)程“描述視頻”,也即為該句話的“語(yǔ)境”,也即理解這句話的含義。
基于“知識(shí)單元”、“知識(shí)圖譜”、“事物組合圖譜”、“視覺(jué)解析引擎”、“語(yǔ)境解析引擎”等技術(shù),已經(jīng)能夠完美搭建基于自然語(yǔ)言的龐大數(shù)據(jù)庫(kù),并能夠以極高準(zhǔn)確率識(shí)別自然語(yǔ)言,可以說(shuō),這已經(jīng)為真正實(shí)現(xiàn)人工智能搭建了良好的基礎(chǔ),但這僅僅是整個(gè)“人工智能”技術(shù)體系中的一部分,鑒于本文篇幅,剩下的那部分將在后續(xù)的文章中展現(xiàn)給大家。
最后想說(shuō)一句話:中國(guó)創(chuàng)新,改變世界!
總結(jié)
以上是生活随笔為你收集整理的一眼看清高科技,深度解析人工智能技术脉络的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: Linux驱动开发-编写(EEPROM)
- 下一篇: Dev-C++5.11游戏创作之躺平发育