肖仰华 | 做个“有知识”的机器人
本文轉(zhuǎn)載自公眾號:知識工場。
? ? ? ? ? ??
肖仰華博士,復(fù)旦大學(xué)計算機科學(xué)與技術(shù)學(xué)院教授,博士生導(dǎo)師,知識工場實驗室負責人。
本文是肖仰華教授應(yīng)《中國計算機學(xué)會通信》邀請所撰寫的特邀文章,全文見 CCCF 2019 年第 5 期。
摘要:時下人工智能(AI)飛速發(fā)展,AI最為吸引人眼球的載體不外乎實體化的機器人。越來越多的機器人,特別是服務(wù)機器人“飛入”尋常百姓家。機器人產(chǎn)業(yè)似乎一片繁榮。然而,看似繁華的表象背后隱藏著深深的憂患。我們的服務(wù)機器人在很多看似簡單的任務(wù)中卻“出乎意料”地難以勝任。我們一直“夢想”著讓服務(wù)機器人為人類服務(wù),比如端茶倒水,但如此簡單的任務(wù)卻難倒幾乎所有的機器人。因為機器人必須要知道水是要往杯子里倒的而不是向人嘴里灌的,并且快倒?jié)M了就不能再倒。凡此種種,在復(fù)雜的開放環(huán)境中可能會用到的知識幾乎不可窮盡。這些對機器而言異常困難的知識積累與應(yīng)用對于我們?nèi)祟惗詤s是十分簡單。讓機器“有知識”將成為進一步發(fā)展機器人產(chǎn)業(yè)的關(guān)鍵舉措。在向這一宏偉目標邁出征程之前,很多基本問題需要得到澄清。讓機器“有知識”何以必要?為何困難?是否可行?如何做到?本文嘗試對這些問題作一初步回答。
隨著我國人工智能戰(zhàn)略的持續(xù)推進,作為人工智能的重要分支的機器人產(chǎn)業(yè)迎來了發(fā)展的黃金期。其中,各種服務(wù)機器人,包括客服機器人、陪伴機器人、問診機器人、導(dǎo)購機器人、理財機器人等已經(jīng)日益融入到人們的日常生活中。與工業(yè)機器人相比,服務(wù)機器人對機器的認知水平要求更高,而對動作能力要求相對較低。因此,決定服務(wù)機器人服務(wù)效果的是大腦而非四肢。建設(shè)具有一定認知能力的機器智腦是服務(wù)機器人產(chǎn)業(yè)發(fā)展的至關(guān)重要的環(huán)節(jié)。而機器智腦的重要組成部分是知識庫。機器是否具有知識并且能夠利用知識形成認知能力進而解決問題,是服務(wù)機器人更好地造福人類社會的關(guān)鍵。
引言自人工智能提出之初,讓機器利用人類的知識解決問題就一直是重要的發(fā)展思路之一。上世紀七十年代發(fā)展起來的專家系統(tǒng),就是以“讓機器利用專家知識來解決現(xiàn)實問題”作為基本目標。以構(gòu)建專家系統(tǒng)為核心目標的知識工程成為符號主義思潮的代表,與以神經(jīng)網(wǎng)絡(luò)為代表的連接主義交相輝映,成為人工智能發(fā)展歷程中最為亮麗的兩道風景線。近年來,伴隨著大數(shù)據(jù)技術(shù)飛速發(fā)展,知識工程進入了大數(shù)據(jù)知識工程的全新階段。以知識圖譜為代表的大規(guī)模知識表示不僅為大數(shù)據(jù)的價值挖掘帶來了全新機遇,也為機器智腦的發(fā)展帶來全新機遇。大數(shù)據(jù)知識工程以大規(guī)模自動化知識獲取為其根本特征。自動化知識使得知識庫的規(guī)模呈幾何級數(shù)增長。知識庫在規(guī)模上的量變正在醞釀著知識庫在效用上的質(zhì)變。這一質(zhì)變對于機器智腦而言集中體現(xiàn)在構(gòu)建一個能夠應(yīng)對開放復(fù)雜世界的機器智腦成為可能。
大數(shù)據(jù)知識工程將為機器人打造一顆“最強大腦”。伴隨著這一發(fā)展進程的將是機器認知智能的逐步發(fā)展。認知智能發(fā)展過程本質(zhì)上將是人類腦力不斷解放的過程。在工業(yè)革命和信息化時代,人類的體力被逐步解放。而隨著人工智能技術(shù)的發(fā)展,尤其是認知智能技術(shù)的發(fā)展,人類的腦力也將會被逐步解放。越來越多只有人才能從事的知識工作將逐步被機器所代替,伴隨而來的將是機器生產(chǎn)力的革命性進步。
然而,在我們即將邁出構(gòu)建機器智腦的豪邁征程之前,仍然存在一些問題必須得到清晰地回答。首先,當下人工智能的發(fā)展很大程度上體現(xiàn)在以深度學(xué)習(xí)為代表的機器學(xué)習(xí)突飛猛進,這一定程度上宣告了聯(lián)結(jié)主義的“勝利”。此時提及符號知識會不會不合時宜。換言之,符號知識對于發(fā)展機器智腦是否必要(本文第二節(jié))?如果承認了這種必要性,將知識灌輸給機器難在何處,是否有充分的研究價值(本文第三節(jié))?當前的知識庫積累以及當前的研究項目是否能應(yīng)對這些挑戰(zhàn)(本文第四節(jié))?未來還有哪些困難需要我們解決(本文第五節(jié))?只有清晰地回答了這些問題才能放下思想包袱輕裝上陣。
是否必要?符號知識對于發(fā)展機器智腦的必要性至少體現(xiàn)在三個方面:產(chǎn)業(yè)發(fā)展、研究意義和應(yīng)用價值。
(1)產(chǎn)業(yè)發(fā)展:感知智能的產(chǎn)業(yè)升級需要知識庫技術(shù)。對于智能機器人而言,首先要具備人類的視、聽、觸、嗅、味覺等五官的感知能力。受益于大數(shù)據(jù)所提供給的海量標注樣本,以及深度學(xué)習(xí)模型強大的學(xué)習(xí)能力,機器感知能力在語音識別、圖像識別等方面日益接近甚至超越人類水準,機器感知智能率先進入大規(guī)模產(chǎn)業(yè)化應(yīng)用階段。然而,機器的智能不應(yīng)僅僅停留在感知階段。類人五官的感知能力只是再現(xiàn)了絕大部分動物所具備的能力。機器智能的進一步發(fā)展勢必會對認知智能提出訴求。語音處理應(yīng)用日益要求從“聽見”升級為“聽懂”,圖像處理應(yīng)用日益要求從“看到”升級為“看懂”。而“懂”就是理解,要求機器形成認知能力。
從以信號識別為主的感知智能發(fā)展到以符號理解為主的認知智能是語音與視覺產(chǎn)業(yè)后程發(fā)展的必經(jīng)路徑。一定程度上,信號感知只是在為符號理解提供數(shù)據(jù)來源,一旦信號感知的使命結(jié)束,對由感知而得的數(shù)據(jù)形成理解,進而理解人類社會、理解世界,并形成有效的推理與決策將是機器智腦的重要使命。只有機器智腦具備了一定的認知能力,才能最終形成與環(huán)境交互的閉環(huán),最終有效指導(dǎo)智能機器的行為。
(2)研究意義:機器的理解和解釋能力需要符號知識。語言能力是人從猿猴進化為智人的關(guān)鍵。讓機器具備理解人類語言的能力將是機器智能發(fā)展歷程中的分水嶺,也是機器人為人類社會服務(wù)的前提。人類之所以能夠很自然地“理解”彼此的語言,是因為彼此有著類似的生活體驗、類似的教育背景,塑造具有類似知識的心靈。要讓機器理解我們?nèi)祟惖恼Z言,機器必須具備與我們類似的知識。符號知識對于認知智能的另一個重要意義在于“解釋”,使得可解釋的人工智能成為可能。大部分機器人都是以“為人類服務(wù)”為基本目標的,比如家庭陪伴機器人。機器必須合理地解釋自身的行為與決策才能服務(wù)人類,才能融入人類社會。當人類的指令或要求不合理時,機器應(yīng)該具備反抗意識,適時地提醒并且給出解釋。服務(wù)機器人必須具備一定的理解和解釋能力。
機器的“理解”和“解釋”均與符號知識有著密切關(guān)系。所謂機器的理解是針對輸入數(shù)據(jù)形成特定形式的內(nèi)在表示。比如讓機器幫我們“訂一張周杰倫的演唱會門票”,機器必須將“周杰倫”這個字符串映射到知識庫中我們所熟知的歌手周杰倫,才能夠準確完成任務(wù)。所謂機器的解釋是用知識庫中的片段來解釋問題的過程。例如,鯊魚為什么可怕?因為鯊魚是食肉動物,這實質(zhì)上是在用概念解釋。若問鳥兒為什么能飛翔?因為它有翅膀,這是在用屬性解釋。人類傾向于利用概念、屬性、關(guān)系這些認知的基本元素去解釋現(xiàn)象和事實。而對于智能機器而言,概念、屬性和關(guān)系都是符號知識。因此,機器的“解釋”能力離不開符號知識。
(3)應(yīng)用價值:服務(wù)機器人的核心能力包括自然人機交互、決策輔助等都對知識提出了需求。自然人機交互是發(fā)展智能機器人的關(guān)鍵技術(shù),人機交互方式可以體現(xiàn)為問答系統(tǒng)、智能搜索和聊天互動等等。無論人機對話系統(tǒng)采取哪種具體形式,知識庫都扮演著至關(guān)重要的角色。在一個典型的人機交互的系統(tǒng)架構(gòu)中(如圖1所示),其控制層中的核心包括問題理解、對話管理、答案生成等各模塊均需要來自知識層所提供的高質(zhì)量知識。比如在影視相關(guān)的問答交互中,當用戶問及“吳京最近有什么電影”,平臺必須知道“吳京”是電影演員,才能準確理解用戶的提問意圖,這是問題理解的核心。在信用卡業(yè)務(wù)問答中,客服機器人需要具備信用卡辦理的相關(guān)知識,才能正確引導(dǎo)用戶辦理信用卡業(yè)務(wù),這是對話管理通常需要實現(xiàn)的功能。在出行平臺的用戶投訴問答中,平臺需要各類判責的知識才能向客戶解釋。在司法相關(guān)的問答機器人,更是需要專業(yè)的司法知識才能準確為用提供司法解答。這些知識均在答案生成部分扮演重要角色。 ? ? ? ? ? ??
圖1:特定任務(wù)型人機交互系統(tǒng)框架
隨著智能機器人應(yīng)用的深化,人類的腦力工作將越來越多地交給機器。因此,機器不但要理解人類社會、理解人類的意圖,更需要開展一定的自主決策。為了實現(xiàn)這種自主決策,需要機器人能夠按照人類社會的價值觀與規(guī)則體系,按照預(yù)設(shè)任務(wù)的基本目標,開展有效的推理,實現(xiàn)自主決策。當前的推理決策主要分為基于規(guī)則和基于統(tǒng)計兩大類。基于規(guī)則的推理是早期知識工程采用的主流技術(shù)路線。但是規(guī)則的獲取一直是個瓶頸問題。在很多相對開放的應(yīng)用領(lǐng)域,規(guī)則獲取與規(guī)則匹配十分困難,還難以應(yīng)對開放世界的挑戰(zhàn)。基于統(tǒng)計的推理是在信息不完整或者決策不確定等環(huán)境下的推理方式。概率圖模型是基于統(tǒng)計的推理方式的典型代表。概率圖模型又演化出了多種不確定推理模型,比如馬爾科夫決策過程、部分可觀測馬爾科夫決策過程[1][2]、動態(tài)貝葉斯網(wǎng)絡(luò)[3]等。這些模型均采用概率建模決策要素之間的條件依賴、狀態(tài)遷移甚至因果關(guān)聯(lián)。概率圖模型等統(tǒng)計推理模型以專家的先驗知識確定決策要素,通過大規(guī)模數(shù)據(jù)訓(xùn)練以確定不同要素之間的統(tǒng)計關(guān)聯(lián)強度。這一思路充分地體現(xiàn)了專家知識+數(shù)據(jù)驅(qū)動的問題求解思路。對于樣本稀疏但專家知識豐富的應(yīng)用場景具有十分積極的意義。司法、醫(yī)療、金融等領(lǐng)域的服務(wù)機器人均應(yīng)認真考慮此類模型的適用性。
為何困難?近年來,越來越多的智能機器人走進了我們的日常生活與生產(chǎn)。不同的領(lǐng)域?qū)C器人的智能水平要求完全不同。在生產(chǎn)車間的機械手臂只需要按照固定程序完成工作即可。在倉庫中的無人駕駛汽車也只需要沿著固定路線行駛即可。這些封閉的應(yīng)用場景,對于機器的智能水平要求相對不高。但是服務(wù)機器人的使命不同,大部分服務(wù)機器人是直接面向人類的,是直接“生活”或“工作”在一定的家庭或者社會環(huán)境中的。這一類直接面向人類社會的服務(wù)機器人需要應(yīng)對“開放性”挑戰(zhàn)。所謂開放性挑戰(zhàn)是指無法預(yù)期可能發(fā)生的事態(tài),從而無法有效預(yù)設(shè)先驗規(guī)則。換言之,在開放環(huán)境中,機器很容易碰到無法合理處理的情形,因為這些情形沒有被定義過、沒有被描述過,從而機器顯得無法適從。開放性問題是整個人工智能的根本難題。這個問題或許太難,以至于很少被提及與討論。開放性難題被巧妙地隱藏在諸如常識理解、小樣本學(xué)習(xí)、元學(xué)習(xí)等一系列表層問題背后。開放性難題是帶來一次次人工智能寒冬的“罪魁禍首”。
然而,在今天這個時間節(jié)點討論人工智能的開放性難題是合適的。因為我們面臨全新機遇。在數(shù)據(jù)+算力+模型的三駕馬車的牽引下,開放性難題的解決面臨一些新機遇。本文聚焦在知識工程給智能機器人帶來的機遇。因此,著重討論知識庫相關(guān)技術(shù)應(yīng)對開發(fā)性難題的主要思路。首先,大規(guī)模通用知識圖譜的建設(shè),為應(yīng)對開放性難題帶來新機遇。互聯(lián)網(wǎng)上的海量數(shù)據(jù),使得從中獲取大規(guī)模通用知識圖譜成為可能。再加上人類專家經(jīng)年累月積累的各類知識庫,我們可以灌輸給機器的知識庫規(guī)模是前所未有的,甚至可以企及普通人類的知識容量。量變總是醞釀質(zhì)變,當機器的知識庫規(guī)模逐步增大,開放環(huán)境所需知識不被命中的可能性勢必下降。其次,最近幾年大規(guī)模概念圖譜的出現(xiàn),使得歸納和類比成為可能,進而使得類人化的開放問題求解成為可能。歸納能力是我們?nèi)祟惓橄笏伎嫉那疤帷w納使得人類不必糾纏于不熟悉的實例,而只需關(guān)注其類別就可以進行準確的認知。類比使得我們?nèi)祟惸軌蛲ㄟ^同類相似的案例從容應(yīng)對從未遇到的情形。隨著概念圖譜的日益完善,這些人類解決開放性問題的典型思路對于機器而言也將越加可行。
是否可能??4.1各類互聯(lián)網(wǎng)知識庫已有多年積累與沉淀
在知識工程、Web數(shù)據(jù)挖掘、自然語言處理等領(lǐng)域大量的研究工作致力于大規(guī)模知識獲取的工作,為打造機器智腦提供了豐富的知識庫來源。目前互聯(lián)網(wǎng)上可用于智能機器人的知識庫包括以下各類知識:
(1)事實知識(Factual Knowledge)。是關(guān)于某個特定實體的基本事實。例如(中國,首都,北京)。事實知識是知識圖譜中最常見的知識類型。大部分實體的事實可以對應(yīng)實體的特定屬性或者關(guān)系。很多以實體為中心組織的知識庫均富含此類知識,比如DBpedia[4]、Freebase[5]以及CN-DBpedia[6]等等。
(2)概念知識(Taxonomy Knowledge)。分為兩類,一類是實體與概念之間的類屬關(guān)系(InstanceOf關(guān)系),例如(柏拉圖 InstanceOf哲學(xué)家)。另一類為子概念與父概念的子類關(guān)系(SubclassOf),比如(唯心主義哲學(xué)家SubclassOf 哲學(xué)家)。一個概念有子概念也可能同時具有父概念,使得整個概念之間構(gòu)成層級體系。概念之間的層級關(guān)系是本體定義中最為重要的部分,特定領(lǐng)域的概念知識是機器認知領(lǐng)域的基本框架。典型概念知識圖譜(有時簡稱概念圖譜)包括Yago[7][8][9][10]、Probase[11]、WikiTaxonomy[12]等等。概念是歸納的前提,是基于概念推理的(類別推理,taxonomy reasoning)依據(jù)。概念知識是一種典型的元知識(Meta-knowledge)。元知識處理概念知識之外,還包括概念之間的屬性、概念與屬性的領(lǐng)域與約束等元知識。這些知識通常在傳統(tǒng)的本體中加以定義與明確。
(3)詞匯知識。詞匯知識主要包括實體與詞匯之間的關(guān)系(比如實體的命名、稱謂、英文名等等)以及詞匯之間的關(guān)系(包括同義詞,反義詞、縮寫詞以及上下位詞關(guān)系等等)。例如(柏拉圖,英文名, “Plato”)、(趙匡胤,謚號,宋太祖)、(妻子,同義詞,老婆)。一些跨語言知識庫比如BabelNet[13]專注于建立實體或概念之間的跨語言等價關(guān)系。詞匯知識的自動化獲取在目前的實際應(yīng)用中已經(jīng)取得較好效果。從豐富的領(lǐng)域語料自動挖掘領(lǐng)域詞匯,并建立詞匯之間的語義關(guān)聯(lián)以及詞匯與實體之間的關(guān)聯(lián)已經(jīng)成為知識圖譜構(gòu)建最為重要的一步。詞匯知識也是相對簡單的知識。人類學(xué)習(xí)某個新領(lǐng)域往往是從該領(lǐng)域的術(shù)語或者詞匯開始的。因此,賦予機器認知領(lǐng)域詞匯,是實現(xiàn)機器認知整個領(lǐng)域知識的第一步。此類典型知識圖譜包括WordNet[14]等。
(4)常識知識。常識是人類通過身體與世界交互而積累的經(jīng)驗與知識,是人們在交流時無需言明就能理解的知識。例如我們都知道鳥有翅膀,鳥能飛等。再比如如果x是個人,那么x要么是男人要么是女人。常識的表征與定義、常識的獲取與理解等問題一直都是人工智能發(fā)展的瓶頸性問題。常識知識的基本特點是我們每個人都知道,但很少在文本里提及,使得基于文本抽取的常識獲取方式效果有限。典型的常識知識圖譜包括Cyc[15],ConceptNet[16]等。
(5)領(lǐng)域知識。服務(wù)機器人需要建立人類社會與生活相關(guān)的方方面面知識庫。比如日常陪伴機器人需要具備衣食住行等各方面的知識庫。比如當用戶抱怨“空氣不好”,機器人能夠開啟空氣凈化器;當用戶感冒了,機器應(yīng)該能夠結(jié)合醫(yī)學(xué)和用戶醫(yī)療知識庫提供相應(yīng)的藥物與生活建議;在午餐時間,機器人能通過飲食知識庫推薦近期的飲食等等。
4.2各類服務(wù)機器人專用知識庫蓬勃發(fā)展
除了上述幾類常見的知識之外,下面幾類知識對于服務(wù)機器人尤為重要并受到了密切的關(guān)注,發(fā)展迅速:
(1)個性知識。我們希望服務(wù)機器人具有個性化服務(wù)能力。因此,服務(wù)機器人應(yīng)該具備其服務(wù)對象的個性化知識,也就是傳統(tǒng)的用戶畫像包括的內(nèi)容,比如職業(yè)、身份、婚姻、年齡等等,也包括服務(wù)對象的喜怒哀樂、興趣愛好、技術(shù)能力以及服務(wù)對象近期的行為軌跡、社會交往、消費娛樂等動態(tài)畫像。
(2)動態(tài)知識。人類所身處的真實世界不是靜態(tài)的,而是動態(tài)變化的。因此,對于智能機器人,不僅需要各種靜態(tài)知識(比如番茄是一種蔬菜),還需考慮如何表示和應(yīng)用動態(tài)知識,特別是決策過程知識、因果關(guān)聯(lián)知識、時序依賴知識等等。例如用戶想看電影,如果機器人具備看電影場景的基本知識,就可以幫助用戶約朋友、訂票、選座位、建議出行路徑。這些服務(wù)的實現(xiàn)均需要建立起看電影場景下事件之間的邏輯關(guān)聯(lián)。
(3)情感知識。隨著我國老齡化的發(fā)展,家庭陪伴機器人需要能夠像人類伴侶一樣感知用戶情感、能在回答或者輔助人類工作時表達出相應(yīng)的情感[17][18]。比如當用戶表達:“今天空氣不好,感冒了,好難受”的時候,服務(wù)機器人應(yīng)該通過主觀情感知識庫將該語句歸類為尋求關(guān)心與呵護類的情感表達范疇,并提供相應(yīng)的情感輸出,以表達合理的人文關(guān)懷。讓智能機器人富有“情緒”是另一類讓機器更加類人的關(guān)鍵技術(shù)。情緒的檢測和有效的傳達是人類自然交互中不可或缺的部分,顯然情緒知識庫是實現(xiàn)這些能力的前提。
(4)多模態(tài)知識。人類之間相互交流和溝通的方式不僅僅是單一的文字問答,還需結(jié)合圖像、語音、手勢、情緒、表情、眼神以及暗示等多模態(tài)來了解外部世界。因此對于智能機器人,所需要構(gòu)建的知識庫不應(yīng)該拘泥于文本形式,而是應(yīng)該向多模態(tài)方式轉(zhuǎn)變。多模態(tài)知識庫可以有效幫助智能機器人從多維角度去理解人類社會,可以在與人類的交互中更準確地理解人類的意圖。在圖像識別領(lǐng)域的ImageNet[19]就是典型的圖像知識庫。最近有學(xué)者提出的多模態(tài)知識圖譜[20]將實體、文本、圖像、視頻等相鏈接,使得機器可以理解實體的不同模態(tài)表示。
?
4.3面向機器智腦的典型研究項目具有一定的示范與帶動作用
此外,也存在一些專門的針對智能機器人的知識引擎。其中具有代表性的是RoboBrain[21]?。RoboBrain是斯坦福大學(xué)和康奈爾大學(xué)為機器人定制的知識引擎項目。機器人系統(tǒng)涉及的數(shù)據(jù)模態(tài)多樣(包括符號、語言、語音、圖像、視頻以及軌跡等等),機器人需要從事的任務(wù)多樣(包括感知、規(guī)劃、控制、決策等等)。因此,面向機器人的知識引擎必須能夠?qū)⒍嗄B(tài)多任務(wù)的知識統(tǒng)一表示。RoboBrain知識引擎采用圖統(tǒng)一表達各種知識。RoboBrain除了存儲了來自互聯(lián)網(wǎng)的多個來源的公開知識庫(包括前面提及的百科圖譜、語言知識庫、圖像知識庫等),還通過學(xué)習(xí)模型習(xí)得機器與物理環(huán)境進行交互的知識。知識引擎主要實現(xiàn)知識的獲取、解析、存儲以及推理功能,并提供查詢語言RQL(Robot Query Language)供第三方平臺使用知識。RoboBrain能夠幫助機器理解人類活動并采取相應(yīng)行動。比如圖2所示,RoboBrain通過“冰箱是固定的”,“人、碗是活動的”等常識知識預(yù)測人將拿著碗走向冰箱,此時智能機器人就可以為人類打開冰箱。
? ? ? ? ? ? ? ?
圖2:機器人通過常識知識預(yù)測人類行動
隨著服務(wù)機器人產(chǎn)業(yè)的進一步發(fā)展,將認知能力賦予機器,讓機器“掌握”一定的知識,并利用這些知識更好地為人類服務(wù)已經(jīng)是服務(wù)機器人產(chǎn)業(yè)乃至整個智能機器人產(chǎn)業(yè)進一步發(fā)展所面臨的重大問題。大數(shù)據(jù)為知識工程、智能機器人等領(lǐng)域的發(fā)展所帶來的巨大數(shù)據(jù)紅利,仍有待相關(guān)領(lǐng)域的進一步消化與利用。相信在大數(shù)據(jù)知識工程等技術(shù)的助力下,實現(xiàn)智能機器人的認知能力,顯著提升機器人的智能水平是完全可能的。
然而,需要指出的是構(gòu)建機器智腦的強大知識庫仍然面臨很多挑戰(zhàn)。
首先、知識表達困難重重。人類用于解決問題的很多知識是難以言說的隱性知識,表達這類知識仍然十分困難。多模態(tài)知識的表達也是十分困難的,如何在一個統(tǒng)一的表示空間表達不同模態(tài)的數(shù)據(jù)與知識仍然是個十分活躍的研究問題。此外,如何將知識的向量表示與符號表示相融合以進一步增強知識的表達能力也是個值得探索的問題。知識表示在服務(wù)機器人的實際應(yīng)用中也還存在一些基本的理論問題需要澄清。比如需要多少類型的知識,需要多大規(guī)模的知識才足以使得機器能夠像人一樣應(yīng)對復(fù)雜開放環(huán)境?機器勝任開放環(huán)境處理能力的最小知識集合是什么?這些問題的回答是深化知識表示研究的前提。
其次、知識獲取任重道遠。大數(shù)據(jù)為知識獲取帶來了量的提升,但是在質(zhì)的方面仍有很大提升空間。很多知識是從元知識通過實例化或者隱喻派生而得。元知識對于機器而言是十分必要的。元知識獲取仍然缺乏有效的方法。此外,常識在語料中的稀疏造成了常識獲取的巨大困難。機器在常識獲取與理解的道路上仍需經(jīng)歷漫長的征程。
最后,知識應(yīng)用仍需深化。人類在面對實際問題時,可以很自然地以一種近乎直覺的方式適配和調(diào)用自己積累的知識來完成任務(wù)。但機器的自動知識適配卻仍然十分困難。隨著知識體系的日益完善,如何協(xié)同各類不同的知識表示形成有效的推理機制,也是亟待研究的問題。
總之,我們相信我們身邊的機器將不僅會擁有發(fā)達四肢,也將會擁有超強的大腦。未來的智能機器將絕不僅僅是一堆冰冷的鐵皮與硅基,表皮之下鑲嵌的將是一顆“有知識”、“有文化”、“有溫度”的“有趣”“靈魂”。
參考文獻
本文轉(zhuǎn)自CCF數(shù)字圖書館——CCCF2019年第5期專題
了解更多信息請點擊知識工場網(wǎng)站主頁:http://kw.fudan.edu.cn/
OpenKG
開放知識圖譜(簡稱 OpenKG)旨在促進中文知識圖譜數(shù)據(jù)的開放與互聯(lián),促進知識圖譜和語義技術(shù)的普及和廣泛應(yīng)用。
點擊閱讀原文,進入 OpenKG 博客。
總結(jié)
以上是生活随笔為你收集整理的肖仰华 | 做个“有知识”的机器人的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 论文浅尝 | 基于深度强化学习将图注意力
- 下一篇: 论文浅尝 - AAAI2020 | 迈向