2019 WAIC | 腾讯张正友:人工智能的热与酷
8月29日至31日,2019世界人工智能大會在上海舉辦,在31日舉行的“科技有道 擇善而行”——騰訊論壇上,騰訊 AI Lab 及騰訊 Robotics X 實驗室主任張正友博士進行了主題演講。以下為演講全文:
各位領(lǐng)導、各位嘉賓、各位朋友,大家早上好!
很高興再次來到世界人工智能大會。一年過去了,人工智能仍然是很熱門的話題,it’s still a very hot topic。同時,人工智能還很酷,每個公司都想往人工智能上靠,投資公司投資的時候也要看看和人工智能有沒有關(guān)系?!翱帷边@個字其實來自英文cool,非常棒的翻譯。既是Hot也是Cool。但cool在英語里也有涼,有冷靜的意思。所以我們同時要冷靜看待人工智能。
近年來,世界主要發(fā)達國家都將人工智能作為國家戰(zhàn)略,投入了大量的人力物力,力爭贏得全球科技競爭的制高點。
作為在人工智能領(lǐng)域奮斗了三十多年的老兵,很高興看到人工智能的今天。我也見證過人工智能的高高低低,深知最近人工智能繁榮的來之不易,是幾代研究人員持之以恒,坐了幾十年冷板凳換來的,我們都要珍惜,要把人工智能技術(shù)切實用好,造福人類。
同時我們也要認識到目前的人工智能離真正的智能還很遠,比如智能如何發(fā)育和自主進化,這些都需要我們繼續(xù)對人工智能的基礎(chǔ)研究進行長期穩(wěn)定的支持。
所以我們一定要兩條腿走路。一條腿,支持將現(xiàn)有的人工智能技術(shù)賦能各行各業(yè),造福人類。另一條腿,支持構(gòu)建人工智能基礎(chǔ)研究的穩(wěn)定環(huán)境,推動人工智能基礎(chǔ)理論的創(chuàng)新和突破。
人工智能主要有三大流派
符號主義(symbolism),希望通過邏輯演繹系統(tǒng),模擬人類智能活動。代表技術(shù)有啟發(fā)式算法,專家系統(tǒng),知識工程。
連接主義(connectionism),模仿人腦結(jié)構(gòu),將神經(jīng)元連成神經(jīng)網(wǎng)絡(luò),利用連接機制來學習。代表技術(shù)包括感知機(perceptron),支持向量機(SVM),深度學習(DNN).
行為主義(actionism或situated AI), 通過外部行為探索智能,是一個感知-動作型控制系統(tǒng)。代表技術(shù)包括自組織映射(SOM),遺傳算法,強化學習。
當然,這一波的人工智能興起是以深度學習為代表的,得力于大數(shù)據(jù)和強算力,因而在視覺、語音、翻譯等感知領(lǐng)域取得重大突破,跨越了很多應(yīng)用門檻。
但是還有很多場景目前的深度學習還不能解決,比如認知智能包括機器的思考、決策、和推理能力,比如對環(huán)境的適應(yīng),比如學習能力的自主進化。這些都需要我們放開思維,大膽探索,將不同流派融合,甚至創(chuàng)造新的流派,開發(fā)出真正自主智能的系統(tǒng)。
下面我將圍繞騰訊AI,對我們的布局,目前所取得的進展,以及未來的發(fā)展方向三個話題展開演講。
目前騰訊已建立兩大實驗室矩陣——人工智能實驗室矩陣,包括致力于全面基礎(chǔ)研究與應(yīng)用的在深圳及西雅圖的騰訊AI Lab、基于視覺的騰訊優(yōu)圖、基于語音與自然語言理解的微信 AI等四大實驗室;以及基于前沿科技的實驗室矩陣,涵蓋機器人、量子計算、5G、邊緣計算、IoT和音視頻技術(shù)等,打造面向未來的科技引擎,推動自主技術(shù)創(chuàng)新。
作為衡量機構(gòu)研究實力的重要標準,成立兩年多來,騰訊AI Lab的基礎(chǔ)研究成果已覆蓋CVPR、ACL、ICML、NIPS及Nature Communications等國際頂級AI學術(shù)會議或期刊,發(fā)表論文數(shù)量近350多篇,位居國內(nèi)企業(yè)前列。此外,我們還發(fā)布了三大開源項目:
Tencent ML-images: 這是業(yè)內(nèi)最大規(guī)模多標簽圖像數(shù)據(jù)集
PocketFlow: 這是世界上首款自動化深度學習模型壓縮框架
中?詞向量數(shù)據(jù)庫:這是業(yè)內(nèi)領(lǐng)先,包括了800多萬中文詞匯
騰訊積極與外部學界合作,建立了8大聯(lián)合實驗室,參與53個研究合作項目,聯(lián)合培養(yǎng)34位頂尖學生,接待了17位全球訪問學者。通過一年一度的學術(shù)論壇、聯(lián)合研究、訪問學者、博士生及研究生獎學金等多種項目和形式,推動前沿研究應(yīng)用及人才培養(yǎng)。
下面介紹一下騰訊在AI方面的進展。
目前AI的現(xiàn)狀主要還停留在感知層面,依賴大量的標注數(shù)據(jù)。在計算機視覺、語音處理、和自然語言里的自動翻譯方面有很大的成功。比如騰訊的同聲翻譯就在支持著這一屆的世界人工智能大會。
所以目前在限定條件下的感知與分析能力已經(jīng)相對比較成熟。下一步要去解決充滿不定性的現(xiàn)實環(huán)境的問題。我們的目標是取得技術(shù)突破,助力產(chǎn)業(yè)顛覆式升級。
AI的進一步發(fā)展依賴于提升三方面的能力:第一是內(nèi)容的生成,第二是對世界的認知,第三是對行動的決策。下面我舉幾個例子。
在內(nèi)容生成領(lǐng)域,我會舉視頻風格轉(zhuǎn)換為例。在認知領(lǐng)域,我會舉虛擬人為例。在決策領(lǐng)域,我會舉絕藝圍棋機器人為例。
這個工作依賴于對視頻場景的深度理解,識別其中人物、物體、場景,并分析它們的關(guān)系,并在時間順序識別視頻中不同的動作和事件,就可以高效的生成豐富的內(nèi)容,比如卡通風格的視頻。
在認知領(lǐng)域,我們通過虛擬人的形態(tài),進一步探索面向未來的人機交互新形式。它集合了計算機視覺、語音、自然語言理解到智能決策協(xié)作等多種AI技術(shù)于一身。通過跨學科、跨模態(tài)的交叉多模態(tài)研究,讓機器用感知判斷人類情緒,用認知判斷意圖,并進行更復雜的分析與決策,從而不斷向真正的人類智慧靠近。
讓我們看看騰訊虛擬人目前在游戲解說中的表現(xiàn)吧。請看視頻。
我們相信這樣的虛擬人具有無窮潛力,不但能虛擬解說,還能成為虛擬偶像、虛擬主持人、智能助手、兒童或老年陪伴、虛擬教師等等。
在AI決策領(lǐng)域,騰訊 AI Lab 一直走在行業(yè)前列。早在2016年研發(fā)的圍棋 AI “絕藝”(Fine Art),三年了拿到了4次世界比賽冠軍,現(xiàn)擔任中國國家圍棋隊訓練專用 AI。
策略協(xié)作型 AI 「絕悟」是2017年與王者榮耀共同啟動的前沿研究項目。它的搜索空間比圍棋要復雜的多,是10的兩萬次方。宇宙的原子數(shù)才只有10的80次方,可見王者榮耀AI的難度。去年,我們達到業(yè)余頂尖水平。今年8月初我們參加了在吉隆坡舉辦的王者榮耀世界冠軍杯半決賽。在特設(shè)的5v5水平測試環(huán)節(jié)中,「絕悟」戰(zhàn)勝了職業(yè)選手賽區(qū)聯(lián)隊,升級至王者榮耀電競職業(yè)水平。測試結(jié)果代表騰訊在深度強化學習、多智能體決策智能課題上的國際級 AI 研究水準,也標志著公司在攻堅通用人工智能( Artificial General Intelligence)難題上更進一步。
AI+農(nóng)業(yè),我們也邁出了一小步——一個很會“種”黃瓜的AI。去年在荷蘭舉辦的國際AI溫室種植大賽里,我們利用傳感器和攝像頭自動收集溫室氣候、作物發(fā)育情況等環(huán)境和作物數(shù)據(jù),再用深度學習模型計算、判斷和決策,驅(qū)動溫室的設(shè)備元件,遠程控制黃瓜生產(chǎn),最后獲總比分第二、AI策略第一的成績,還開心收獲了3496公斤黃瓜。
今年我們參與組織第二屆AI+農(nóng)業(yè)比賽,這次是種番茄,國內(nèi)吸引了北大、中科大、農(nóng)大、浙大及哈工大等名校參與。
AI+醫(yī)療,騰訊是“醫(yī)療影像國家人工智能開放創(chuàng)新平臺”。騰訊專門成立團隊深耕醫(yī)療領(lǐng)域,部分結(jié)果上線 100 余家三甲醫(yī)院。
我著重講一下我們智能顯微鏡的工作。我們在顯微鏡這種古老而重要的醫(yī)療器械中加入了AI與AR技術(shù),讓機器自動識別、檢測、定量計算和生成報告,并將檢測結(jié)果實時顯示到醫(yī)生所看目鏡中,在不打斷醫(yī)生閱片的同時及時提醒,提高醫(yī)生的診斷效率和準確度。
最后我想講一講騰訊AI的未來。
我們的愿景是通過深入研究,實現(xiàn)技術(shù)突破,邁向通用人工智能,連接人與人,人與內(nèi)容,人與服務(wù)。
回到我演講開始提到的,現(xiàn)在的人工智能真的智能嗎?看看左邊的視頻,攝像頭能一直跟蹤住人,好像是智能的。但看看右邊的視頻,你覺得它智能嗎?想象一下,如果一個人想要蓋住你的眼睛,你會怎么做?我是會躲開的。但這個系統(tǒng)顯然沒有這樣的舉止。現(xiàn)在的人工智能只是機器學習:從大量的標注數(shù)據(jù)去學習一個映射。
那什么是真正的智能?我想目前還沒有定論,我們對我們自己的智能還沒有足夠的了解。不過我很認同瑞士認知科學家Jean Piaget說的,智能是當你不知道如何做的時候你用的東西。
如何去實現(xiàn)有智能的系統(tǒng)呢?可能有很多條路,但我認為一條很重要的路是有載體的智能,也就是機器人。請看視頻
在機器人領(lǐng)域,我提出了A2G理論,A是AI, 機器人必須能看能聽能說, B是Body本體,不同的本體形態(tài)具備不同的能力,C是Control控制,讓本體完成特定的任務(wù)。ABC組成了機器人的基礎(chǔ)能力。D是Developmental Learning,發(fā)育學習,E是EQ,情感理解、擬人化,F是Flexible Manipulation,靈活操控。最后要達到G,是Guardian Angel,守護天使。因為時間關(guān)系,就不一一展開了。
我們在這屆世界人工智能大會上展出了世界首款工業(yè)巡檢操作機器人雛形,不知道大家去看過沒有。本體Body包括移動平臺,機械手,還有立體視覺。AI部分包括視覺讀表,三維定位,有毒泄露氣體檢測等。控制部分包括機器人運動,機械臂操作,攝像頭主動變焦,等。決策部分包括自主操控和遙操作。如果機器人覺得它自己完成不了,就會提醒遠程操作員遙控。
我們還做了三款其它機器人:絕藝圍棋機器人,桌上冰球機器人,還有機器狗Jamoca。
因為時間關(guān)系,我就不展開了。謝謝大家!
騰訊AI Lab是騰訊的企業(yè)級AI實驗室,于2016年4月在深圳成立,目前共有70位世界頂尖的研究科學家及300多位經(jīng)驗豐富的應(yīng)用工程師。借助騰訊豐富的應(yīng)用場景、海量大數(shù)據(jù)、強大計算能力和一流科技人才等發(fā)展優(yōu)勢,AI Lab致力于不斷提升AI的認知、決策與創(chuàng)造力,向“Make AI Everywhere”的愿景邁進。
騰訊AI Lab強調(diào)研究與應(yīng)用并重發(fā)展,力爭“學術(shù)有影響,工業(yè)有產(chǎn)出”。在基礎(chǔ)研究上,AI Lab關(guān)注四大方向,包括機器學習、計算機視覺、語音識別及自然語言處理;技術(shù)應(yīng)用上,實驗室推進四大領(lǐng)域,包括社交AI、游戲AI、內(nèi)容AI與醫(yī)療AI的發(fā)展。
實驗室的AI技術(shù)也廣泛應(yīng)用在微信、QQ和騰訊覓影等上百款產(chǎn)品。行業(yè)應(yīng)用上,實驗室研發(fā)出的圍棋AI“絕藝”屢獲國際賽事冠軍,是科技賦能國粹文化的代表。實驗室支持的國家級AI+醫(yī)療標桿產(chǎn)品“騰訊覓影”也不斷取得技術(shù)突破,從醫(yī)療影像延伸到輔助診療等功能。截止2019年5月,項目已落地100多家全國三甲醫(yī)院,服務(wù)患者近160萬人。
實驗室還堅持與學界、企業(yè)界和行業(yè)共建“共享 AI+未來”,已和美國麻省理工大學、英國牛津大學、香港中文大學等多所海內(nèi)外知名院校開展學術(shù)合作,
二、目前進展
關(guān)于AI目前所取得的進展,張老師提出當下的AI專注于認知與大數(shù)據(jù),例如在計算機視覺、語音識別和自然語言處理中。通過與不同的垂類合作,結(jié)合工程和科學研究,AI在騰訊賦能內(nèi)部業(yè)務(wù)職能推動了行業(yè)變革。
(2)AI+游戲
AI+游戲領(lǐng)域,騰訊 AI Lab 一直走在行業(yè)前列。與王者榮耀共同探索的前沿研究項目 - 策略協(xié)作型 AI 「絕悟」今年8月初在吉隆坡舉辦的王者榮耀最高規(guī)格電競賽事——世界冠軍杯半決賽的特設(shè)環(huán)節(jié)中,在職業(yè)選手賽區(qū)聯(lián)隊帶來的5v5水平測試中獲勝,升級至王者榮耀電競職業(yè)水平。測試結(jié)果代表騰訊在深度強化學習、多智能體決策智能課題上的國際級 AI 研究水準,也標志著公司在攻堅通用人工智能( Artificial General Intelligence)難題上更進一步。實驗室早在2016年研發(fā)的圍棋 AI “絕藝”(Fine Art),現(xiàn)擔任中國國家圍棋隊訓練專用 AI ;2017年,“絕悟”開始研發(fā)并在約一年后達到業(yè)余頂尖水平,騰訊還在清華聯(lián)合團隊在射擊類頂級 AI 競賽 VizDoom 奪冠,并在《星際爭霸2》首先研發(fā)出擊敗內(nèi)置 AI 的智能體。
AI+內(nèi)容,通過推薦算法優(yōu)化推薦用戶喜愛的內(nèi)容。在騰訊視頻里,我們提供了超分辨率和視頻分類的技術(shù)。此外,我們還探索了對視頻內(nèi)容的深度理解、編輯與生成。比如,讓機器深度分析一個視頻,識別其中人物、物體、場景,并分析它們的關(guān)系,并在時間順序識別視頻中不同的動作和事件,產(chǎn)生能表達出視頻豐富語義信息的語句。
AI+社交,進一步探索面向未來的人機交互新形式,通過跨學科、跨模態(tài)的交叉多模態(tài)研究,讓機器用感知判斷人類情緒,用認知判斷意圖,并進行更復雜的分析與決策,從而不斷向真正的人類智慧靠近。代號T.E.G的虛擬人就是騰訊多模態(tài)研究的代表,它集合了計算機視覺、語音、自然語言理解到智能決策協(xié)作等多種AI技術(shù)于一身,目標是不斷逼近人類智慧。她穿梭于演唱會、體育或電競比賽、教育課堂等不同場景,在虛擬助手、解說、老師到歌舞姬形態(tài)上具有無窮潛力。
AI+醫(yī)療領(lǐng)域,騰訊致力于打造篩查-診斷-治療-康復全流程的醫(yī)療解決方案,并探索更多技術(shù)可能性,希望產(chǎn)品能真正在醫(yī)院和醫(yī)療場景落地,切實幫助到醫(yī)生和患者。我們在顯微鏡這種古老而重要的醫(yī)療器械中加入了AI與AR技術(shù),讓機器自動識別、檢測、定量計算和生成報告,并將檢測結(jié)果實時顯示到醫(yī)生所看目鏡中,在不打斷醫(yī)生閱片的同時及時提醒,提高醫(yī)生的診斷效率和準確度。今年我們還會繼續(xù)通過“騰訊覓影”產(chǎn)品深入探索AI+醫(yī)療的應(yīng)用,目前圖像處理技術(shù)已用在食管癌、肺癌、糖尿病性視網(wǎng)膜病變等疾病的早期篩查上,語言和語音處理技術(shù)也用于智能導診和輔診上。
AI+農(nóng)業(yè),我們也邁出了一小步——一個很會“種”黃瓜的AI。在荷蘭舉辦的國際AI溫室種植大賽里,我們利用傳感器和攝像頭自動收集溫室氣候、作物發(fā)育情況等環(huán)境和作物數(shù)據(jù),再用深度學習模型計算、判斷和決策,驅(qū)動溫室的設(shè)備元件,遠程控制黃瓜生產(chǎn),最后獲總比分第二、AI策略第一的成績,還開心收獲了3496公斤黃瓜。
三、未來發(fā)展方向
騰訊目前將繼續(xù)立足腳下,利用好人工智能(AI)、大數(shù)據(jù)(Big Data)和云計算(Cloud Computing),即ABC科技,構(gòu)建新型基礎(chǔ)設(shè)施,做“數(shù)字化助手”的標配,形成科技創(chuàng)新與產(chǎn)業(yè)應(yīng)用相互促進的良性循環(huán),這在醫(yī)療、安防、零售、交通與娛樂行業(yè)已經(jīng)有所體現(xiàn)。
同時,騰訊也將放眼未來,在核心技術(shù)上推進前沿、原創(chuàng)和開放性的基礎(chǔ)研究,并在關(guān)鍵性技術(shù)上前瞻性布局ABC 2.0技術(shù)版本,即人工智能(AI)、機器人(RoBotics)和量子計算(Quantum Computing)的全新ABC組合。
我們還成立了企業(yè)級機器人實驗室騰訊 Robotics X ,構(gòu)建AI+機器人雙基礎(chǔ)部門,打造虛擬世界到真實世界的載體與連接器。實驗室的主要任務(wù)是攻克A到G的7大技術(shù)突破點:一是攻克“ABC”基礎(chǔ)能力,即人工智能(AI)、機器人本體(Body)與自動控制(Control);二是探索“DEFG”機器智能,包括進化學習(Developmental Learning)、情感理解與擬人(EQ)、靈活操控(Flexible Manipulation)等能力,最終實現(xiàn)成為人類守護天使(Guardian Angel)的終極目標。
我們做了一些展示型的Demo, 分別是絕藝圍棋機器人、桌上冰球機器人、機器狗Jamoca。
總結(jié)
以上是生活随笔為你收集整理的2019 WAIC | 腾讯张正友:人工智能的热与酷的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 正在直播 | 美女小编带你看2019世界
- 下一篇: 一文读懂数据库最新技术趋势:TDSQL带