科大讯飞副总裁刘鹏:人机交互的未来是人人交互?
嘉賓介紹
劉鵬(微博&知乎:北冥乘海生/公眾號:計算廣告),現任科大訊飛副總裁,大數據研究院院長。劉鵬在清華大學獲得博士學位后,加入微軟亞洲研究院,從事人工智能研究。后參與創建雅虎北京研究院,出任高級科學家。劉鵬還曾擔任MediaV首席科學家、360商業化首席架構師等職。在多年從業經歷中,劉鵬一直致力于將人工智能方法與海量數據相結合的工業界問題,負責過多個大型互聯網商業產品體系。
Q1.?怎樣才能在大公司里得到晉升?
大公司里,項目成果被截和的概率,正比于項目的成功程度。
如果你不明不白地擼起袖子就干,就算是項目大火,最多也就落得慶功宴上領導致詞里輕描淡寫的點贊:在CEO的英明領導下,COO的大力支持下,CAO的全力配合下,我帶領團隊,與某某和某某的兄弟部門密切配合,取得了階段性的成果。在此,我們要對某某、...、某某(你)等骨干員工提出表彰,并給他們每人加發半個月的獎金!?
因此,要想獲得credit,做事前起范兒至關重要。在事情八字還沒一撇的時候,沒幾個人會跟你來搶功,趁著這個機會,一定要充分請示、頻繁匯報,planning、brain storming、kick off搞個不停,一直到碼皇們耳朵都磨出繭子,冊封你為這個項目的負責人,全公司上下也都知道你有御賜的尚方寶劍。事情傳開了,別人再來搶功,就師出無名了。
在大公司里,當一個干部管理的團隊充分大時,他只有升職和離開兩種可能的后續狀態。
項目成敗在天,干部晉升在人。把仕途寄托在虛無飄渺的項目成敗上,是對自己不負責任的表現。趁著項目開工,迅速擴大團隊的話,則可以立于不敗之地——老板絕不可能承認一個高調成立的隊伍啥也沒干出來,因為那也是他的失職,最后只好找個機會給你升職加薪,這樣的事情,在大公司呆過的應該都見過不少。
所以,這一步是干部往上升最核心的步驟:巧立一個名目,招到十來個人,經理的職位就算是穩了;如法炮制搞個大事情,招到大幾十個人,再抓住各種機會多要點headcount,基本上就可以進入中層了。
我還聽說某公司一位真正的高手,連名目也跳過了:在移動應用大火的那兩年,這位經理主動跳出來說,我要為公司招100名iOS和安卓工程師!干什么先別管,這是公司的戰略儲備!老板激動得涕泗橫流,當即批復:馬上干!后來,這位就成了移動開發事業部的總經理。
怎么把小公司20人搞定的事兒編制出200個headcount,還顯得倍兒有道理呢?這方面需要專門的技巧和經驗了,回頭有機會我們專門撰文說明。
Q2. 從事互聯網行業的人員如何避免出現中年危機這種狀況?
PPT路線:這條路線,是從寫代碼的崗位轉入寫PPT的崗位,比如產品、運營、領導秘書,或者仍在技術團隊中的項目管理、架構等角色。
分析此路線的好處,首先在于PPT技能隨變化很慢。我翻了翻十幾年前看過的一些講稿,放到今天也基本能糊弄過去。因此,PPT崗位不太容易因為技術的驟然升級而被淘汰。另外,雖然PPT能力非常容易習得,可是相配合的演講能力卻需要一番磨煉,總體來說比碼農的上手速度也要慢。
Politics路線:這條路線,是從生產力崗位轉入生產關系崗位,一般來說就是各種管理崗。這條路性價比高,競爭也激烈,要有意識地構建好自己的能力,才有機會進入。
這條路線的兩個速度都很慢:搞生產關系這事兒,需要長時間與人斗的歷練,核心能力的習得過程相當漫長,除了天賦異稟的白頭山天降偉人,一般都是老而彌堅。另一方面,與人斗的技能樹,中國在奴隸社會以降,就沒有太大變化,以至有“半部論語治天下”的說法。所以,向這個方向努力,對碼農來說,是逃離職場中年危機的通途。
Paper路線:這條路線適應者相對較少,不過卻非常有效。簡單來說,能夠跟學術界搭上點兒關系,在此序列里標名掛號,比只會coding,長期職業生涯會順利得多。
Q3. 目前人機交互有哪些難點?
今天所有實用的人工智能產品,都是用的“弱智”方法。簡單來說,就是湊答案:準備一大坨標注好的數據,然后用大量機器堆上去狂撩,直到把答案湊個八九不離十。至于問題的內在邏輯和簡約規律,今天的AI既無心顧及,也無力解讀。
“弱智”方法在數據充沛的領域,可謂所向披靡:無論是語音識別、人臉識別,還是機器翻譯、各種棋類,機器都已經接近乃至碾壓真人了。且慢!機器翻譯都快解決了么?翻譯可比聊天要難吧?不然,機器翻譯這個問題,答案是比較好湊的:找到足夠多的語言對數據,把詞譯過去跟麻將牌一樣碼好了,再調整一下順序即可。人機對話則不然,我們要找到對方語言里的關鍵信息,把它轉化為動作,再把動作的結果反饋回去。這些關鍵信息處理的過程,是要經過統計意義上的推理過程的。
說到推理,當然離不開句子表達內容以外的背景知識。比如你問機器:“直徑為10的球體積是多少?”機器就得會球的體積公式才算得出來。當然,微積分、背古詩、查法典這樣的知識,對機器來說總是可以解決,因為有大量書本上的語料可供學習,按照弱智大法湊答案即可。難就難在,這世界上還有大量的知識,根本沒地方學去。
Q4. 人機交互的未來是要做到人人交互嗎?
從開始探索人機交互,我們就想當然地認為,把人人交互的那一端由人變成機器,就是人機交互的理想模式了。于是,我們設計出來的機器人,也都是倆肩膀扛個腦袋,四肢五官齊備,用語言的方式跟對面的人類交流,再加上對常識一竅不通,怎么看怎么像個二傻子。
問題出在哪兒了呢?人類的信息交互,最高效的輸出方式是“說”,也就是音頻通道;最高效的輸入方式是“看”,也就是視頻通道。如果你對面是個真人,那沒辦法,雙方都只能靠說輸出信息,這就形成了語音為主的交互方式。而靠語音的人機對話,是這樣的畫風:
我想訂一張明天去上海的機票
為您查到:6:35海南航空HU7611,票價480元;6:50吉祥航空HO252,438元;6:50廈門航空MF8178,票價...
我去你大爺的吧!
別樂,就算對面不是機器是個真人客服,這種交互也同樣令人抓狂,有過電話訂票經歷的朋友都有體會,只不過對著活人您不好意思罵街罷了。
既然對面是個機器人,就沒必要如此拘泥了。實際上,機器的交互方式,應該跟我們“相反"而不是“相同”:你輸出信息靠說,機器人接受信息就得靠聽,這沒錯;你輸入信息靠看,那機器人輸出就別靠說了,何不在一塊屏上展示出來呢?這樣,不但信息輸出效率提高了很多,而且用戶只要在展示的信息底板上做選擇題,就算用語音輸入也大為便捷。
所以,真正適合人機交互的機器人,最好有個視頻輸出的設備,近了靠手機就可以,遠了怎么辦還值得探討。這個概念,就是訊飛的胡郁老師講的“強視覺呈現的語音交互”吧。這種模式下的交互方式,已經跟人人交互有了質的區別,未知之處很多,需要我們深入探索。當然,可以確定的是,機器人絕對應該拋棄人形,以避免用戶用人的眼光和標準來評價它。
人機交互這件事,看起來簡單,卻是人工智能王冠上最耀眼的一顆明珠。目前看來,嚴格意義上的圖靈測試離我們還相當遙遠,不過通過交互方式和產品上的創新,一個在特定領域內可用的合格助手,或許已經在向我們招手了。
另外,由于計算機對海量信息的檢索和處理能力遠勝人類,或許可以讓機器助手輔助人人交互,這樣既能大大提高內容溝通效率,又能發揮人的情感溝通優勢,這沒準是目前更加可行的產品路線。
Q5. 人工智能的發展前景如何?
我進入這個行業已經有十多年了:博士期間,我做的是語音是別的研究,畢業開始又到MSRA接著干這個。雖然我們的兩任院長——李開復老師和洪小文老師都是語音研究出身,卻絲毫不能改變當年這一項目在全院最雞肋的地位。因為在當年,各種各樣的人工智能應用能真刀真槍上陣的并不多。更別提要是向互聯網界提起自己是做“人工智能”的,那簡直就像在兩會會場上上偷看了毛片那樣無地自容。實際上,那個時期,正是人工智能發展的第二落。
以史為鑒,可以知興衰。為了探討人工智能的發展前景,我們簡單回顧一下人工智能前面發展的三起兩落。
一、六十多年前的達特茅斯會議,提出了“Artifitial Intelligence”的課題,目的是讓逐漸成熟的計算機能夠代替人類解決一些感知、認知乃至決策的問題。這樣一個課題是如此令人神往,也迅速吸引了大量學者的眼球,相關的研究也如火如荼地開展了起來。是為第一起。
二、初,學者們解決人工智能問題的思路,是以人為師,通過專家編制規則的方法,教機器下棋、認字乃至語音識別。在今天看來,這樣的方法是完全南轅北轍的——人類的視聽器官雖然很發達,卻并沒有能力總結提煉其中的規律。于是,人工智能的美好憧憬中迎來了殘酷的現實,學者們發現解決問題是如此遙遠,圍觀群眾也一度認為人工智能的學者都是騙子。是為第一落。
三、既然靠人指導不行,那就要祭出“實事求是”的法寶,從數據里統計規律。在這樣數據+統計的方法論下,諸如人臉識別、手寫識別等一些較為簡單的問題取得了重大進展,而在當時最困難的問題——大詞表連續語音識別上,統計方法也是史無前例地造就了實驗室中“基本可用”的系統。到此時,我們感覺找到了解決人工智能問題的基本思路。是為第二起。
四、數據+統計模型的方法盛行以后,也很快遇到了瓶頸:數據量的提升并不總能帶來識別率的提高。當然,我們很早就知道“深度模型”比“淺層模型”學習數據的能力強,無奈這種模型的計算代價極高,只能望洋興嘆。拿語音識別為例,在“基本可用”到“實用”之間的鴻溝,十幾年都沒有跨過去,于是大家又轉向悲觀,覺得人工智能還只是個夢。是為第二落。
五、第二落以來,繼續堅持在“深度神經網絡”這條戰線上的學者很少,因為做這個是拿不到funding的。其中有一位老前輩Jeffrey Hinton,和他的學生Alex一起,發現用GPU算神經網絡,能大幅提高速度,于是這種模型居然可能實用了。一旦實用,深度模型可以瘋狂吸收數據的優勢就發揮出來了,于是在語音識別、圖像識別等領域帶來了飛躍式的進展。是為第三起。
當然,工業界的看到的這第三起,比我們上面輕描淡寫提到的內容要波瀾壯闊得多。不過,不要太在意,因為各路大佬不論過去是做黑產、賣假貨還搞劫持的,都搖身一變成了人工智能的忠實擁躉和業界先驅——雖然他們的數學也就是初中肄業水平。去年,當我聽到某此類上市公司老板歇斯底里地在財報中喊出要投入數千萬美元搞人工智能時,不由心生感慨:修腳的可以掛妙手回春的錦旗,但千萬別說自己是做精準醫療的!
雖然人工智能的第三起確實有了質的發展,但考慮到這些沉渣泛起的為人工智能從業者,我覺得第三落還是會來到,只不過并非對行業本身的懷疑,而是自我凈化罷了。
而人工智能的行業發展趨勢,由于大規模數據+大規模算力的基本方法論已經成熟,今后的發展路徑是十分清楚的:在那些數據儲備充分、商業價值清晰的場景,人工智能會迅猛發展,投身于這樣的行業中期發展會非常好;而醫療、教育這類領域,由于電子化數據的整理與積累尚需時日,可以需要一個較為漫長的發展過程。
PMCAFF問答專場是一場與PMCAFF用戶互動的問答活動,我們每期都會邀請知名互聯網公司的一線產品從業者和咖友們共同交流,目前已成功舉辦過60+期,先后有來自騰訊、百度、阿里、360、小米、京東、去哪兒等大廠嘉賓入駐。
這個世界問題太多,我們需要一個能夠解決問題的人。
如果你有足夠的能力解決來自PMCAFF用戶在你的專業領域中,以不同的角度提出各類刁鉆問題,那么歡迎你參加PMCAFF問答專場。
活動申請可以添加工作人員微信溝通咨詢,加好友請備注:問答專場。
總結
以上是生活随笔為你收集整理的科大讯飞副总裁刘鹏:人机交互的未来是人人交互?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 一文弄懂用户画像以及如何召回用户
- 下一篇: 创业第一站丨产品经理、海归转型成创业者有