人工智能之旅,真的特别费人工!
https://www.toutiao.com/a6695636734782210572/
?
白箋黑字,道不盡人工智能,飛龍在云魚在水,此情夢想難寄!旭日獨倚東樓,鴻雁巧上簾環,太公不知何處,直鉤依舊沉浮。
人工智能在未來社會中將會繼續開發,成功地將人工智能付諸行動并不是商業的一次嘗試,商業需要對它進行根本性的反思。
?
?
?
(圖片來源于互聯網)
01
圖靈測試(Turing Test)
橫亙在人工智能面前的壁壘
?
?
?
圖靈測試示意圖(圖片來自網絡)
1950年,英國數學家艾倫.麥席.圖靈提出的關于區分人工智能的一個測試,測試中要求一個“人”和一臺擁有“智能的機器設備”在互不相知的情況下,進行隨機的提問交流。如果超過三成的測試者沒有發現對方是機器設備,那就代表了這臺設備擁有“人類智能”。
圖靈當時預測人工智能通過“圖靈測試”的時間是2000年左右。
看來這是一個失敗的預測,圖靈先生太樂觀了。
70年過去了,一個偉人曾經說過:“三十八年過去,彈指一揮間!”,這都彈了兩下響指了,還是不能揮去這個幽靈般存在的壁壘。
七十年,好多人都被滅霸的響指彈的灰飛煙滅了,可這個壁壘依舊存在!
歷經七十年,人工智能在深度學習、大數據分析、混沌模擬、模糊識別、神經網絡等方面已經取得了長足的進步,而且,似乎每隔幾年,就會冒出一則“大新聞”:“某某計算機又完全通過了圖靈測試”!
但是,但是,但是卻依然沒有“任何一個”,此處要敲黑板了,注意,是沒有任何一個人工智能真正地通過圖靈測試!全球的科學家們,依然徘徊在圖靈測試的壁壘之前,舉步維艱。
?
?
?
(圖片來源于互聯網)
02
人工智能三階段
伴隨思維的提升而提升
一直以為,人工智能離我有點兒距離,光聽聽這個高大上的名字已經把我嚇尿了。經歷了若干年的研發產品和實際項目之后,卻發現其實我早在1985年就已經開始了這段旅程,原來他一直就在我身邊,一直在陪伴著我,只是,他太狡猾了,每隔幾年換一個名字!而我,一直到這幾年才搞清楚,他原來一直就有個大名“人工智能”。
自動化旅程,我的第一段人工智能之旅始于1985年,那一年,我用喬幫主的Apple II寫下了第一段人工智能代碼。
很簡單,就是if......,goto......;的集合,通過這些代碼,控制了機械操作的各種行為和動作。真的是好痛苦的,我要針對所有的可能性都加一個“if”和“goto”或者“then”,去做要執行的事情。那個時候“人工智能”的名字叫做“自動化”或者“自動化控制”。工作量特別大,其實更主要的是特別費腦,是靠人腦來遍歷和窮盡各種可能性,并為每種可能性寫出要執行的操作。
這段旅程現在看來很簡單,但它卻讓不少的操作工失去了飯碗,效率得到了大幅度的提高。罪過啊!
原來我一天只能完成2次正交實驗,變成了一天可以做12次,這是6倍的效率提高。
顯然,這種人工智能的智慧是永遠不可能超過人類,不,是不可能超過我的智力的。它所有的知識都是我賦予給它的,而它只能簡單機械的去執行,它根本就沒有靈活性,我有多傻它就有多傻!一旦遇到我沒有考慮到的,它就不知所措,黑底綠字的屏幕就會一閃一閃亮晶晶的看著我。
遍歷旅程,進入21世紀,計算機的計算速度一秒可以算幾百萬次甚至更快,這對人工智能來說是一個福音啊。我總算可以編寫一個程序,然后,讓程序去把所有的可能性都去嘗試一遍,并將嘗試結果依次展現出來。這個時候的代表作就是IBM的“深藍”,他打敗了人類國際象棋的第一高手。當時,很多不負責任的編輯就開始猜測“深藍”何時能主宰人類了。但事實是,這種遍歷算法雖能窮盡所有可能性,但是如果需要遍歷的可能性太多,就算是超級計算機無能為力。所以,那個時候的“深藍”無法戰勝圍棋選手。看似只有19*19個交叉點的圍棋,其變幻是無窮的。真的計算一下的話,假設我們一秒鐘數過一種棋形變幻,要把全部的棋形數完,大約要數億年的時間。即使是計算機也不可能很短時間內去嘗試每種可能性。
遍歷旅程中的人工智能雖強大,卻無法應用在遍歷可能性過多的領域里,所以通用性不強。因而也就沒有太多的用武之地!
神經網絡階段,偉大的摩爾定律驅使著芯片的快速發展,這次總算吧我們帶到了第三段旅程了。20世界40年代被提出的神經網絡算法使得人工智能趨于完美。
與數字計算機比較,人工神經網絡在構成原理和功能特點等方面更加接近人腦,它不是按給定的程序一步一步地執行運算,而是能夠自身適應環境、總結規律、完成某種運算、識別或過程控制。人們只需要預先給出大量的數據,然后設計一套通用的神經網絡模型,再把這些數據帶入神經網絡,讓網絡自己反復計算,這個過程就叫訓練,一旦訓練次數足夠多,其自己積累的知識和經驗就會出現爆發式的增長,計算機在很短時間內完成計算并讓神經網絡學會某項技能。
AI現在才開始智能。
即便如此,我們現在仍然不得不承認,要通過圖靈測試,人工智能依然可能是在短時間內無法突破的瓶頸。
?
?
?
(圖片來源于互聯網)
?
03
人工智能受限于數據
人工智能也許并不智能
人工智能在今天已經得到了愈加廣泛的重視。并在機器人,經濟政治決策,控制系統,仿真系統中得到應用。
人工智能比較合適的應用范圍:機器翻譯,智能控制,專家系統,機器人學,語言和圖像理解,遺傳編程機器人工廠,自動程序設計,航天應用,龐大的信息處理,儲存與管理,執行化合生命體無法執行的或復雜或規模龐大的任務等等。別開這些高大上的名詞,用我們能聽懂的話來說就是:指紋識別,人像識別,文字識別,圖像識別,車牌識別、語音識別等應用逐漸成熟,自動駕駛已經推出,智能搜索、計算機視覺和圖像處理、機器翻譯和自然語言理解、數據挖掘和知識發現也已經被大幅利用在互聯網技術上。
值得一提的是,被某些以商業目為出發點的公司宣稱的機器翻譯是人工智能的重要分支和最先應用領域。不過就已有的機譯成就來看,機譯系統的譯文質量離終極目標仍相差甚遠!
神經網絡計算之旅讓我們看到了希望,但是,這一旅程確實是一個苦旅。
期間,我們需要人事先將數據準備好,然后才能喂給神經網絡自己去訓練。但是,搜集數據的過程,工作量實在是非常非常巨大的。
在人工智能飛速發展的時代,機器已經初步具備人的視覺、聽覺、語義識別的能力。同時如果要讓機器變得越來越“聰明”,需要大量優質的數據來提升機器學習的準確性。
下圖是人工智能在智能呼叫中心總的一個應用。
?
?
?
(圖片來源于華云數創)
看似簡單的一個架構,要讓機器變得越來越“聰明”,需要大量優質的數據來提升機器學習的準確性。
要完成這樣一個智能機器人坐席,必須經歷“數據采集---數據標注---建模---用標注好的數據訓練模型---模型反復測試---智能機器坐席”這樣一個冗長的過程。在這個過程中數據采集和數據標注是工作量最大的兩個環節,需要大量人工采集數據,以及大量人工標注數據、反復檢驗數據。之后,才可以提供最優質的數據給到機器做學習和訓練。
人工智能最基礎的、最最重要的一環卻是最不智能的一環。網上,有很多的號稱作標注的公司的收費都是按小時計的,價格相當的昂貴。為什么?因為是人工啊!
華云數創(北京)科技有限公司擁有極強的數據治理能力和工具,但是他們也只能在數據采集這一層做到主動搜集需要的數據,多源異構、結構化、半結構化、非結構化等對于華云數創來說都是小菜一碟,他們的工具還能做到自動的數據治理,包括數據目錄、元數據管理、血緣分析、ETL等等。但是當筆者問及,在他們做的這個人工智能智能呼叫中心時,如何能提高機器訓練的準確性、如何提高語音、語意和識別率和理解力等問題時,華云數創的技術負責人也只能苦笑,給了筆者一個字的答案,就是“人”。這是一個費人工的活,目前還沒有其他好的辦法!
?
?
?
上表給了一個特殊的例子,對住宅小區名字的識別,我國小區取名字是很有意思,跟我們個人取名字一樣,存在大量的同音、近音字的現象,而且由于南方人發音嚴重不準,要想準確讓機器識別出目標小區,是一件困難的事情。當然,這難不住人,功夫不負人力,大量的人力幫助了人工智能的智能,上面的抽樣結果看到了一些智能的感覺。
不知道以后技術的發展能否做到不在這么費人工的人工智能呢?讓計算機自己去擴詞、去標注、去訓練,然后自己去評估學習效果,那這就更加完美,我一起去期待吧!
04
深度學習是本輪人工智能爆發的關鍵技術
但似乎仍是“曲線擬合”,具有學到結果的不可解釋性
人工智能視覺和自然語言處理等領域取得的突破性進展,使得人工智能迎來新一輪爆發式發展。而深度學習是實現這些突破性進展的關鍵技術。
基于深度卷積網絡的圖像分類技術已超過人眼的準確率,基于深度神經網絡的語音識別技術已達到95%的準確率。
1、深度學習隨數據規模的增加可不斷提升其性能
2、深度學習可從數據中直接提取特征,削減了對每一個問題設計特征提取器的工作
卷積神經網絡廣泛應用于計算機視覺領域,在圖像分類、目標檢測、語義分割等任務上的表現大大超越傳統方法。
撇開深度神經網絡的模型復雜度高,巨量的參數導致模型尺寸大、模型訓練所需的數據量大,訓練數據樣本獲取、標注成本高、有些場景樣本難以獲取、應用門檻高,算法建模及調參過程復雜繁瑣、算法設計周期長、系統實施維護困難等問題不談。
圖靈獎得主貝葉斯網絡之父Judea Pearl指出當前的深度學習不過只是“曲線擬合”,缺乏因果推理能力。
由于內部的參數共享和復雜的特征抽取與組合,很難解釋模型到底學習到了什么,存在學習結果可解釋性問題。
?
?
?
(圖片來源于互聯網)
05
市場是路由器
轉化和優化的結果就是推動人工智能的創新
人類最重要的一個發明可能就是市場。參與市場的結果就是導致了對別人有價值的服務和體驗和產品。
我們每個人為了自己的意愿,不管這種意愿是什么目的,當基本上都是為了自己的利益或者夢想出發的,很有意思的是,其結果卻是給其他人帶來了利益。
市場的快速無情的反饋,會對任何好的思想,有生命力的技術,有高價值的場景,起到推波助瀾的作用。任何淘汰的落后的東西,市場一定會有信號指示,并被快速濾掉。
多年前,對于大量多源異構數據的處理也是存在于數據報表領域的一個大難題,需要大量的人力進行處理和導入;同樣,對于統一財務系統中大量重復性流程勞動也是需要大量的人力來處理;這類費時費力的低價值的勞動,在今天的人工智能時期,對了,應該叫做“弱人工智能”時期,有其必要性,相信在不久的將來,通過市場這個最有效的途徑,很快會有新的突破。
也許人工智能目前真的是人工為主,就像是無盡的黑暗,但黑暗的盡頭是人類文明新的征程。
總結
以上是生活随笔為你收集整理的人工智能之旅,真的特别费人工!的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 念数字
- 下一篇: android 服务自动运行怎么办,怎么