第四范式蒋仁皓:什么才是构建企业AI的关键要素
或許在我們想象中人工智能已經如星火燎原般迅速蔓延到各種行業、場景里面取代或者幫助人提升一些業務價值了,但事實到底是否如此?在落地中,什么才是構建企業AI的關鍵要素??
?
?
11月30日,在清數大數據產業聯盟與清華校友總會AI大數據專委會(籌)共同主辦的金融大數據行業思享會上,第四范式咨詢副總監蔣仁皓分享了金融行業構建AI核心能力的實踐。蔣仁皓重點介紹基于學習圈的金融業務的AI核心能力構建方法,來自中國銀行、包商銀行、電信公司、微軟公司等相關業務領域近30余位業內人士參與交流和討論。
?
AI到底是什么?我們為什么要幫助企業構建AI核心能力?
?
我們對本次分享的精彩內容進行了整理,在不改變原意的前提下有刪改:?
?
我們可以從兩個數字講起,一個是5598.82億美元,一個是2914.61億美元,前者是亞馬遜,后者是沃爾瑪,這代表了兩個上市公司的最新市值。在今年四月份的時候亞馬遜還在4400多億,沃爾瑪是2200多億,當過了半年之后我們發現兩家公司的市值差距從原來的一倍越拉越大。但我們要知道在2005年的時候亞馬遜市值可能只有200多億,沃爾瑪的市值卻接近了2000多億,亞馬遜只有其十分之一。在2005年到2016年期間,亞馬遜的營業收入開始以10-20%的速度增長,甚至有些年份達到了40%。但反過來看沃爾瑪的增長率,卻維持在了個位數,有些年份更是零增長或者負增長。
?
這表明亞馬遜正在迅速的擴張,雖然其與沃爾瑪本質上都是零售行業,但因為亞馬遜的業務線豐富,導致亞馬遜逐漸蠶食沃爾瑪的利潤空間與客戶,使得亞馬遜市值一路走高,到2015年7月份終于超過沃爾瑪,在2016年的時候,亞馬遜市值飆升到全球第四。
?
另一個角度分析兩家企業
?
這兩家公司還有一個角度可以對比一下,即兩家企業每一位員工給企業創造的價值,沃爾瑪是22萬美元,亞馬遜是62萬美元,是沃爾瑪的三倍。但是,沃爾瑪這個從營業規模上來看依然是世界500強排名第一的企業真的是一個菜鳥嗎?我們都應該聽過一個耳熟能詳的例子:啤酒和尿布。無論這件事是真是假,都說明了一件事情,沃爾瑪并不是一個菜鳥。其實沃爾瑪一直在用數據驅動它的業務,它會基于不同的地方,根據數據分析周圍的客戶群行為模式、消費習慣、偏好,然后決定這家店里面的商品如何擺放,做到了每家店都不一樣,成為了千店千面。
但是這個問題十分復雜,沃爾瑪到2015年的時候全球有一萬家店,它要解決的問題是萬級的復雜度。而亞馬遜是完全基于客戶的,即使這個客戶在不同的時間點偏好都不一樣,它依然會針對這個客戶去分析客戶最有可能感興趣的商品,給客戶一個定制化的面向客戶的商品擺放,所以亞馬遜在解決商品擺放這件事上是億級別的復雜度。
?
《經濟學人》有一句話:當沃爾瑪還在研究怎么幫助客戶省錢的時候,亞馬遜在做的是怎么讓客戶更快地找到他想要的東西。亞馬遜正是通過這樣的方式不斷提升客戶的體驗,從而去蠶食競爭對手的利潤空間。?
?
新的利潤的增長點在哪里
?
在上世紀90年代,大家的競爭是靜態的,但移動互聯網的時代來了之后,資本的大量進入導致了人們發現可以通過快速的擴張,從而占領更多的市場和客戶,這時候大家只需要做的一件事就是比誰跑得快。這時我們會發現另一個新的問題:當增長到一定程度之后,所有的客戶都被圈完了,新的利潤的增長點在哪里?無非兩種情況罷了,第一是改變商業模式,從而找到新的商業增長點,但這件事情相對來講是很難的,因為整個企業的業務會發生很大的變化。第二種是從競爭對手那邊搶客戶,依靠好的產品搶奪客戶,這也叫做企業的競爭力。
?
企業競爭力從哪來?
?
最重要的一點是決策的能力。
決策的能力分成兩方面,第一是決策的好壞,第二是決策的速度。
決策能力的差異體現在精細化、差異化,即針對每個人更精細化、差異化的做經營,這是體現經營能力的地方。而想要提升經營能力或者決策效率,背后有一個很重要的能力是人工智能,人工智能去做這件事情會更快、更細。?
?
人工智能的發展
?
人工智能的概念并不新鮮,在上世紀五六十年代的時候就已經有人提出人工智能的概念了。在上世紀五六十年代大家都很樂觀,覺得這件事情一定能夠做成,二十年內機器一定能在所有領域超越人類,但后來這件事情并沒有發生。到了七十年代,大家想通過一些專家系統的方式做人工智能,結果是失敗了。當九十年代深藍打敗卡斯帕羅夫的時候,依然是失敗了,因為深藍并不是人工智能,它靠的是暴力搜索。一直到21世紀,我們又回到了模仿人類這條路上來。
AI模仿人類背后有幾個條件。一個是大數據,大數據是現今人工智能能夠做成的非常重要的必要條件,現在全球的數據大概以每年50%的速度增長,這是一個數據爆炸的時代。第二個是計算資源價格的下降,計算資源變得越來越便宜。第三是計算的架構變得越來越成熟。第四是現在一些分布式計算技術的成熟。
?
機器學習與分析數據
?
分析數據這件事情并不新鮮,從上世紀90年代有了信息化系統、有了數據之后,人們就開始分析數據。但我們現在做的分析數據與以前的分析數據有很大的不同,這種不同是體現在傳統的大數據分析會做一件叫抓大放小的事情。抓大放小的意思是如果有一億條數據,我們會從里面抽出一些數據拿來做分析,另外則是找一些專家通過一些方法和工具分析,把我們認為最有用的特征抽出來,然后用這些特征讓一些算法跑出一個最后的東西。?
?
這使得傳統大數據分析具備了兩個特性:
?
一個是抽樣,一個是降維。
?
但用機器學習方式做數據分析的時候,首先不會做抽樣的事情,也不會做降維,甚至還會升維。
?
有人問,是不是有了VC維就代表我們有了一個AI的核心能力?VC維上升是否就代表企業AI能力上升從而提高了競爭力?
?
舉個例子,VC維就像我們現在有了一個性能非常強勁的發動機,但有了發動機不代表我們就有了一輛跑車,我們還要給它配相適應的底盤、變速箱、車架以及排氣管,有了這些才算是真正的跑車。
?
構建企業AI的關鍵要素
?
企業要具備什么樣的東西才能被認為是具備了AI的核心能力?這里借鑒大衛·庫伯提的理論:三歲以上的人學習東西是有一個過程的。第一件事情是有行動,去做一些事情,基于這些行動會得到一些經驗,有了這些經驗之后會去思考能學到什么,以及能夠總結出什么樣的經驗,下次要如何去做,通過這些反思去得到一些理論,從而指導我們下一次的行動。
?
機器學習的過程與這個理論本質上是一樣的,我們要做人工智能或者機器學習要具備一些要素。第一是大數據,首先大數據不是一個絕對的概念,大數據并沒有一個嚴格的標準,它是一個相對概念,我們需要的是有一定量的數據幫助機器學習,在這個過程中最重要的是去積累這些數據,并加上反饋數據訓練一個機器學習模型的過程,從而幫助我們總結經驗。在這個過程中有一個很重要的叫算法,即實現這些算法或者面向一個海量數據用這些算法訓練模型所需要的基礎架構。
?
讓機器實現學習圈。AI核心能力還要建設一個學習圈,讓它變成一個可以像人一樣去學習去決策并不斷自我學習的一個應用,所以它要解決的不僅僅是一個算法的問題,我們還要把數據引進來,然后把這些數據結合反饋數據放到一個算法里面訓練,訓練完之后這個模型才可以上線、發布、應用。然后我們去收集反饋,不斷迭代。
一個企業要構建AI能力,除了要覆蓋端到端的機器學習或者人工智能從訓練到應用到不斷地自迭代、自反饋的過程之外,也要注意一些關鍵因素。
?
-
第一高維度,它決定了你和別人差異化的優勢。
-
第二算法的豐富性,很多時候我們面對不同場景需要用到的算法是不一樣的,可能面對一些場景需要用邏輯回顧、一些場景需要用決策樹、一些場景需要用深度神經網絡等等。所以我們需要應用不同的算法解決不同的問題。
-
第三高性能,很多時候資源是有限的,比如計算資源,計算資源即是計算的成本,比如做一件事情要用1萬臺機器的集群才能把這件事情做出來,這件事情就會變得不可行。第二個是時間資源,如果一件事情需要算三個月才能行,但三個月后業務上的需求可能都已經過去了,所以這些事情都是有制約的,這就需要我們具備高性能的設備去計算那些海量的數據。
-
第四是時效性,在移動互聯網的場景下,很多場景對時效性都有非常高的要求,要在非常有限的時間內算出結果進行反饋。
-
第五是持續演講,一個成功的業務除了單個業務的學習環之外,還需要與其它業務之間相互促進相互融合,需要平臺對這些業務的融合上有些持續演進。
-
第六,實現統一管理,即除了自己的算法、框架以外,還要能集成更多的開源的框架,最后做出一個統一的管理。
?
低門檻與成本問題
?
如今的人工智能非?;?#xff0c;大家都十分關注,或許我們想象中人工智能已經如星火燎原般迅速蔓延到各種行業、場景里面取代或者幫助人提升一些業務價值了。但是我們看到這些事情無論是生活中還是新聞中,都沒有那么多。?
?
首先就是它的門檻高。回到剛才說的五個條件:大數據、反饋、算法、架構和需求,這涉及到了業務專家、建模專家、IT架構師,它的門檻是很高的,需要很多方面的專家配合在一起才能把這件事情做好。所以人工智能的一個核心能力在于要把這件事情的門檻降低,讓更多的人一起來做這件事情,通過一些平臺和工具讓大家協作起來更好地做好這件事情。
?
最后是成本問題。對于企業來講做任何事情都有一個成本問題,比如說很多時候一個企業構建一個AI團隊可能要去找很多專家,構建起一個10人、20人的團隊去做產品、平臺、應用等等。
這件事情有兩個方面的成本,第一是這些大牛的成本是很高的,中國比較資深的數據科學家年薪達到了100萬。第二是時間的代價很高,這件事情需要投入非常多的時間,在投入這些事情的過程中可能會錯失非常多的商機,所以很重要的一點是怎么樣用比較低的資金成本和時間成本構建這個能力,這些事情是構建一個企業AI核心能力最重要的問題。
思享會
思享會,亦私想匯,亦私享會,亦思想匯,是由清數大數據產業聯盟與清華校友總會AI大數據專委會(籌)共同發起的思想交流平臺,定位為小范圍的深度交流,目標是希望通過思想交流與碰撞促進產業的數據創新,以及大數據與產業和資本的融合,幫助各產業發現和挖掘數據的價值,促成聯盟成員及校友之間的互助與合作,為參會嘉賓帶來新靈感和新啟發。
校對:丁楠雅
為保證發文質量、樹立口碑,數據派現設立“錯別字基金”,鼓勵讀者積極糾錯。
若您在閱讀文章過程中發現任何錯誤,請在文末留言,或到后臺反饋,經小編確認后,數據派將向檢舉讀者發8.8元紅包。
同一位讀者指出同一篇文章多處錯誤,獎金不變。不同讀者指出同一處錯誤,獎勵第一位讀者。
感謝一直以來您的關注和支持,希望您能夠監督數據派產出更加高質的內容。
總結
以上是生活随笔為你收集整理的第四范式蒋仁皓:什么才是构建企业AI的关键要素的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: directX学习系列8 颜色融合(转)
- 下一篇: centos查询mysql端口被占用_c