群聊金山云与英特尔的“AI as a Service”,你都get到了什么?
戳藍字“CSDN云計算”關注我們哦!
作者:劉晶晶
針對用戶需要優化傳統云主機框架卻無從下手的現實情況,金山云攜手英特爾打造出了AI as a Service這種全新解決方案,據說能將軟硬件優勢很大程度發揮出來,如此“神仙級解決方案”究竟內藏什么玄機?快來了解一下!
當看到英特爾和金山云聯合打造了一種“AI as a Service”新解決方案的時候,阿晶不免吃驚又有點兒小迷糊。
如今我們發現,云計算和AI在越來越多的領域相遇之后,各種“即服務”絕對是雨后春筍、層出不窮。為了保障自身在激烈的企業級競爭中處于優勢地位,大家似乎紛紛尋求可以將AI集成在自身應用的產品,簡單又流行且基于云的AI產品與服務(AIaaS)新解決方案就這么猝不及防地誕生啦!
“平臺”與“優化”被圈定為關鍵詞
有一點可以肯定的是,金山云在業務體系中早已“配置”了AI方面的技術團隊,關于這點,在與金山云計算研發總監楊峰的交談中也得到了證實。如果要進一步比較“AI as a Service”與其AI 技術的差異,恐怕就是應用層(可以給用戶提供圖像識別、人臉識別為代表的應用等優化服務)與平臺層的區別了,同時這也成為“AI as a Service”的“特立獨行”之處。
圖片來源網絡
正如楊峰對阿晶等在場記者所言,對于“AI as a Service”來說,金山云計算業務方面主要提供底層平臺的支持,例如云主機、云服務器等,這種支持以及優化主要集中在平臺本身,不是用戶操作系統或者應用層面的優化,例如硬件的更新等?!按送?#xff0c;還會在此基礎上完成一些解決方案的提供,例如針對某個操作系統預裝一個應用軟件進行優化等,但這種范圍內的支持與優化工作并不局限于AI?!?/span>
更重要的一點,我覺得,大部分對AI 有訴求的企業不是希望平臺層有超乎想象的業務處理能力,就是寄托在應用解決方案的角度被提供更好的選擇,金山云與英特爾這波“AI as a Service”新解決方案正好屬于前者。如今,通過此類優化方案來突出自身的優勢,并在風起云涌的AI浪潮中增加一項“技能”,可謂明智之舉。
聊畢“AI as a Service”的平臺屬性,據阿晶進一步了解,“AI as a Service”新解決方案的點子其實主要來源于一種優化思想。
作為密切的合作伙伴,英特爾技術對此表示:“從我們的角度出發,不同的應用場景肯定會出現差異性的需求,但在具體的操作過程中針對框架優化的問題是個困難之處。簡單來說‘機器通常都很強悍,但沒有經過優化的話這些機器工作起來的效果可能還是不盡如人意,所以嘗試開發一套固定的實例,將可以前期完成的優化都預制到云主機上,用戶使用無需重新安裝以及配制,其中的性能就可以達到幾倍甚至幾十倍的提升。”同時,在英特爾看來,單純硬件層面的提升能給性能帶來一個數量級的提升,但如果能夠結合硬件和軟件組合進行提升,將會直接帶來兩個以上數量級的提升。因此,在追求優化目標的基礎上,基于金山云主機,增強軟件優化,尋求通用性能解決,是英特爾此次嘗試的重要出發點。
關于“AI as a Service”新解決方案的源起,其實早在今年4月,金山云在同英特爾方面交流的過程中就提到,基礎平臺具備的前提下,用戶針對平臺基礎上的優化其實是比較欠缺的。“如果將英特爾相關技術加入平臺其中,即針對TensorFlow、Caffe這兩個軟件框架,使用最新至強平臺上的AVX-512指令去做軟件優化,相比之前有很大的系統集成性,用戶就可以更關注業務層面的邏輯,未來以這種方式推出的新服務類型,可以被稱為是AI增強,最終可以給客戶帶來成本的降低以及效率的提升?!睏罘逭f。
聽過楊峰的總結,我認為該服務或者說解決方案,可以在本質上被認同是一種優化的、增強型服務,使用該服務之后無需關注協議、框架之類的基礎優化工作,而是可以做到將企業精力聚焦到業務本身的功能和穩定性上,提高效率并有效降低成本。
為何選擇TensorFlow以及Caffe?
群聊中,通過翻看關于“AI as a Service”的背景資料,即“基于最新發布的英特爾第二代至強可擴展處理器,金山云在其三代云主機中安裝了針對至強可擴展處理器優化過的TensorFlow和Caffe,打造了基于英特爾架構的AI解決方案,顯著加速AI運算過程,尤其是加速深度學習的推理過程,獲得了在英特爾?至強?可擴展處理器上最佳的運行性能”的表述,我果斷注意到“TensorFlow和Caffe”等熱詞,或許你和阿晶一樣存在疑問:這種神一般的優化只限于TensorFlow以及Caffe嗎?
關于此類問題,好伙伴英特爾表示有話要說?!拔覀冡槍I 方面的優化,原則上是所有CPU都適用的。具體操作會在硬件層面加入一個加速庫,名為MKL-DNN,這是專門為深度學習加速的,而且是開源的。有了底層的硬件,再配齊數學加速庫之后,上面一層就是各種各樣的開源框架,包括TensorFlow和Caffe,當然也同時包括其他的一些目前來看可能使用率比較低的框架?!?/span>
之所以在金山云的云主機上選擇TensorFlow和Caffe,英特爾表示主要是根據用戶需求來選定的,畢竟這兩個框架在使用率上比較高?!拔磥砦覀兊暮献鞣罩?#xff0c;針對豐富的客戶反饋和多元化的應用場景,當然還會加入更多的開源框架,這是一個長期持續性的過程,但不變的是我們的最終目標就是將平臺能力更好地釋放出來,最終實現強強組合?!?/span>
此外,英特爾與金山云合作由來已久,且英特爾跟金山云的合作是全方面的,還涵蓋金山云的基礎的云平臺、大數據、PaaS平臺,包括在上面的CDN、視頻云等等。但其實除了金山云之外,有很多互聯網公司甚至是其他性質的企業都積極倡導自身具有AI能力。但依照過往的經驗來看,就算是體量很大的企業也不一定知道框架如何被優化來更好地發揮功能,所以對兩家企業來講真正滿足用戶需要是關鍵,對此金山云方面也表示高度認同。如此看來這套服務是不針對具體的企業性質以及體量有明確的指向性了。
關于未來,哪些升級迭代還值得期待?
關于該服務的技術升級,想必是很多開發者與企業著重關注的,對此阿晶特別整理了群聊中雙方的表達,供大家參考,是否有驚喜?
英特爾技術方面:簡單來說,英特爾會繼續深化與金山云的合作,基于最新發布的第二代至強可擴展處理器,我們會引入一個新的指令叫VNNI,來源于英特爾為深度學習專門做的一系列加速指令集-英特爾Deep Learning Boost (DL Boost)。
所謂的VNNI,就是在AI上,除了現在使用的單精度浮點數這種支持運算之外,還會做8位INT數據的運算,這一點會在非常多的深度學習的模型上對模型做一個轉化優化。
轉化優化之后,它的吞吐量會有直觀效果的提升,例如圖片處理,每秒處理多少張圖片會有非常大的性能提升;再比如說用單精度浮點數,原本每秒只能處理100張,當通過VNNI指令加速之后有可能做到處理200多張甚至是300張,當然依照不同的模型會有不同程度的增強。
同時,無論是往后的CPU,抑或明年的Cooper Lake、Ice Lake,VNNI都會進行兼容支持。這也是英特爾堅持建立一個非常龐大的軟件生態的原因,我們一直向下兼容,保證用戶開發的程序在新的硬件平臺上同樣可以運行,同時我們也會在軟件生態方面同步優化、迭代,為客戶提供更好的計算能力。
接下來在Cascade Lake上,通過金山云這樣一個緊密的合作伙伴,通過云主機的方式,會參照其他提供應用層需求方面,積極配合做很多優化,例如Cascade Lake上支持VNNI,客戶使用起來會有更高的性價比表現。
此外,整體的成熟上線也是一個過程:第一批先匹配的是Skylake,就是第一代至強可擴展處理器;第二代至強可擴展處理器也會隨著整個金山云的規模的上線去做相應的優化匹配等,更重要的一點是客戶需求可以加速升級過程。從云平臺角度來講,能夠把這個能力整體釋放出來,包括穩定性、性能等,可以看到還有很多工作要做。
金山云計算研發總監楊峰:從硬件角度來說,我們持續跟進并引入新硬件;從軟件角度來說,我們要適配這個硬件,例如Skylake,增加了AVX-512這個指令集,我們自己的服務也要進行適配,能夠讓客戶看到并使用這個AVX-512指令集,要把這個能力釋放給用戶,并有顯著效果。
引用一段IDC的研究資料作為結尾:據了解截止到2021年,全球企業們對AI系統的支出將保持50.1%的年復合增長率,這說明企業對此類技術的總支出將會從2017年的120億美元增加到2021年的576億美元。此外值得注意的一點,這些支出中有很大一部分將用于基于云的AI服務。結論很顯然,企業對AIaaS產生了需求,而云服務商也對此做出了積極回應,這也充分說明,類似于金山云與英特爾的“強強聯手”將會進入一個前所未有的豐富期。
福利
掃描添加小編微信,備注“姓名+公司職位”,加入【云計算學習交流群】,和志同道合的朋友們共同打卡學習!
推薦閱讀:
一場全能的開發者大會,來自助力開發者成功進階的華為云
抖音微博等短視頻千萬級高可用、高并發架構如何設計?
20大5G關鍵技術
Fast.ai:從零開始學深度學習 | 資源帖
10個簡單小竅門帶你提高Python數據分析速度(附代碼)
程序員爬取 3 萬條評論,《長安十二時辰》槽點大揭秘!
暗網竟成比特幣最大用戶? 上半年5.15億美元被用于非法活動
真香,朕在看了!
總結
以上是生活随笔為你收集整理的群聊金山云与英特尔的“AI as a Service”,你都get到了什么?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Boost:测试BOOST_BIND_N
- 下一篇: Boost:使用/type <>语法测试