阿里灵杰:AI工程化助力产业数字升级
對于人工智能領域而言,“工程化”無疑是貫穿2021全年的熱點。Gartner、德勤、中國信通院等權威研究機構先后在年度趨勢報告中指出其必要性,與此同時,AI產業化的曲折探索也時刻提醒著大大小小的AI團隊關注工程建設與規模化。
潮起潮落后,一個不容忽視的趨勢已經顯現:只有真正貢獻于各行各業的數字化發展,AI才能不斷迭代前行。這背后,亟需對數據計算分析、模型開發部署、在線訓練推理、應用開發運維等各種環節進行全周期管理。而這恰恰是阿里靈杰——阿里云大數據+AI一體化產品體系所期望和擅長的。
12月3日,2021阿里靈杰AI工程化峰會圓滿落幕。阿里巴巴集團副總裁、阿里云智能計算平臺事業部負責人、達摩院 AI 平臺負責人賈揚清,達摩院語音實驗室負責人鄢志杰,阿里云智能研究員、機器學習PAI平臺和大數據平臺技術負責人林偉等11位技術牛人亮相本次峰會,與開發者共同探討AI落地產業的路徑探索與創新實踐。
賈揚清:從需求視角出發
擁抱云原生的AI時代
阿里巴巴集團副總裁、阿里云智能計算平臺負責人、達摩院 AI 平臺負責人賈揚清以一名AI老兵的身份,分享了經歷多次浪潮后的觀察。他把早期的AI開發人員比作“拓荒者”,身兼算法研究員、軟件工程師、數據工程師、系統工程師多種角色,嘗試把AI算法和應用逐漸落地。
(圖:阿里巴巴集團副總裁、阿里云智能計算平臺負責人、達摩院 AI 平臺負責人賈揚清分享“一個AI開發者的奇幻漂流”)
隨著技術發展,組件數量和模型算法的復雜度都在增加。時至今日,需要搭建一個統一的空間來拉通數據管理、算法迭代、模型訓練及上線各環節。賈揚清總結道,“AI的痛苦在于本質上沒有范式。AI不是一個單點的產品,而是一系列能力的組合;另一方面,AI對標準的軟件和定制化服務協同的需求極強。”
因此,“AI開發者需要的,不是從資源視角搭建起來的平臺;而是從需求出發,通過云原生、容器化方式鏈接資源的平臺”,這正是打造阿里靈杰的初衷。今年10月剛剛發布的阿里靈杰,通過一體化的大數據與AI產品體系,向用戶提供10萬臺以上計算集群的彈性算力、上百種標準化算法和模型服務、以及覆蓋數據處理和機器學習全鏈路的管理能力。
簡言之,阿里靈杰的核心價值在于,幫助今天的AI開發者更好地將數據、算法和場景結合起來,構建更完整更復雜的解決方案,去解決產業中的實際問題。
(圖:阿里靈杰全景)
阿里靈杰AI工程平臺
全鏈路提升效率
阿里云機器學習平臺PAI和大數據平臺技術負責人林偉認為,數據、計算力、和算法有機結合才能推動AI爆發,阿里靈杰也基于三要素形成了獨特的思考和實踐。
第一,數據質量決定模型的高度。因此,阿里靈杰從誕生第一天起就采用大數據與AI一體化的架構,通過湖倉一體實現對多元異構數據的存儲管理,通過DataWorks和智能標注產品實現數據質量提升和監控,通過MaxCompute、Hologres、Flink等計算引擎完成實時或離線分析處理;
第二,算法開發迭代速度是重要生產力。云原生的靈杰平臺能提供彈性的計算力,并具備良好的異構硬件和端設備適配性,能提升模型開發和部署效率。面向大模型,靈杰機器學習平臺的Whale框架可自動實現分布式訓練,FineTune框架可基于預訓練大模型蒸餾出垂直場景的小模型,提升大模型生產速度和應用價值;
第三,AI系統能力是核心能力。阿里巴巴集團內部AI應用需求極大,推動著靈杰機器學習平臺PAI的核心引擎不斷發展優化,覆蓋超大規模稀疏模型訓練及服務、超大規模多模態預訓練模型、自動編譯、大規模集群調度、ML Ops等方向。
(圖:阿里云機器學習平臺PAI和大數據平臺技術負責人林偉分享AI工程化技術趨勢)
聚焦阿里靈杰的平臺產品能力,阿里云機器學習平臺PAI產品負責人黃博遠帶來了一系列新功能發布。黃博遠介紹,PAI提供從數據準備、模型開發、到模型部署、訓練的全流程平臺能力,此次產品升級主要是3個方面:
1. AI開發全鏈路體驗提升,發布AI工作空間實現精細化的團隊開發協作和AI資產管理。
2. PAI集成開源AutoML框架NNI。PAI-DSW以jupyter插件形式集成NNI,讓自動機器學習能力變得唾手可得;PAI-DLC分布式集群可進行NNI HPO分布式訓練,提升使用效果。此外,PAI-NNI加入了剪枝、稀疏化、量化等方向的提升,讓AutoML的能力更易達到企業級應用標準。
3. 基于PAI,可實現超大規模模型的構建、垂直場景小模型蒸餾、以及AI應用部署,讓AI更普惠。
(圖:機器學習平臺PAI,覆蓋AI生產全鏈路)
從標準化AI服務到電商增長
阿里靈杰的產業化實踐
基于強大的基礎設施和工程能力,阿里靈杰在阿里內外都積累了成功案例。達摩院語音實驗室負責人鄢志杰認為,AI行業已經進入發展的“下半場”,AI+產業”將是兌現AI價值的重要途徑,AI應用將形成專業分工更精細的產業鏈生態,“所有人將可使用AI,而AI也將予力所有人”。包含語音、視覺、NLP等能力在內的阿里靈杰AI開放服務正是基于這一愿景誕生,并具備開箱即用、自主定制、成本經濟的特點。
在電商領域,數據驅動下的智能無處不在。阿里巴巴資深技術專家郭瑞杰表示,在電商場景中,用戶除了獲取信息,還存在比對、決策、售后等多個環節,鏈路更長,并且算法效果也業務價值直接相關。基于多年積累的電商智能增長工程平臺,已經上云并產品化,并在電商、零售、內容社區、音視頻領域幫助企業客戶實現用戶和收入顯著增長。
阿里云天池首屆“英特爾創新大師杯”頒獎
創造無止境
為引導開發者創新優化技術解決方案,促進AI行業溝通學習,今年啟動了由英特爾主辦,阿里云天池平臺聯合計算平臺機器學習PAI承辦的第一屆“英特爾創新大師杯”深度學習挑戰賽。比賽聚焦OCR及NLP的兩個經典技術方向,通過多個實用場景面向全球廣大開發者發布算法挑戰。
經過數月征集和評選,“英特爾創新大師杯”頒獎典禮也在此次峰會舉辦。阿里巴巴集團副總裁、阿里云智能計算平臺事業部負責人、達摩院 AI 平臺負責人賈揚清,阿里云智能研究員、機器學習PAI平臺和大數據平臺技術負責人林偉,英特爾公司中國區超大云計算軟件架構總監魏彬共同為獲獎者頒獎。
這次深度學習挑戰賽的順利舉行離不開英特爾第三代至強?可擴展處理器的強力支持。據英特爾公司中國區超大云計算軟件架構總監魏彬介紹,英特爾第三代至強?可擴展處理器提供了澎湃的計算性能,不僅擁有VNNI指令集,提供強大的INT8的量化性能,還在新一代的平臺中增加了BF16的指令集,對既要求計算又要求精度的OCR以及NLP場景尤為適合;在軟件側,英特爾還在框架層面上對Pytorch Tensorflow進行了深度優化。對本次比賽而言,選手也得以擁有良好的模型訓練和優化環境,無論在邊緣或是云端,都能讓工作負載處于安全狀態,為開發者的模型研發保駕護航。
正如阿里巴巴集團副總裁、AI老兵賈揚清所言,今天百花齊放的AI算法和應用為我們帶來了許多故事,也讓我們在生活中逐漸習慣;但或許在AI領域,我們應該懷抱更高遠的夢想。目前,阿里靈杰正在為各行各業提供實實在在的解決方案,探索著AI落地產業的范式升級。未來,期待開發者們共同在云上更高效的描繪出人工智能增長第二曲線。
🔍
現在,在「知乎」也能找到我們了
進入知乎首頁搜索「PaperWeekly」
點擊「關注」訂閱我們的專欄吧
·
總結
以上是生活随笔為你收集整理的阿里灵杰:AI工程化助力产业数字升级的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 霸州什么好吃的最多?
- 下一篇: 世界各国的美食都有什么啊?