AI降成本利器!阿里云弹性加速计算实例来了,最高节省50%推理成本
人工智能推理場景下,EAIS.EI讓用戶可以自定義GPU算力規(guī)模。據(jù)介紹,該產(chǎn)品可節(jié)省最高達(dá)50%的推理業(yè)務(wù)成本,目前EAIS.EI實例支持Tensorflow、Pytorch等主流深度學(xué)習(xí)框架,最高支持FP32 19.5 TFlops、FP16 混合精度312 TFlops的運算。
發(fā)布會傳送門
產(chǎn)品詳情
無論你是在逛淘寶還是刷抖音,人工智能都在背后瘋狂計算,短視頻推薦、拍照AI美顏,就連點外賣,人工智能都在幫外賣小哥優(yōu)化路線。
人工智能崛起的燃料之一,就是跟通用處理器CPU有著不同專長的GPU異構(gòu)加速器。在計算能力方面,如果說CPU是通才,GPU就是專才,非常擅長深度學(xué)習(xí)和圖像處理,因此在人工智能、直播和短視頻火熱的今天大放異彩。
然而,不同的深度學(xué)習(xí)應(yīng)用所需要的CPU、GPU和內(nèi)存等計算資源的比例并非完全一樣,云服務(wù)器受限于規(guī)格,往往只有特定數(shù)個比例。在某些情況下,就會造成資源閑置,尤其在推理場景中尤為明顯。深度學(xué)習(xí)應(yīng)用分為訓(xùn)練和推理兩個過程,推理計算需求由于跟業(yè)務(wù)量緊密相關(guān),往往是總運營成本的大頭,最高占到90%成本。
EAIS為客戶提供了一個異構(gòu)算力池,用戶可以將需要的GPU資源附加到任何一款阿里云ECS服務(wù)器中,根據(jù)不同應(yīng)用需求靈活優(yōu)化CPU/內(nèi)存與GPU之間的比例,匹配適合的資源組合,有效提升資源利用率。
另外,AI推理計算業(yè)務(wù)通常伴隨著業(yè)務(wù)的周期性的峰谷變化,EAIS.EI實例配合彈性伸縮ESS快速感知業(yè)務(wù)變化,實現(xiàn)高效的業(yè)務(wù)運維,提升業(yè)務(wù)彈性。資源的精準(zhǔn)組合加上云服務(wù)的彈性,將大大降低成本。
阿里云異構(gòu)計算產(chǎn)品負(fù)責(zé)人透露,除了推理場景之外,未來,彈性加速計算實例還將覆蓋圖形圖像與多媒體計算編碼場景,甚至實現(xiàn)含光800與CPU/內(nèi)存的解耦。
彈性加速計算實例,將與神龍AI加速器和cGPU容器技術(shù),一起組成阿里云異構(gòu)計算的三大特色優(yōu)勢,為用戶提供靈活高效、性能超群的異構(gòu)計算基礎(chǔ)設(shè)施。
原文鏈接:https://developer.aliyun.com/article/775645?
版權(quán)聲明:本文內(nèi)容由阿里云實名注冊用戶自發(fā)貢獻(xiàn),版權(quán)歸原作者所有,阿里云開發(fā)者社區(qū)不擁有其著作權(quán),亦不承擔(dān)相應(yīng)法律責(zé)任。具體規(guī)則請查看《阿里云開發(fā)者社區(qū)用戶服務(wù)協(xié)議》和《阿里云開發(fā)者社區(qū)知識產(chǎn)權(quán)保護(hù)指引》。如果您發(fā)現(xiàn)本社區(qū)中有涉嫌抄襲的內(nèi)容,填寫侵權(quán)投訴表單進(jìn)行舉報,一經(jīng)查實,本社區(qū)將立刻刪除涉嫌侵權(quán)內(nèi)容。總結(jié)
以上是生活随笔為你收集整理的AI降成本利器!阿里云弹性加速计算实例来了,最高节省50%推理成本的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Redis主从复制与优化
- 下一篇: 自然语言处理在开放搜索中的应用