當(dāng)前位置：首頁 > 人工智能 > ChatGpt >内容正文

ChatGpt

AI降成本利器！阿里云弹性加速计算实例来了，最高节省50%推理成本

發(fā)布時間：2024/9/3 ChatGpt 57 豆豆

生活随笔收集整理的這篇文章主要介紹了 AI降成本利器！阿里云弹性加速计算实例来了，最高节省50%推理成本小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

簡介：近日，阿里云推出了彈性加速計算實例（EAIS）家族及產(chǎn)品彈性加速推理實例（簡稱EAIS.EI），首次實現(xiàn)了GPU與CPU/內(nèi)存的解耦，可在提升AI推理效率的同時大幅降低成本。

人工智能推理場景下，EAIS.EI讓用戶可以自定義GPU算力規(guī)模。據(jù)介紹，該產(chǎn)品可節(jié)省最高達(dá)50%的推理業(yè)務(wù)成本，目前EAIS.EI實例支持Tensorflow、Pytorch等主流深度學(xué)習(xí)框架，最高支持FP32 19.5 TFlops、FP16 混合精度312 TFlops的運算。

發(fā)布會傳送門

產(chǎn)品詳情

無論你是在逛淘寶還是刷抖音，人工智能都在背后瘋狂計算，短視頻推薦、拍照AI美顏，就連點外賣，人工智能都在幫外賣小哥優(yōu)化路線。

人工智能崛起的燃料之一，就是跟通用處理器CPU有著不同專長的GPU異構(gòu)加速器。在計算能力方面，如果說CPU是通才，GPU就是專才，非常擅長深度學(xué)習(xí)和圖像處理，因此在人工智能、直播和短視頻火熱的今天大放異彩。

然而，不同的深度學(xué)習(xí)應(yīng)用所需要的CPU、GPU和內(nèi)存等計算資源的比例并非完全一樣，云服務(wù)器受限于規(guī)格，往往只有特定數(shù)個比例。在某些情況下，就會造成資源閑置，尤其在推理場景中尤為明顯。深度學(xué)習(xí)應(yīng)用分為訓(xùn)練和推理兩個過程，推理計算需求由于跟業(yè)務(wù)量緊密相關(guān)，往往是總運營成本的大頭，最高占到90%成本。

EAIS為客戶提供了一個異構(gòu)算力池，用戶可以將需要的GPU資源附加到任何一款阿里云ECS服務(wù)器中，根據(jù)不同應(yīng)用需求靈活優(yōu)化CPU/內(nèi)存與GPU之間的比例，匹配適合的資源組合，有效提升資源利用率。

另外，AI推理計算業(yè)務(wù)通常伴隨著業(yè)務(wù)的周期性的峰谷變化，EAIS.EI實例配合彈性伸縮ESS快速感知業(yè)務(wù)變化，實現(xiàn)高效的業(yè)務(wù)運維，提升業(yè)務(wù)彈性。資源的精準(zhǔn)組合加上云服務(wù)的彈性，將大大降低成本。

阿里云異構(gòu)計算產(chǎn)品負(fù)責(zé)人透露，除了推理場景之外，未來，彈性加速計算實例還將覆蓋圖形圖像與多媒體計算編碼場景，甚至實現(xiàn)含光800與CPU/內(nèi)存的解耦。

彈性加速計算實例，將與神龍AI加速器和cGPU容器技術(shù)，一起組成阿里云異構(gòu)計算的三大特色優(yōu)勢，為用戶提供靈活高效、性能超群的異構(gòu)計算基礎(chǔ)設(shè)施。

原文鏈接：https://developer.aliyun.com/article/775645?

版權(quán)聲明：本文內(nèi)容由阿里云實名注冊用戶自發(fā)貢獻(xiàn)，版權(quán)歸原作者所有，阿里云開發(fā)者社區(qū)不擁有其著作權(quán)，亦不承擔(dān)相應(yīng)法律責(zé)任。具體規(guī)則請查看《阿里云開發(fā)者社區(qū)用戶服務(wù)協(xié)議》和《阿里云開發(fā)者社區(qū)知識產(chǎn)權(quán)保護(hù)指引》。如果您發(fā)現(xiàn)本社區(qū)中有涉嫌抄襲的內(nèi)容，填寫侵權(quán)投訴表單進(jìn)行舉報，一經(jīng)查實，本社區(qū)將立刻刪除涉嫌侵權(quán)內(nèi)容。

總結(jié)

以上是生活随笔為你收集整理的AI降成本利器！阿里云弹性加速计算实例来了，最高节省50%推理成本的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。