第四代英特尔至强“神器”深入解析:轻松提升数倍性能 更节电节成本
盡管在日常生活中,大多數普通用戶都接觸不到服務器和數據中心平臺,但是一方面,我們使用的很多軟件和互聯網服務,背后就是數據中心在默默提供支撐,另一方面,大量先進的計算技術都首先應用于數據中心,并惠及消費級平臺。
所以,數據中心看似遙遠,其實就在我們身邊。
今年1月11日,英特爾正式發布了代號Sapphire Rapids的第四代至強可擴展處理器(下文簡稱四代至強),還有集成HBM高帶寬內存的至強Max系列,以及代號Ponte Vecchio的數據中心GPU Max系列。
雖然乍一看,四代至強的有些規格不如競品,但事實上,英特爾現在追求的,已經不再是單一產品參數,而是打造更強大、更靈活、更適應未來的綜合算力平臺。
英特爾市場營銷集團副總裁、中國區數據中心銷售總經理兼中國區運營商銷售總經理莊秉翰指出,雖然傳統上都認為Intel是一家CPU處理器公司,但在多元化的數字和數據時代,Intel提出了全新的“XPU”戰略,通過提供CPU、GPU、FPGA、IPU等多種異構產品,為不同業務、應用場景提供定制化的算力解決方案。
除了硬件,Intel的軟實力也不容小覷,旗下有著規模龐大的軟件團隊和研究院,畢竟,強大的軟件是充分釋放硬件潛力的關鍵。
尤其是在開源方面,英特爾一向毫不吝嗇,為開源生態和社區貢獻了大量的軟件架構,這也有利于推動英特爾產品的應用和生態的擴展。
四代至強不僅擁有Intel 7先進工藝、全新架構,以及業界領先的DDR5、PCIe 5.0、CXL 1.1,更是在加速器方面引領了新潮流。
高級矩陣擴展(AMX)、動態負載均衡器(DLB)、數據流加速器(DSA)、存內分析加速器(IAA)、數據保護與壓縮加速技術(QAT)、安全引擎(Security)、至強Max高帶寬內存(HBM)。
這些加速器不會改變已有的算法,仍是對算法的計算進行加速,從而提高效率、節約時間,也讓客戶進一步可以去設計新的算法。
根據官方數據,四代至強通過內置的豐富加速器,相比上代產品將目標工作負載的平均能效(每瓦性能)提升了多達2.9倍,而在優化電源模式下,每顆處理器可以節能高達70瓦且性能的影響極低,總體擁有成本也降低52-66%。
具體應用實例方面,比如騰訊借助AMX提升搜索、視頻業務效率;比如京東利用IAA、DSA將天樞服務器性能提升超過1.7倍;比如阿里云第八代ESC實例整體算力提升60%、數據庫讀寫性能提升15%、加解密和壓縮解壓性能提升4倍、AI推理性能提升4倍;比如火山引擎第三代彈性計算實例整機算力、單核算力、網絡轉發、存儲IOPS、加解密、AI推理加速等全面明顯提升……
- 阿里的“地址標準化”服務(如淘寶收貨地址定位),使用AMX INT8加速和軟件優化,單位時間查詢性能提升2.48倍。
- 淘寶APP首頁定制化推薦服務,使用AMX BF16、軟件優化、AVX-512調優,性能提升3倍。
- 部署于騰訊云上的太極機器學習平臺支撐的搜索和廣告業務,使用AMX BF16/INT8,高精度實例性能提升3倍,低精度實例性能提升2倍,云服務實例所需CPU數量也大大減少。
- Stable Diffusion注意力機制,使用AMX BF16加速矩陣計算,使用AVX-512加速指數計算,搭配PyTorch插件,吞吐性能提升3.82倍。
- 亞信電信營業廳OCR方案,使用AMX軟硬件優化,性能提升3.94倍。
- 用友企業ERP OCR服務使用AMX BF16/INT8加速,性能提升2.83倍。
- Clickhouse大數據分析數據庫,使用IAA,Q4.1壓縮解壓性能提升40%。
- MongoDB數據庫,使用IAA,性能提升47%。
- DML、DPDK、SPDK等軟件庫,均已集成DSA,性能可提升2.25倍,CPU資源可節省66%。
- 微軟SQL Server,使用QAT加速,備份時間可縮短2/3,性能可提升1.34倍。
- Gbase 8a并行數據庫,使用IAA,ZSTD壓縮算法性能提升1.84倍,RapidZ壓縮算法性能提升1.66倍。
四代至強發布之后,英特爾又加推了vRAN Boost,完全集成物理層加速功能,不再需要獨立的加速卡,成為四代至強的新“神器”。
使用這一加速器,運營商可以在通用虛擬化平臺上整合所有基站層,從而以通用處理器實現基站功能。
與上一代相比,vRAN Boost加速器能夠在不增加功耗的情況下,提供兩倍的容量,同時節省多達20%的能耗,滿足關鍵的性能、擴展和能效要求。
英特爾技術專家指出,CPU處理器的發展趨勢曾經就是單純地提高頻率、增加核心數量,但是對于互聯網客戶來說,特殊需求越來越多,比如壓縮解壓、加解密等等,更多核心、更高頻率不一定能帶來足夠高的效率提升,提供一個專用加速器反而會有奇效,它相比異構計算距離內存也更近。
同時,隨著客戶和行業越來越重視能效,加速器也是提升能效比的有效途徑。
當然,集成加速器會增加處理器的設計難度,影響驗證上市時間,也會增加生態適配的難度,而這就體現了英特爾強大的業界影響力和號召力,可以推動生態支持,保證產品上市的時候就有大量軟件服務可以支持到位。
值得一提的是,并不是每家客戶都需要那么多的加速器,因此英特爾還提供了全新的On Demand服務,客戶可以根據自己的實際需要,靈活選購不同的加速器,也可以按照使用量來開關付費。
莊秉翰還指出,隨著“雙碳”、新基建、“東數西算”的推進,對未來數據中心能耗的需求越來越嚴苛,綠色計算成為可持續發展的關鍵動力。
四代至強集成的眾多加速器,能夠以更高效率、更低能耗處理這種需求越來越大、越來越復雜的工作負載,換言之就是用更少能源消耗的完成更多的工作,同時還有一系列新的電源管理方案輔佐,進一步提高能效。
在制造過程中,Intel使用的電力已經超過90%都是可再生能源,并且三代、四代至強提供一年的浸沒式液冷方案保修服務,這在業界還是唯一一家。
如此種種,都讓四代至強成為最具可持續性的數據中心處理器。
英特爾至強可擴展處理器誕生于2017年,迄今已經累計交付超過8500萬顆,其中第三代產品在過去兩年就出貨了1500萬顆。
面向未來,隨著算力市場需求的提高、應用的拓展,英特爾也在有針對性地開發新產品,都在順利推進中。
比如2023年內推出下一代Emerald Rapids,2024年開始更是迎來全新變革,基于性能核的Granite Rapids、基于能效核的Sierra Forest,都會升級到Intel 3制造工藝,并集成更多核心,對于微服務、容器化場景非常適合。
總的來說,英特爾至強可擴展平臺已經跳出來單純拼參數的傳統巢窠,進入了全新的加速器時代,通過針對特定負載和應用需求進行加速,以更靈活的方式、更低的能效實現更高的效率,更適應多元化的新算力時代。
如此,新至強既為客戶實現更高的經濟效益,又符合節能減排、綠色可持續發展的全球趨勢,也讓我們對至強可擴展平臺未來的發展,有了更高的期待。
總結
以上是生活随笔為你收集整理的第四代英特尔至强“神器”深入解析:轻松提升数倍性能 更节电节成本的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: java中的static关键字总结
- 下一篇: ERROR: No query spec