世界上最快的计算机-泰坦和天河二号
NO.1 天河二號(TH-2,英文名:Tianhe-2、Milkyway-2):
?
是一組由中國國防科技大學等單位研制的異構超級計算機,為天河一號超級計算機的后繼者,2013年6月起成為世界上最快的超級計算機,超過第二名泰坦近一倍。
?
天河二號的組裝和測試由國防科技大學和浪潮集團來負責,將于2013年底入駐廣東省廣州的國家超級計算廣州中心并進行驗收,以后將對外開放接受運算項目任務,用于實驗、科研以及教育領域。天河二號造價達一億美元,整個系統占地面積達720平方米。
?
?
性能
?
2013年6月,天河二號以峰值速度(Rpeak)每秒54,902.4TFLOPS(萬億次浮點運算)、持續速度(Rmax)33,862.7TFLOPS,超越泰坦超級計算機(Rpeak 27,112.5TFLOPS,Rmax 17,590.0TFLOPS),成為當今世界上最快的超級計算機。這個成績于2013年6月17日提交至TOP500。
?
實際上,在早前的運行測試中,僅使用16,000個運算節點中的90%,亦即14,336個節點,LINPACK運算速度就達到30.65PFLOPS的性能水平,超過前任“泰坦”的74%。
?
?
同樣在2013年6月,天河二號以2,061GTEPS的成績在Graph500上排名第六。Graph500是一個對超級電腦的數據密集型運算處理性能進行的一個排行榜,在此榜單上排位第一的是IBM紅杉,成績是15,363GTEPS。
?
?
硬件配置
?
天河二號的型號為TH-IVB-FEP,使用中央處理器及協處理器的運算架構布局:?
?
天河二號共有16,000個運算節點,每節點配備兩顆Xeon E5 12核心的中央處理器、三個Xeon Phi 57核心的協處理器(運算加速卡)。累計32,000顆Xeon E5主處理器和48,000個Xeon Phi協處理器,共312萬個計算核心。
?
處理器
?
- 中央處理器為英特爾提供的,運作時鐘頻率為2.2GHz的Xeon E5-2692v2 12核心處理器,基于英特爾Ivy Bridge微架構(Ivy Bridge-EX核心),采用22納米制程,峰值性能0.2112TFLOPS。
- 運算加速使用基于英特爾集成眾核架構的Xeon Phi 31S1P協處理器,運行時鐘頻率為1.1GHz,擁有57個x86核心(實際上擁有61個核心,因激活全部核心時會存在運算周期協調沖突之問題,因此先屏蔽4個x86核心),每個x86核心籍由特殊的超線程技術能運作2個線程,產生峰值性能為1.003TFLOPS。
?
存儲器
?
- 內存
- 每個節點擁有64GiB主存,而每個Xeon Phi協處理器板載8GiB內存,故每節點共88GiB內存,整體總計內存1,375TiB (1.34PiB)。
- 外存
- 12.4PiB容量的硬盤陣列
?
主板、機架、機柜
?
- 主板、機架與機柜均由浪潮集團制造,共有125個機柜,每個機柜容納4個機框,每個機框容納16塊主板,每個主板設置有兩個計算節點。每個機柜還裝有負載指示燈,根據機柜內主機的運算負載變更發光二極管的發光顏色。
- 每塊主板上分為APU模塊和CPM模塊兩部分,APU部分承載5塊Xeon Phi,CPM部分承載1塊Xeon Phi+4顆Xeon E5。
- APU模塊和CPM模塊之間以CPU內部提供的PCI-E 3.0 16x接口進行連接,但實際由于Xeon Phi的硬件限制,僅支持至PCI-E 2.0 16x,單通道數據傳輸速率為10Gbps。
?
前端處理器
?
- 計算節點前端處理器為4096顆中國國防科技大學研發的FT-1500 16核心SPARC V9架構的處理器,40納米制程,運作時鐘頻率1.8GHz,熱設計功耗65瓦,峰值性能144GFLOPS。主要作運算任務調度管理之用。
?
連接性
?
- 使用光電混合傳輸技術(Optoelectronics Hybrid Transport Technology),使用自制的TH Express-2主干拓撲結構網絡連接,以13個大型路由器通過576個連接端口以光電傳輸介質與各個運算節點互聯,控制器名為NRC,使用90納米制 程,單個控制器的數據吞吐量2.56Tbps,終端網絡接口使用名為NIC的控制器,以PCI-E 2.0接口鏈接,數據傳送速率6.36GB/s。
?
能耗
?
- 整機功耗17,808千瓦,在搭載水冷散熱系統以后,功耗將達到24兆瓦,無論水冷系統的搭載與否,都是目前TOP500里功耗最大的
- 以6月17日公布的數據推算,每瓦性能為1.901GFLOPS,仍不及泰坦的每瓦2.143GFLOPS和IBM紅杉每瓦2.177GFLOPS的成績,但比“京”的每瓦0.830GFLOPS每和天河一號每瓦僅0.668GFLOPS都要高不少。
?
軟件支持
?
- 麒麟操作系統、基于SLURM(Simple Linux Utility for Resource Management,資源管理用單一Linux公用程序)的全局資源管理。
?
---------------------------------------------------------------------------------------------------------------------------------
?
NO.2 泰坦(英語:Titan)
?
泰坦(英語:Titan)是一臺由克雷公司承建的超級電腦,置放于美國能源部下屬的橡樹嶺國家實驗室中,供各項科學研究項目使用。泰坦是由原來也置放于橡樹嶺國家實驗室的美洲虎(英文:Jaguar)經過多次升級改裝而成。泰坦也是世界上第一臺以通用圖形處理器(GPGPU) 為主要數據處理單元的超級電腦,2012年11月至2013年6月是世界上最快的超級電腦。美洲虎在2011年10月被宣布開始進行大幅升級,2012年 10月,升級作業基本完工后這臺超級電腦被更名為泰坦,并開始進行穩定性和性能測試,2013年中期方可供科學研究者們使用。升級的預算開始時是6千萬美 元,其中絕大部分由美國能源部提供。而后來根據克雷公司的公開信息,整臺泰坦超級電腦的費用最終是9千7百萬美元,為填補資金空缺,美國國家海洋和大氣管理局也出了一小部分資金參與建造,以從主要出資方美國能源部的手上獲得一定的使用權。
?
?
泰坦使用由超微半導體提供的皓龍(Opteron)處理器鏈接英偉達提供的Tesla運算用圖形處理器以進行協同運算,來在提供比美洲虎更高的運算性能之同時保持能源利用效率。整臺泰坦共計18,688顆中央處理器和相同數量的圖形處理器,理論峰值性能是27petaFLOPS(每秒27×1015次浮點運算),然而,在2012年11月的LINPACK基準性能測試中卻僅取得17.59petaFLOPS的成績(每秒17.59×1015次浮點運算),盡管如此,但無論從性能上抑或是能效比上來說,仍然要比同時期的其它超級電腦更勝一籌。
?
?
泰坦可用于任何目的的數據處理。然而,數據處理任務的優先級,需要基于三個方面的考量:任務計劃的重要度、任務計劃對異構運算的利用潛力以及任務計 劃的運算程序源碼與其它超級電腦的兼容性。經過篩選調度后,選中六個運算計劃,這六個“前鋒”計劃在泰坦開放使用后由泰坦依調度運行處理,這些處理任務多 為關于納米科技或氣候模型。不過其它沒被選為首先處理的任務計劃,仍會進行優先級調度,進入等候貯列,以待泰坦的運行處理。由于以圖形處理器來處理數據,基于圖形處理器擁有比中央處理器多得多的線程的理由,不少程序需要進行源碼變動處理以適應新的混合架構,這些處理常常需要有更高級的運算平行度,而這些變更甚至也可以在以中央處理器為主的超級電腦上獲得性能的提升。
?
?
機架、電源供應
?
泰坦超級電腦使用和美洲虎超級電腦相同的200個機柜的設計,占地404平方米,基本上只是更換了機柜和布線。沿用改進自美洲虎超級電腦的電力供應系統和冷卻系統,節省了能源部/實驗室約兩千萬美元的經費。泰坦的總耗電功率最大8.2兆瓦,比美洲虎高出了1.2兆瓦,但是泰坦提供比美洲虎快了幾乎10倍的運算性能,特別是浮點運算方面。電力供應系統的交流電輸入電壓高達480伏,供每個機柜使用,由于使用更高的電壓,因此可以使用比美國標準的208伏(線電壓)電纜更細的輸入電纜,由更小直徑的電纜銅芯上節省出來的資金就有一百萬美元。為應付電力供應突然中斷的事件,碳纖維飛輪能量存儲器可以維持網絡系統和存儲系統16秒的電力供應,如果兩秒內電力供應沒有恢復,柴油發電機就會在大約7秒的時間內啟動,并一直驅動飛輪,但是飛輪和發電機被設計成只為網絡系統和存儲系統維持電力供應,以便能快速重新打開整臺機器,發電機也不會為運算處理單元基礎設施提供后備電力供應,因此外接電力供應中斷時(即使發電機已啟動)是不會進行運算處理作業的,這個特性和筆記本電腦的“睡眠”功能類似。
?
冷卻系統
泰坦的機柜使用主動式風冷散熱器,但是外界空氣進入機柜前則要事先經過冷卻處理,所用的空氣冷卻器,可制冷質量為6,600噸(相當于23.2兆瓦的熱功率),以5.5攝氏度(約42華氏度)的低溫冷卻水作為空氣冷卻器的散熱介質,從機柜中帶走熱量的熱空氣會流到至空氣冷卻器冷卻,再回流進入機柜,如此往復循環。另外,“泰坦”的散熱系統設計時并沒有考慮噪音問題,因此這臺超級電腦運作時的噪音非常巨大,以至于機房需要更好的隔音措施,進入機房并且逗留超過15分鐘的人員必須采取像是佩戴隔音耳塞或耳機等的聽力保護措施。
?
?
運算主機
?
?
完整的泰坦超級電腦上有18,688個運算節點,每部刀片服務器擁有四個運算節點,24部刀鋒主機為一個機柜。
?
- 每個運算節點包含:?
- 一顆AMD Opteron 6274中央處理器,基于AMD Bulldozer微架構,擁有8個Bulldozer模塊共16個核心,核心時鐘頻率為2.2GHz
- 容量32GB,DDR3-1600帶ECC的存儲器
- 一塊NVIDIA Tesla K20X運算加速卡,包含:一顆基于NVIDIA Kepler架構、核心代號“GK110”的通用圖形處理器,擁有2,688個流處理器(CUDA核心)、核心時鐘頻率為732MHz,附帶容量為6GB、帶ECC的GDDR5顯示存儲器?
- 每兩個節點共用一個克雷公司研發的Gemini高速互連路由器
?
- 整臺超級電腦共299,008個處理器核心和超過710TB的存儲器容量(包括顯示存儲器,全部存儲器打開ECC功能后共693.6TB可用);
存儲器使用硬盤陣列存儲,原來容量是10PB(由13,400塊,每塊7,200轉每分1TB容量的硬盤組成),其有效傳送速率為240GB/s。?在2013年4月,進行了一次存儲器的升級,升級后的存儲器容量增至40PB,其有效傳送速率達到1.4TB/s。
?
?
為了更大幅度地提升平行運算性能,建造方選擇用通用圖形處理器實現,因為圖形處理器平行運算效率相比傳統的中央處理器的有更為巨大的優勢所在。盡管圖形處理器/通用圖形處理器的時鐘頻率要比中央處理器低不少,但每顆NVIDIA GK110顯示核心擁有2,688個時鐘頻率為732MHz的流處理器(CUDA核心),全部流處理器聯合進行運算處理,從而使得整個系統性能更高。?因此,在泰坦超級電腦上,中央處理器核心主要用以分配運算任務給通用圖形處理器,數據處理主要由通用圖形處理器來實現。而此前的超級電腦,則是由中央處理器直接處理數據,即使有通用圖形處理器的加入也就是輔助運算的角色。
?
主機管理
?
在運算主機以外,為方便管理并監視泰坦的運作狀況,還另外設置了登錄管理節點。每個登錄節點的配置為一顆八核心的AMD Opteron 6140中央處理器和256GB的存儲器。在授權用戶通過網絡連接至登錄管理節點并登錄后,默認是在登錄管理節點上進行任務調度、監視運算節點運作狀況等 作業。[41]
?
顯示設施
?
為了讓科研人員能夠更好地明白泰坦的數據處理結果,泰坦也設有顯示輸出,通過鏈接名為“EVEREST”的顯示設備來實現。EVEREST,全名 “Exploratory Visualisation Environment for Research and Technology”,意即“技術和研究的探索可視化環境”,是一個裝有一塊10米×3米(30英尺×10英尺)的主熒幕和一塊尺寸要小上一些的副熒幕 的房間,熒幕的分辨率均為3千7百萬像素×3千3百萬像素,還附帶3D顯示能力(需要配合3D眼鏡使用)。
?
性能、能效比表現
?
泰坦的理論峰值性能為每秒27×1015次浮點運算(27petaFLOPS),或者是每秒2.7千萬億次運算作業。2012年11月12日,泰坦通過LINPACK基準性能測試,最終成績為每秒17.59×1015次浮點運算,TOP500最后宣布了新的第一名由泰坦超級電腦奪得,取代前任第一IBM紅杉。盡管目前的實際峰值性能和理論峰值性能相比有較大落差,但能效比仍然要比眾多超級電腦優勝。
泰坦超級電腦也是Green500中排名第三的超級電腦(截至2012年11月),每消耗一瓦特的電功率獲得2142.77megaFLOPS(21.4277億次浮點運算每秒)的運算性能。Green500也是全球500強超級電腦的排名,但不同于TOP500的是Green500是根據性能功耗比來進行排名。
?
操作系統、文件系統
泰坦超級電腦使用克雷公司基于Linux核心開發的Cray Linux Environment分 布式操作系統。Cary Linux Environment操作系統由以下兩部分組成:登錄管理節點為全功能Linux核心的操作系統,運算節點則是為提升性能和效率而特別優化精簡的基于輕 量級Linux核心CNL(Compute Node Linux)的操作系統。文件系統使用Lustre分散式文件系統,代號“Spider”。
總結
以上是生活随笔為你收集整理的世界上最快的计算机-泰坦和天河二号的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 战舰V3显示汉字
- 下一篇: 【收藏】如何开始创业