EMC存储产品分析介绍 (一)
在存儲界,EMC是一艘巨型航母,其具有非常完整的產品線,從最普通的磁盤陣列開始到非常高端大氣的SSD存儲陣列,從支持小企業應用的小規模存儲產品,到支持海量存儲的云系統,從普通的備份軟件到支持海量數據去重的備份系統。EMC都一一提供了解決方案,可以說EMC在存儲界打造了一艘無與倫比的航空母艦。
面對EMC龐雜的存儲系統,很多人都會無從選擇。下面通過對EMC產品的特性,以及產品技術進行梳理,從而更好的理解EMC在存儲界的布局。
高端存儲陣列VMAX
VMAX產品就是我們很熟悉的在教科書上經常出現的Symatrix系統。該產品是一款高端的磁盤陣列系統,其采用星型網絡互聯的NUMA架構,VMAX的互聯示意圖如下所示:
通過上圖可以看出,VMAX最多可以連接8組head,每組head都是一對active-active雙控對,也就是說整個系統最多可以互聯16個head。這16個head通過rapidIO進行兩兩互聯,從而形成非常復雜的互聯網絡,這個互聯網絡被稱之為virtual?matrix。從整個系統來看,VMAX是一套CC-NUMA系統,一個機頭可以訪問系統中的所有內存,位于Head本地的內存被稱之為local內存,其余的為remote內存。在軟件上,為了提高系統性能,在VMAX中加入了SSD作為cache,并且有一套Fast?Automatically?Storage?Tier軟件實現存儲自動分層。
在市場上,和這套系統類似的系統有HP的3PAR陣列,該陣列的結構和VMAX幾乎一致,但是在硬件上做了很多特殊的定制,另外,3PAR沒有采用RapidIO作為互連總線,其采用了PCI-E作為節點之間的互聯,該產品的互連網絡如下所示:
值得一提的是3PAR實現了virtual?RAID,該RAID沒有采用傳統RAID的方式,而是建立在Chunk的基礎之上。
除此之外,在高端陣列的市場領域,還存在著其他產品架構,例如IBM的XIV具有更好的可擴展性。上面提到對于VMAX之類的架構,最大的問題在于可擴展性有限,因此,IBM的高端陣列提出了MPP的架構模式,IBM的XIV架構如下所示:
在該架構中,interface?module和data?module是分離的,他們通過以太網絡或者Infiniband互連起來。這種架構的最大優點在于具有更高的可擴展性,但是,軟件設計的復雜度要高于VMAX這種NUMA架構。
總體來講,VMAX之類的高端陣列滿足對IOPS、Throughput有較高要求的應用,對于一般要求的應用,可以選用EMC的中低端存儲產品VNX。
中低端存儲產品VNX
VNX產品包括原有的Celerra和Clariion系統。Celerra是NAS/ISCSI機頭,而Clariion則是提供后短存儲的盤陣。目前,對于VNX產品系列提供了低端的VNXe和中端的VNX系列。下圖是VNX盤陣的結構圖:
從這個結構圖可以看出VNX的后端是一種典型的雙控盤陣。當然,VNX的軟件有很多的附加值,例如其支持offline的重復數據刪除,并且支持volume卷的thin?provisioning,另外還支持塊級快照等功能。在導出協議上,其支持NFS、CIFS、MPFS、PNFS、FC、ISCSI以及FCoE等協議。市面上的中低端存儲,基本都是采用的這種雙控模式,提高了系統的單機可靠性。IBM、HP、DELL、NetApp和HDS都有相應的產品。
去重備份存儲DataDomain
DataDomain是一種后端去重設備。其可以支持多臺備份服務器提供在線數據去重。
在線塊級數據去重的最大問題是性能問題。數據去重大家采用的原理都差不多,將數據流分成大小不等的塊,自動分塊算法各家有所不同,其基本目的是為了提高數據去重效率。常用的自動數據分段算法可以參考《重復數據刪除過程中的數據自動分段》。分段之后的數據塊會通過SHA1算法得出一個Fingerprint,然后在系統中查找這個Fingerprint是否存在?如果存在,那么說明輸入的數據段是一個重復數據,不需要保存在存儲系統中。反之,輸入的數據塊會被保存到存儲系統中。從這個過程可以看出,數據去重最大的問題在于如何查找fingerprint?由于一個存儲系統數據量很大,那么這些fingerprint如何被管理、檢索是系統實現的關鍵。DataDomain系統的硬件是自定義的Numa架構系統,Numa的意義在于可以支持很大的內存空間,如果將幾乎所有的fingerprint都維護在內存中,那么Fingerprint檢索問題就變成了內存操作問題。除了在硬件上自定義之外,DataDomain為了提高數據去重效率,在軟件上也頗下了一番功夫。提出了SISL磁盤數據分布方式,以及采用Victor等Fingerprint?Cache優化方式。其中最有意思的還是SISL磁盤數據分布方式,SISL充分考慮了備份數據流的數據相關性,因此在存儲的時候相同stream的數據會連續分布在臨近磁盤空間。這樣可以最大限度提高磁盤性能。
DataDomain的最為后端備份產品,另一個很重要的特征是高數據可靠性,即使在多塊盤壞的狀況下,即使RAID已經失效,數據還是可以盡最大努力得以恢復,從而很好的保證了作為備份系統的數據高可用性。
?
總結
以上是生活随笔為你收集整理的EMC存储产品分析介绍 (一)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Android Fragment应用实战
- 下一篇: 常见树的总结