【CDS技术揭秘系列 总篇】阿里云的云定义存储来了
簡介:?全新發(fā)布的云定義存儲 CDS 和傳統(tǒng)的存儲陣列、分布式存儲、軟件定義存儲的區(qū)別在哪里?阿里云存儲團(tuán)隊如何看待將來存儲的發(fā)展趨勢?本文邀請了 CDS 研發(fā)團(tuán)隊的核心技術(shù)負(fù)責(zé)人為大家揭開圍繞著阿里云 CDS 的種種謎團(tuán)。
云定義存儲(CDS: Cloud Defined Storage)正式發(fā)布
在 2021 年中秋與國慶之際,阿里云存儲團(tuán)隊發(fā)布了全新的云定義存儲 CDS。
這次發(fā)布的 CDS 1.0 版本,基于阿里云飛天操作系統(tǒng)和分布式存儲底座盤古,是業(yè)界首次同時支持對象存儲服務(wù) OSS、塊存儲服務(wù) EBS、日志服務(wù) SLS和災(zāi)備服務(wù) HBR,特別是通過盤古全新的QoS框架支持對象存儲服務(wù) OSS 和塊存儲服務(wù) EBS 服務(wù)融合部署在同一套物理服務(wù)器上面。這次發(fā)布的存儲服務(wù)與公共云上規(guī)模化的存儲服務(wù)做到了代碼版本基本一致,彌合了以往混合云版本和公共云版本差距比較大的問題,讓客戶能夠享受到和公共云基本一致的功能。
阿里云存儲團(tuán)隊為什么要發(fā)布 CDS? CDS 和現(xiàn)在傳統(tǒng)的存儲陣列、分布式存儲、軟件定義存儲的區(qū)別在哪里?阿里云存儲團(tuán)隊如何看將來存儲的發(fā)展趨勢?在這里,我們 CDS 研發(fā)團(tuán)隊的核心技術(shù)負(fù)責(zé)人們會通過一系列的技術(shù)文章為大家揭開圍繞著阿里云 CDS 的種種謎團(tuán)。
為什么要開發(fā)云定義存儲?
業(yè)務(wù)的需求
從阿里云存儲在 2016 年底成立混合云存儲 HCS(Hybrid Cloud Storage)部門以來,內(nèi)外部業(yè)務(wù)對規(guī)模配置靈活和功能有競爭力的分布式存儲產(chǎn)品的需求一直都不少。當(dāng)時綜合考慮產(chǎn)品研發(fā)的投入,阿里云在混合云市場尚且缺乏經(jīng)驗,以及國內(nèi)市場參與廠商比較多和競爭激烈等多方面因素,我們制定的策略是以專有云集成的分布式存儲、陣列、災(zāi)備一體機(jī)等結(jié)合起步,先進(jìn)入傳統(tǒng)存儲市場的不同細(xì)分領(lǐng)域試水,為阿里云了解和摸索這個市場,儲備經(jīng)驗和彈藥。
自 2018 年開始,隨著 IT 基礎(chǔ)設(shè)施云化的節(jié)奏加快,基于云的基礎(chǔ)架構(gòu)或者數(shù)據(jù)中心已經(jīng)成為政企客戶的首選方案,給新的存儲廠商特別是軟件定義存儲廠商帶來了巨大的市場機(jī)會,同時隨著阿里云在混合云市場的發(fā)展,對阿里云存儲在混合云場景輸出的要求越來越高漲,于是存儲團(tuán)隊在 2019 年開始正式啟動相關(guān)產(chǎn)品的規(guī)劃、設(shè)計和開發(fā)。
艱難的決策
在把目標(biāo)聚焦在分布式存儲和 SDS 的方向以后,通過分析和研究,我們發(fā)現(xiàn)國內(nèi) SDS 產(chǎn)品的的同質(zhì)化很嚴(yán)重,我們?nèi)绻撾x公共云技術(shù)棧另起爐灶搞一個類似的產(chǎn)品難以構(gòu)建持久的核心競爭力,同時從技術(shù)和工程角度講,公共云和專有云兩套產(chǎn)品架構(gòu)并行開發(fā),會造成巨大資源浪費(fèi),很多相似特性都需要在不同產(chǎn)品上重新做一遍,而且由于架構(gòu)約束還不能保證都能支持。最后我們決策啟動混合云分布式存儲 SDS 的自研,技術(shù)上堅持公共云和混合云 CDS 共享同一套技術(shù)和代碼,保持公共云存儲服務(wù)的彈性、擴(kuò)展能力和服務(wù)托管的差異化競爭力,同時積極補(bǔ)齊企業(yè)存儲的高級特性。因此混合云 CDS 的架構(gòu)、功能和用戶體驗都是和公共云保持一致的, 這也是我們這里所說的云定義存儲的“云定義”的由來。
接下來,我們依次介紹一下軟件定義存儲的特點、云定義存儲和軟件定義存儲的區(qū)別。
軟件定義存儲
軟件定義存儲的起源
軟件定義存儲(SDS:Software Defined Storage)的說法最早見于 2012 年 VMware 和 EMC 推動軟件定義數(shù)據(jù)中心(SDDC:Software Defined Data Center)的一系列市場戰(zhàn)役,后續(xù)一眾數(shù)據(jù)中心/服務(wù)器/存儲廠商也跟進(jìn)了這個定義,大家的策略是為了應(yīng)對越來越明顯的企業(yè)上云的訴求,以及 AWS/Azure 云計算廠商帶來的壓力和競爭,于是面向云計算重新定義了企業(yè)數(shù)據(jù)中心和存儲的路徑和方向。當(dāng)年 SDS 最熱的一段歷史過程如下圖所示:
軟件定義存儲的關(guān)鍵特征
軟件定義存儲有很多特征,業(yè)界比較公認(rèn)的有三大特征:抽象(abstract),池化(pool)和自動化(automate)。這些特征背后的驅(qū)動力是企業(yè)上云和企業(yè) ICT 基礎(chǔ)設(shè)施云化。
- 抽象,軟硬解耦,管控解耦:云計算廠商和云化的數(shù)據(jù)中心大量使用了標(biāo)準(zhǔn)化/商業(yè)化的服務(wù)器來替代EMC/NetApp/IBM 等的專有硬件存儲設(shè)備,大規(guī)模采購、存儲/服務(wù)器分別招標(biāo)等促使存儲軟件和硬件解耦。數(shù)據(jù)面和管控面解耦,也幫助客戶通過統(tǒng)一的管控面來管理不同廠商的不同硬件(數(shù)據(jù)面)。
- 池化和橫向擴(kuò)展:為了提高資源利用效率,使用存儲虛擬化技術(shù)池化各種存儲和數(shù)據(jù)煙囪。
- 自動化:通過開發(fā) API,讓軟件來控制存儲資源和服務(wù)的增刪改查,比人機(jī)界面的效率更高,業(yè)務(wù)彈性伸縮能力更強(qiáng)。
軟件定義存儲與傳統(tǒng)存儲陣列/軟件的區(qū)別
SDS 和傳統(tǒng)存儲陣列在硬件耦合、節(jié)點/控制器擴(kuò)展方式和規(guī)模、交互和管理接口各個層面都有區(qū)別:
值得一提的區(qū)別是,SDS 的“軟件定義”在國外特別強(qiáng)調(diào)的是 SDS 是 API/SDK 豐富,可以軟件編程驅(qū)動,而傳統(tǒng)存儲更多的人機(jī)交互接口,管理員驅(qū)動為主。
云定義存儲是什么
云定義存儲 CDS 是一個全新的軟件定義存儲,既能夠在定制的 CDS 存儲服務(wù)器上軟硬一體優(yōu)化輸出,也有支持 X86 到各個信創(chuàng)平臺的軟件輸出模式。其中最核心的關(guān)鍵詞是“云定義”,總結(jié)下來有六大能力:
- 云原生(Cloud Native)
CDS 不是重新開發(fā)的產(chǎn)品,它是把阿里云公共云的各種存儲服務(wù),按照產(chǎn)品規(guī)劃和市場需求逐步導(dǎo)入發(fā)布到統(tǒng)一的 CDS 存儲平臺,在內(nèi)部 CDS 里的存儲服務(wù)例如 OSS 的代碼和特性和公共云完全一致;對外部,CDS 集成的各種云存儲服務(wù)從控制臺(GUI)、命令行(CLI)到 Open API/SDK 都和公共云一致,降低了原有阿里云客戶和合作伙伴使用和集成的難度。
與此同時,CDS 還天然支持公共云的分層架構(gòu):云-區(qū)域(Region)-可用區(qū)(AZ)-集群(Cluster)。
- 云規(guī)模(Cloud Scale)
相對絕大部分分布式存儲或者 SDS 廠商,阿里云 CDS 的最大優(yōu)勢就是 CDS 這些代碼都是經(jīng)歷了阿里云公共云百萬級客戶和阿里巴巴集團(tuán)各種業(yè)務(wù)(例如雙十一)的打磨和驗證的,支撐了超大規(guī)模和復(fù)雜業(yè)務(wù)的壓力。以CDS 的 OSS 存儲服務(wù)為例,單個桶在生產(chǎn)環(huán)境能夠支持萬億對象,達(dá)到 EB 級容量。
- 云服務(wù)(Cloud Service)
CDS 在同一存儲平臺上同時提供多種云存儲服務(wù)(一般最常見的有塊存儲和對象存儲服務(wù)),支持多租戶。前臺可以像公共云那樣客戶自助服務(wù)(Self Service),后臺可以客戶自主運(yùn)維也可以托管運(yùn)維(本地駐場或者遠(yuǎn)程),各種基本存儲服務(wù)通過 CDS 云管套件統(tǒng)一管控和運(yùn)維、通過盤古統(tǒng)一數(shù)據(jù)底座,同時可以選擇開通高級存儲服務(wù)例如日志服務(wù)、災(zāi)備服務(wù)、數(shù)據(jù)管理和分析服務(wù)等。
與此同時,為了加速企業(yè)上云,阿里云存儲在公共云和 CDS 上同步發(fā)布企業(yè)存儲的功能,例如基于 EBS 的企業(yè)級塊存儲 ESSD ,基于 HBR 的容災(zāi)備份功能。
- 云連通(to Cloud)
存儲數(shù)據(jù)在 CDS 和 CDS 以外的云之間通過網(wǎng)絡(luò)受控的安全的流動。
- 云部署(on Cloud)
CDS 直接部署在云環(huán)境里作為云存儲服務(wù)對外提供服務(wù),這里的云環(huán)境可以是公共云、本地云、邊緣云和專有云等各種云架構(gòu)。
- 混合多云(Hybrid Multi Cloud)
除了外部客戶的需求,阿里巴巴集團(tuán)內(nèi)部也有很多業(yè)務(wù)單元在對外輸出產(chǎn)品或者服務(wù)的時候都有對存儲的需求,綜合這些需求,他們或者他們的客戶都有避免被某個供應(yīng)商鎖定的訴求,混合多云已經(jīng)成為標(biāo)配。在這里,混合多云有兩種不同解讀:一種是阿里云的混合多云,包括阿里云公共云、混合云、本地云、邊緣云計算等等;另外一種是阿里云和其他的云計算服務(wù)商。
CDS 基于統(tǒng)一的盤古 2.0 分布式存儲混合多云實現(xiàn)了混合多云、云連通等多態(tài)云部署:
重新定義的特性發(fā)布模式
阿里云 CDS 不僅重新定義了混合云的 SDS 的新基線,同時也重新定義了阿里云存儲產(chǎn)品和特性研發(fā)的工程模式,從 CDS 1.0 開始,已經(jīng)在 CDS 平臺發(fā)布的云存儲服務(wù)單品會被要求公共云和混合云場景準(zhǔn)同時發(fā)布。與此同時,混合云輸出特別是無公網(wǎng)連接的場景,依賴客戶或者駐場服務(wù)人員的技術(shù)能力;阿里云 CDS 產(chǎn)品重點打磨智能運(yùn)維、RAS、和自動診斷能力,這些能力也同時反哺到公共云存儲服務(wù)中,提高系統(tǒng)運(yùn)維效率,增強(qiáng)系統(tǒng)穩(wěn)定性。
CDS 重新定義的工程模式大大加速了混合云存儲版本發(fā)布的能效,在本財年 CDS 的下一版本里,云存儲網(wǎng)關(guān)、新的企業(yè)級快存儲 ESSD 和文件存儲 NAS 等重要產(chǎn)品和特性將快速推出。
展望
阿里云 CDS 是一個云定義的存儲平臺,當(dāng)前 CDS 1.0 版本支持了多款阿里云存儲產(chǎn)品和數(shù)據(jù)服務(wù)(包括塊存儲 EBS、對象存儲 OSS、日志服務(wù) SLS 和災(zāi)備服務(wù) HBR)。在接下來的技術(shù)連載里我們會逐步介紹 CDS 里平臺和管控服務(wù)、盤古、EBS、OSS、SLS 等各個產(chǎn)品和關(guān)鍵模塊的特點。
阿里云 CDS1.0 的發(fā)布,代表著阿里云存儲開始以一個原汁原味的云存儲的形態(tài)進(jìn)入混合云存儲市場,來滿足日益增長的云計算的需求。作為國內(nèi)公共云的領(lǐng)先者,同時又是混合云市場的挑戰(zhàn)者,我們有堅定的信心和決心,和高校的專家、友商同行一起推動中國存儲技術(shù)的發(fā)展。
原創(chuàng)作品:阿里云存儲 慈湖
原文鏈接
本文為阿里云原創(chuàng)內(nèi)容,未經(jīng)允許不得轉(zhuǎn)載。
總結(jié)
以上是生活随笔為你收集整理的【CDS技术揭秘系列 总篇】阿里云的云定义存储来了的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 谁来拯救存量SGX1平台?又一个内核特性
- 下一篇: 用代码玩剧本杀?第3届83行代码大赛剧情