【高并发解决方案】6、数据库水平切分的实现原理解析
?
第1章 引言
隨著互聯(lián)網(wǎng)應(yīng)用的廣泛普及,海量數(shù)據(jù)的存儲和訪問成為了系統(tǒng)設(shè)計的瓶頸問題。對于一個大型的互聯(lián)網(wǎng)應(yīng)用,每天幾十億的PV無疑對數(shù)據(jù)庫造成了相當(dāng)高的負(fù)載。對于系統(tǒng)的穩(wěn)定性和擴展性造成了極大的問題。通過數(shù)據(jù)切分來提高網(wǎng)站性能,橫向擴展數(shù)據(jù)層已經(jīng)成為架構(gòu)研發(fā)人員首選的方式。
- 水平切分?jǐn)?shù)據(jù)庫:可以降低單臺機器的負(fù)載,同時最大限度的降低了宕機造成的損失;
- 負(fù)載均衡策略:可以降低單臺機器的訪問負(fù)載,降低宕機的可能性;
- 集群方案:解決了數(shù)據(jù)庫宕機帶來的單點數(shù)據(jù)庫不能訪問的問題;
- 讀寫分離策略:最大限度了提高了應(yīng)用中讀取數(shù)據(jù)的速度和并發(fā)量;
第2章 基本原理和概念
什么是數(shù)據(jù)切分
"Shard" 這個詞英文的意思是"碎片",而作為數(shù)據(jù)庫相關(guān)的技術(shù)用語,似乎最早見于大型多人在線角色扮演游戲中。"Sharding" 姑且稱之為"分片"。Sharding 不是一個某個特定數(shù)據(jù)庫軟件附屬的功能,而是在具體技術(shù)細(xì)節(jié)之上的抽象處理,是水平擴展(Scale Out,亦或橫向擴展、向外擴展)的解決方案,其主要目的是為突破單節(jié)點數(shù)據(jù)庫服務(wù)器的 I/O 能力限制,解決數(shù)據(jù)庫擴展性問題。通過一系列的切分規(guī)則將數(shù)據(jù)水平分布到不同的DB或table中,在通過相應(yīng)的DB路由或者table路由規(guī)則找到需要查詢的具體的DB或者table,以進行Query操作。“sharding”通常是指“水平切分”,這也是本文討論的重點。接下來舉個簡單的例子:我們針對一個Blog應(yīng)用中的日志來說明,比如日志文章(article)表有如下字段:
面對這樣的一個表,我們怎樣切分呢?怎樣將這樣的數(shù)據(jù)分布到不同的數(shù)據(jù)庫中的表中去呢?我們可以這樣做,將user_id為1~10000的所有的文章信息放入DB1中的article表中,將user_id為10001~20000的所有文章信息放入DB2中的 article表中,以此類推,一直到DBn。這樣一來,文章數(shù)據(jù)就很自然的被分到了各個數(shù)據(jù)庫中,達到了數(shù)據(jù)切分的目的。
接下來要解決的問題就是怎樣找到具體的數(shù)據(jù)庫呢?其實問題也是簡單明顯的,既然分庫的時候我們用到了區(qū)分字段user_id,那么很自然,數(shù)據(jù)庫路由的過程當(dāng)然還是少不了user_id的。就是我們知道了這個blog的user_id,就利用這個user_id,利用分庫時候的規(guī)則,反過來定位具體的數(shù)據(jù)庫。比如user_id是234,利用剛才的規(guī)則,就應(yīng)該定位到DB1,假如user_id是12343,利用該才的規(guī)則,就應(yīng)該定位到DB2。以此類推,利用分庫的規(guī)則,反向的路由到具體的DB,這個過程我們稱之為“DB路由”。
平常我們會自覺的按照范式來設(shè)計我們的數(shù)據(jù)庫,考慮到數(shù)據(jù)切分的DB設(shè)計,將違背這個通常的規(guī)矩和約束。為了切分,我們不得不在數(shù)據(jù)庫的表中出現(xiàn)冗余字段,用作區(qū)分字段或者叫做分庫的標(biāo)記字段。比如上面的article的例子中的user_id這樣的字段(當(dāng)然,剛才的例子并沒有很好的體現(xiàn)出user_id的冗余性,因為user_id這個字段即使就是不分庫,也是要出現(xiàn)的,算是我們撿了便宜吧)。當(dāng)然冗余字段的出現(xiàn)并不只是在分庫的場景下才出現(xiàn)的,在很多大型應(yīng)用中,冗余也是必須的,這個涉及到高效DB的設(shè)計,本文不再贅述。
為什么要數(shù)據(jù)切分
上面對什么是數(shù)據(jù)切分做了個概要的描述和解釋,讀者可能會疑問,為什么需要數(shù)據(jù)切分呢?像 Oracle這樣成熟穩(wěn)定的數(shù)據(jù)庫,足以支撐海量數(shù)據(jù)的存儲與查詢了?為什么還需要數(shù)據(jù)切片呢?
的確,Oracle的DB確實很成熟很穩(wěn)定,但是高昂的使用費用和高端的硬件支撐不是每一個公司能支付的起的。試想一下一年幾千萬的使用費用和動輒上千萬元的小型機作為硬件支撐,這是一般公司能支付的起的嗎?即使就是能支付的起,假如有更好的方案,有更廉價且水平擴展性能更好的方案,我們?yōu)槭裁床贿x擇呢?
我們知道每臺機器無論配置多么好它都有自身的物理上限,所以當(dāng)我們應(yīng)用已經(jīng)能觸及或遠(yuǎn)遠(yuǎn)超出單臺機器的某個上限的時候,我們惟有尋找別的機器的幫助或者繼續(xù)升級的我們的硬件,但常見的方案還是橫向擴展,通過添加更多的機器來共同承擔(dān)壓力。我們還得考慮當(dāng)我們的業(yè)務(wù)邏輯不斷增長,我們的機器能不能通過線性增長就能滿足需求?Sharding可以輕松的將計算,存儲,I/O并行分發(fā)到多臺機器上,這樣可以充分利用多臺機器各種處理能力,同時可以避免單點失敗,提供系統(tǒng)的可用性,進行很好的錯誤隔離。
綜合以上因素,數(shù)據(jù)切分是很有必要的。 我們用免費的MySQL和廉價的Server甚至是PC做集群,達到小型機+大型商業(yè)DB的效果,減少大量的資金投入,降低運營成本,何樂而不為呢?所以,我們選擇Sharding,擁抱Sharding。
怎么做到數(shù)據(jù)切分
數(shù)據(jù)切分可以是物理上的,對數(shù)據(jù)通過一系列的切分規(guī)則將數(shù)據(jù)分布到不同的DB服務(wù)器上,通過路由規(guī)則路由訪問特定的數(shù)據(jù)庫,這樣一來每次訪問面對的就不是單臺服務(wù)器了,而是N臺服務(wù)器,這樣就可以降低單臺機器的負(fù)載壓力。
數(shù)據(jù)切分也可以是數(shù)據(jù)庫內(nèi)的,對數(shù)據(jù)通過一系列的切分規(guī)則,將數(shù)據(jù)分布到一個數(shù)據(jù)庫的不同表中,比如將article分為article_001,article_002等子表,若干個子表水平拼合有組成了邏輯上一個完整的article表,這樣做的目的其實也是很簡單的。舉個例子說明,比如article表中現(xiàn)在有5000w條數(shù)據(jù),此時我們需要在這個表中增加(insert)一條新的數(shù)據(jù),insert完畢后,數(shù)據(jù)庫會針對這張表重新建立索引,5000w行數(shù)據(jù)建立索引的系統(tǒng)開銷還是不容忽視的。但是反過來,假如我們將這個表分成100 個table呢,從article_001一直到article_100,5000w行數(shù)據(jù)平均下來,每個子表里邊就只有50萬行數(shù)據(jù),這時候我們向一張 只有50w行數(shù)據(jù)的table中insert數(shù)據(jù)后建立索引的時間就會呈數(shù)量級的下降,極大了提高了DB的運行時效率,提高了DB的并發(fā)量。當(dāng)然分表的好處還不知這些,還有諸如寫操作的鎖操作等,都會帶來很多顯然的好處。
綜上,分庫降低了單點機器的負(fù)載;分表,提高了數(shù)據(jù)操作的效率,尤其是Write操作的效率。行文至此我們依然沒有涉及到如何切分的問題。接下來,我們將對切分規(guī)則進行詳盡的闡述和說明。
上文中提到,要想做到數(shù)據(jù)的水平切分,在每一個表中都要有相冗余字符作為切分依據(jù)和標(biāo)記字段,通常的應(yīng)用中我們選用user_id作為區(qū)分字段,基于此就有如下三種分庫的方式和規(guī)則:(當(dāng)然還可以有其他的方式)
(1)?號段分區(qū)
user_id為1~1000的對應(yīng)DB1,1001~2000的對應(yīng)DB2,以此類推;
優(yōu)點:可部分遷移
缺點:數(shù)據(jù)分布不均
(2)hash取模分區(qū)
對user_id進行hash(或者如果user_id是數(shù)值型的話直接使用user_id 的值也可),然后用一個特定的數(shù)字,比如應(yīng)用中需要將一個數(shù)據(jù)庫切分成4個數(shù)據(jù)庫的話,我們就用4這個數(shù)字對user_id的hash值進行取模運算,也就是user_id%4,這樣的話每次運算就有四種可能:結(jié)果為1的時候?qū)?yīng)DB1;結(jié)果為2的時候?qū)?yīng)DB2;結(jié)果為3的時候?qū)?yīng)DB3;結(jié)果為0的時候?qū)?yīng)DB4。這樣一來就非常均勻的將數(shù)據(jù)分配到4個DB中。
優(yōu)點:數(shù)據(jù)分布均勻
缺點:數(shù)據(jù)遷移的時候麻煩,不能按照機器性能分?jǐn)倲?shù)據(jù)
(3)在認(rèn)證庫中保存數(shù)據(jù)庫配置
就是建立一個DB,這個DB單獨保存user_id到DB的映射關(guān)系,每次訪問數(shù)據(jù)庫的時候都要先查詢一次這個數(shù)據(jù)庫,以得到具體的DB信息,然后才能進行我們需要的查詢操作。
優(yōu)點:靈活性強,一對一關(guān)系
缺點:每次查詢之前都要多一次查詢,性能大打折扣
以上就是通常的開發(fā)中我們選擇的三種方式,有些復(fù)雜的項目中可能會混合使用這三種方式。 通過上面的描述,我們對分庫的規(guī)則也有了簡單的認(rèn)識和了解。當(dāng)然還會有更好更完善的分庫方式,還需要我們不斷的探索和發(fā)現(xiàn)。
第3章 本課題研究的基本輪廓
分布式數(shù)據(jù)方案提供功能如下:
(1)提供分庫規(guī)則和路由規(guī)則(RouteRule簡稱RR);
(2)引入集群(Group)的概念,保證數(shù)據(jù)的高可用性;
(3)引入負(fù)載均衡策略(LoadBalancePolicy簡稱LB);
(4)引入集群節(jié)點可用性探測機制,對單點機器的可用性進行定時的偵測,以保證LB策略的正確實施,以確保系統(tǒng)的高度穩(wěn)定性;
(5)引入讀/寫分離,提高數(shù)據(jù)的查詢速度;
僅僅是分庫分表的數(shù)據(jù)層設(shè)計也是不夠完善的,當(dāng)我們采用了數(shù)據(jù)庫切分方案,也就是說有N臺機器組成了一個完整的DB 。如果有一臺機器宕機的話,也僅僅是一個DB的N分之一的數(shù)據(jù)不能訪問而已,這是我們能接受的,起碼比切分之前的情況好很多了,總不至于整個DB都不能訪問。
一般的應(yīng)用中,這樣的機器故障導(dǎo)致的數(shù)據(jù)無法訪問是可以接受的,假設(shè)我們的系統(tǒng)是一個高并發(fā)的電子商務(wù)網(wǎng)站呢?單節(jié)點機器宕機帶來的經(jīng)濟損失是非常嚴(yán)重的。也就是說,現(xiàn)在我們這樣的方案還是存在問題的,容錯性能是經(jīng)不起考驗的。當(dāng)然了,問題總是有解決方案的。我們引入集群的概念,在此我稱之為Group,也就是每一個分庫的節(jié)點我們引入多臺機器,每臺機器保存的數(shù)據(jù)是一樣的,一般情況下這多臺機器分?jǐn)傌?fù)載,當(dāng)出現(xiàn)宕機情況,負(fù)載均衡器將分配負(fù)載給這臺宕機的機器。這樣一來,就解決了容錯性的問題。
如上圖所示,整個數(shù)據(jù)層有Group1,Group2,Group3三個集群組成,這三個集群就是數(shù)據(jù)水平切分的結(jié)果,當(dāng)然這三個集群也就組成了一個包含完整數(shù)據(jù)的DB。每一個Group包括1個Master(當(dāng)然Master也可以是多個)和 N個Slave,這些Master和Slave的數(shù)據(jù)是一致的。 比如Group1中的一個slave發(fā)生了宕機現(xiàn)象,那么還有兩個slave是可以用的,這樣的模型總是不會造成某部分?jǐn)?shù)據(jù)不能訪問的問題,除非整個 Group里的機器全部宕掉,但是考慮到這樣的事情發(fā)生的概率非常小(除非是斷電了,否則不易發(fā)生吧)。
在沒有引入集群以前,我們的一次查詢的過程大致如下:請求數(shù)據(jù)層,并傳遞必要的分庫區(qū)分字段 (通常情況下是user_id)。數(shù)據(jù)層根據(jù)區(qū)分字段Route到具體的DB,在這個確定的DB內(nèi)進行數(shù)據(jù)操作。
這是沒有引入集群的情況,當(dāng)時引入集群會 是什么樣子的呢?我們的路由器上規(guī)則和策略其實只能路由到具體的Group,也就是只能路由到一個虛擬的Group,這個Group并不是某個特定的物理服務(wù)器。接下來需要做的工作就是找到具體的物理的DB服務(wù)器,以進行具體的數(shù)據(jù)操作。
基于這個環(huán)節(jié)的需求,我們引入了負(fù)載均衡器的概念 (LB),負(fù)載均衡器的職責(zé)就是定位到一臺具體的DB服務(wù)器。具體的規(guī)則如下:負(fù)載均衡器會分析當(dāng)前sql的讀寫特性,如果是寫操作或者是要求實時性很強的操作的話,直接將查詢負(fù)載分到Master,如果是讀操作則通過負(fù)載均衡策略分配一個Slave。
我們的負(fù)載均衡器的主要研究方向也就是負(fù)載分發(fā)策略,通常情況下負(fù)載均衡包括隨機負(fù)載均衡和加權(quán)負(fù)載均衡。隨機負(fù)載均衡很好理解,就是從N個Slave中隨機選取一個Slave。這樣的隨機負(fù)載均衡是不考慮機器性能的,它默認(rèn)為每臺機器的性能是一樣的。假如真實的情況是這樣的,這樣做也是無可厚非的。假如實際情況并非如此呢?每個Slave的機器物理性能和配置不一樣的情況,再使用隨機的不考慮性能的負(fù)載均衡,是非常不科學(xué)的,這樣一來會給機器性能差的機器帶來不必要的高負(fù)載,甚至帶來宕機的危險,同時高性能的數(shù)據(jù)庫服務(wù)器也不能充分發(fā)揮其物理性能。基于此考慮從,我們引入了加權(quán)負(fù)載均衡,也就是在我們的系統(tǒng)內(nèi)部通過一定的接口,可以給每臺DB服務(wù)器分配一個權(quán)值,然后再運行時LB根據(jù)權(quán)值在集群中的比重,分配一定比例的負(fù)載給該DB服務(wù)器。當(dāng)然這樣的概念的引入,無疑增大了系統(tǒng)的復(fù)雜性和可維護性。有得必有失,我們也沒有辦法逃過的。
有了分庫,有了集群,有了負(fù)載均衡器,是不是就萬事大吉了呢? 事情遠(yuǎn)沒有我們想象的那么簡單。雖然有了這些東西,基本上能保證我們的數(shù)據(jù)層可以承受很大的壓力,但是這樣的設(shè)計并不能完全規(guī)避數(shù)據(jù)庫宕機的危害。假如Group1中的slave2 宕機了,那么系統(tǒng)的LB并不能得知,這樣的話其實是很危險的,因為LB不知道,它還會以為slave2為可用狀態(tài),所以還是會給slave2分配負(fù)載。這樣一來,問題就出來了,客戶端很自然的就會發(fā)生數(shù)據(jù)操作失敗的錯誤或者異常。
這樣是非常不友好的!怎樣解決這樣的問題呢? 我們引入集群節(jié)點的可用性探測機制?,或者是可用性的數(shù)據(jù)推送機制。這兩種機制有什么不同呢?首先說探測機制吧,顧名思義,探測即使,就是我的數(shù)據(jù)層客戶端,不定時對集群中各個數(shù)據(jù)庫進行可用性的嘗試,實現(xiàn)原理就是嘗試性鏈接,或者數(shù)據(jù)庫端口的嘗試性訪問,都可以做到。
那數(shù)據(jù)推送機制又是什么呢?其實這個就要放在現(xiàn)實的應(yīng)用場景中來討論這個問題了,一般情況下應(yīng)用的DB 數(shù)據(jù)庫宕機的話我相信DBA肯定是知道的,這個時候DBA手動的將數(shù)據(jù)庫的當(dāng)前狀態(tài)通過程序的方式推送到客戶端,也就是分布式數(shù)據(jù)層的應(yīng)用端,這個時候在更新一個本地的DB狀態(tài)的列表。并告知LB,這個數(shù)據(jù)庫節(jié)點不能使用,請不要給它分配負(fù)載。一個是主動的監(jiān)聽機制,一個是被動的被告知的機制。兩者各有所長。但是都可以達到同樣的效果。這樣一來剛才假設(shè)的問題就不會發(fā)生了,即使就是發(fā)生了,那么發(fā)生的概率也會降到最低。
上面的文字中提到的Master和Slave ,我們并沒有做太多深入的講解。一個Group由1個Master和N個Slave組成。為什么這么做呢?其中Master負(fù)責(zé)寫操作的負(fù)載,也就是說一切寫的操作都在Master上進行,而讀的操作則分?jǐn)偟絊lave上進行。這樣一來的可以大大提高讀取的效率。在一般的互聯(lián)網(wǎng)應(yīng)用中,經(jīng)過一些數(shù)據(jù)調(diào)查得出結(jié)論,讀/寫的比例大概在 10:1左右 ,也就是說大量的數(shù)據(jù)操作是集中在讀的操作,這也就是為什么我們會有多個Slave的原因。
但是為什么要分離讀和寫呢?熟悉DB的研發(fā)人員都知道,寫操作涉及到鎖的問題,不管是行鎖還是表鎖還是塊鎖,都是比較降低系統(tǒng)執(zhí)行效率的事情。我們這樣的分離是把寫操作集中在一個節(jié)點上,而讀操作其其他 的N個節(jié)點上進行,從另一個方面有效的提高了讀的效率,保證了系統(tǒng)的高可用性。
?轉(zhuǎn)自:http://www.cnblogs.com/zhongxinWang/p/4262650.html
總結(jié)
以上是生活随笔為你收集整理的【高并发解决方案】6、数据库水平切分的实现原理解析的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: iOS 修改UITabBar的默认点击行
- 下一篇: (反射):获取一个类的父类和父类的泛型