Redis主从与集群
一、Redis 集群概述
Redis 主從復(fù)制
到 目前 為止,我們所學(xué)習(xí)的 Redis 都是?單機(jī)版?的,這也就意味著一旦我們所依賴(lài)的 Redis 服務(wù)宕機(jī)了,我們的主流程也會(huì)受到一定的影響,這當(dāng)然是我們不能夠接受的。
所以一開(kāi)始我們的想法是:搞一臺(tái)備用機(jī)。這樣我們就可以在一臺(tái)服務(wù)器出現(xiàn)問(wèn)題的時(shí)候切換動(dòng)態(tài)地到另一臺(tái)去:
幸運(yùn)的是,兩個(gè)節(jié)點(diǎn)數(shù)據(jù)的同步我們可以使用 Redis 的?主從同步?功能幫助到我們,這樣一來(lái),有個(gè)備份,心里就踏實(shí)多了。
?
Redis 哨兵
后來(lái)因?yàn)槟撤N神秘力量,Redis 老會(huì)在莫名其妙的時(shí)間點(diǎn)出問(wèn)題?(比如半夜 2 點(diǎn)),我總不能 24 小時(shí)時(shí)刻守在電腦旁邊切換節(jié)點(diǎn)吧,于是另一個(gè)想法又開(kāi)始了:給所有的節(jié)點(diǎn)找一個(gè)?"管家",自動(dòng)幫我監(jiān)聽(tīng)照顧節(jié)點(diǎn)的狀態(tài)并切換:
這大概就是?Redis 哨兵?(Sentinel)?的簡(jiǎn)單理解啦。什么?管家宕機(jī)了怎么辦?相較于有大量請(qǐng)求的 Redis 服務(wù)來(lái)說(shuō),管家宕機(jī)的概率就要小得多啦.. 如果真的宕機(jī)了,我們也可以直接切換成當(dāng)前可用的節(jié)點(diǎn)保證可用..
?
Redis 集群化
好了,通過(guò)上面的一些解決方案我們對(duì) Redis 的?穩(wěn)定性?稍微有了一些底氣了,但單臺(tái)節(jié)點(diǎn)的計(jì)算能力始終有限,所謂人多力量大,如果我們把?多個(gè)節(jié)點(diǎn)組合?成?一個(gè)可用的工作節(jié)點(diǎn),那就大大增加了 Redis 的 ?高可用、可擴(kuò)展、分布式、容錯(cuò)?等特性:
二、主從復(fù)制
主從復(fù)制,是指將一臺(tái) Redis 服務(wù)器的數(shù)據(jù),復(fù)制到其他的 Redis 服務(wù)器。前者稱(chēng)為?主節(jié)點(diǎn)(master),后者稱(chēng)為?從節(jié)點(diǎn)(slave)。且數(shù)據(jù)的復(fù)制是?單向?的,只能由主節(jié)點(diǎn)到從節(jié)點(diǎn)。Redis 主從復(fù)制支持?主從同步?和?從從同步?兩種,后者是 Redis 后續(xù)版本新增的功能,以減輕主節(jié)點(diǎn)的同步負(fù)擔(dān)。
主從復(fù)制主要的作用
-
數(shù)據(jù)冗余:?主從復(fù)制實(shí)現(xiàn)了數(shù)據(jù)的熱備份,是持久化之外的一種數(shù)據(jù)冗余方式。
-
故障恢復(fù):?當(dāng)主節(jié)點(diǎn)出現(xiàn)問(wèn)題時(shí),可以由從節(jié)點(diǎn)提供服務(wù),實(shí)現(xiàn)快速的故障恢復(fù)?(實(shí)際上是一種服務(wù)的冗余)。
-
負(fù)載均衡:?在主從復(fù)制的基礎(chǔ)上,配合讀寫(xiě)分離,可以由主節(jié)點(diǎn)提供寫(xiě)服務(wù),由從節(jié)點(diǎn)提供讀服務(wù)?(即寫(xiě) Redis 數(shù)據(jù)時(shí)應(yīng)用連接主節(jié)點(diǎn),讀 Redis 數(shù)據(jù)時(shí)應(yīng)用連接從節(jié)點(diǎn)),分擔(dān)服務(wù)器負(fù)載。尤其是在寫(xiě)少讀多的場(chǎng)景下,通過(guò)多個(gè)從節(jié)點(diǎn)分擔(dān)讀負(fù)載,可以大大提高 Redis 服務(wù)器的并發(fā)量。
-
高可用基石:?除了上述作用以外,主從復(fù)制還是哨兵和集群能夠?qū)嵤┑?基礎(chǔ),因此說(shuō)主從復(fù)制是 Redis 高可用的基礎(chǔ)。
■快速體驗(yàn)
在?Redis?中,用戶(hù)可以通過(guò)執(zhí)行?SLAVEOF?命令或者設(shè)置?slaveof?選項(xiàng),讓一個(gè)服務(wù)器去復(fù)制另一個(gè)服務(wù)器,以下三種方式是?完全等效?的:
-
配置文件:在從服務(wù)器的配置文件中加入:slaveof <masterip> <masterport>
-
啟動(dòng)命令:redis-server 啟動(dòng)命令后加入?--slaveof <masterip> <masterport>
-
客戶(hù)端命令:Redis 服務(wù)器啟動(dòng)后,直接通過(guò)客戶(hù)端執(zhí)行命令:slaveof <masterip> <masterport>,讓該 Redis 實(shí)例成為從節(jié)點(diǎn)。
需要注意的是:主從復(fù)制的開(kāi)啟,完全是在從節(jié)點(diǎn)發(fā)起的,不需要我們?cè)谥鞴?jié)點(diǎn)做任何事情。
第一步:本地啟動(dòng)兩個(gè)節(jié)點(diǎn)
在正確安裝好 Redis 之后,我們可以使用?redis-server --port <port>?的方式指定創(chuàng)建兩個(gè)不同端口的 Redis 實(shí)例,例如,下方我分別創(chuàng)建了一個(gè)?6379?和?6380?的兩個(gè) Redis 實(shí)例:
# 創(chuàng)建一個(gè)端口為 6379 的 Redis 實(shí)例 redis-server --port 6379 # 創(chuàng)建一個(gè)端口為 6380 的 Redis 實(shí)例 redis-server --port 6380此時(shí)兩個(gè) Redis 節(jié)點(diǎn)啟動(dòng)后,都默認(rèn)為?主節(jié)點(diǎn)。
第二步:建立復(fù)制
我們?cè)?6380?端口的節(jié)點(diǎn)中執(zhí)行?slaveof?命令,使之變?yōu)閺墓?jié)點(diǎn):
# 在 6380 端口的 Redis 實(shí)例中使用控制臺(tái) redis-cli -p 6380 # 成為本地 6379 端口實(shí)例的從節(jié)點(diǎn) 127.0.0.1:6380> SLAVEOF 127.0.0.1? 6379 OK第三步:觀察效果
下面我們來(lái)驗(yàn)證一下,主節(jié)點(diǎn)的數(shù)據(jù)是否會(huì)復(fù)制到從節(jié)點(diǎn)之中:
-
先在?從節(jié)點(diǎn)?中查詢(xún)一個(gè)?不存在?的 key:
-
再在?主節(jié)點(diǎn)?中添加這個(gè) key:
-
此時(shí)再?gòu)?從節(jié)點(diǎn)?中查詢(xún),會(huì)發(fā)現(xiàn)已經(jīng)從?主節(jié)點(diǎn)?同步到?從節(jié)點(diǎn):
第四步:斷開(kāi)復(fù)制
通過(guò)?slaveof <masterip> <masterport>?命令建立主從復(fù)制關(guān)系以后,可以通過(guò)?slaveof no one?斷開(kāi)。需要注意的是,從節(jié)點(diǎn)斷開(kāi)復(fù)制后,不會(huì)刪除已有的數(shù)據(jù),只是不再接受主節(jié)點(diǎn)新的數(shù)據(jù)變化。
從節(jié)點(diǎn)執(zhí)行?slaveof no one?之后,從節(jié)點(diǎn)和主節(jié)點(diǎn)分別打印日志如下:、
# 從節(jié)點(diǎn)打印日志 61496:M 17 Mar 2020 08:10:22.749 # Connection with master lost. 61496:M 17 Mar 2020 08:10:22.749 * Caching the disconnected master state. 61496:M 17 Mar 2020 08:10:22.749 * Discarding previously cached master state. 61496:M 17 Mar 2020 08:10:22.749 * MASTER MODE enabled (user request from 'id=4 addr=127.0.0.1:55096 fd=8 name= age=1664 idle=0 flags=N db=0 sub=0 psub=0 multi=-1 qbuf=34 qbuf-free=32734 obl=0 oll=0 omem=0 events=r cmd=slaveof')# 主節(jié)點(diǎn)打印日志 61467:M 17 Mar 2020 08:10:22.749 # Connection with replica 127.0.0.1:6380 lost.■實(shí)現(xiàn)原理簡(jiǎn)析
為了節(jié)省篇幅,我把主要的步驟都?濃縮?在了上圖中,其實(shí)也可以?簡(jiǎn)化成三個(gè)階段:準(zhǔn)備階段-數(shù)據(jù)同步階段-命令傳播階段。下面我們來(lái)進(jìn)行一些必要的說(shuō)明。
身份驗(yàn)證 | 主從復(fù)制安全問(wèn)題
在上面的?快速體驗(yàn)?過(guò)程中,你會(huì)發(fā)現(xiàn)?slaveof?這個(gè)命令居然不需要驗(yàn)證?這意味著只要知道了 ip 和端口就可以隨意拷貝服務(wù)器上的數(shù)據(jù)了?
那當(dāng)然不能夠了,我們可以通過(guò)在?主節(jié)點(diǎn)?配置?requirepass?來(lái)設(shè)置密碼,這樣就必須在?從節(jié)點(diǎn)?中對(duì)應(yīng)配置好?masterauth?參數(shù)?(與主節(jié)點(diǎn)?requirepass?保持一致)?才能夠進(jìn)行正常復(fù)制了。
SYNC 命令是一個(gè)非常耗費(fèi)資源的操作
每次執(zhí)行?SYNC?命令,主從服務(wù)器需要執(zhí)行如下動(dòng)作:
主服務(wù)器?需要執(zhí)行?BGSAVE?命令來(lái)生成 RDB 文件,這個(gè)生成操作會(huì)?消耗?主服務(wù)器大量的CPU、內(nèi)存和磁盤(pán) I/O 的資源;
主服務(wù)器?需要將自己生成的 RDB 文件 發(fā)送給從服務(wù)器,這個(gè)發(fā)送操作會(huì)?消耗?主服務(wù)器大量的網(wǎng)絡(luò)資源?(帶寬和流量),并對(duì)主服務(wù)器響應(yīng)命令請(qǐng)求的時(shí)間產(chǎn)生影響;
接收到 RDB 文件的?從服務(wù)器?需要載入主服務(wù)器發(fā)來(lái)的 RBD 文件,并且在載入期間,從服務(wù)器?會(huì)因?yàn)樽枞鴽](méi)辦法處理命令請(qǐng)求;
特別是當(dāng)出現(xiàn)?斷線(xiàn)重復(fù)制?的情況是時(shí),為了讓從服務(wù)器補(bǔ)足斷線(xiàn)時(shí)確實(shí)的那一小部分?jǐn)?shù)據(jù),卻要執(zhí)行一次如此耗資源的?SYNC?命令,顯然是不合理的。
PSYNC 命令的引入
所以在?Redis 2.8?中引入了?PSYNC?命令來(lái)代替?SYNC,它具有兩種模式:
全量復(fù)制:?用于初次復(fù)制或其他無(wú)法進(jìn)行部分復(fù)制的情況,將主節(jié)點(diǎn)中的所有數(shù)據(jù)都發(fā)送給從節(jié)點(diǎn),是一個(gè)非常重型的操作;
部分復(fù)制:?用于網(wǎng)絡(luò)中斷等情況后的復(fù)制,只將?中斷期間主節(jié)點(diǎn)執(zhí)行的寫(xiě)命令?發(fā)送給從節(jié)點(diǎn),與全量復(fù)制相比更加高效。需要注意?的是,如果網(wǎng)絡(luò)中斷時(shí)間過(guò)長(zhǎng),導(dǎo)致主節(jié)點(diǎn)沒(méi)有能夠完整地保存中斷期間執(zhí)行的寫(xiě)命令,則無(wú)法進(jìn)行部分復(fù)制,仍使用全量復(fù)制;
部分復(fù)制的原理主要是靠主從節(jié)點(diǎn)分別維護(hù)一個(gè)?復(fù)制偏移量,有了這個(gè)偏移量之后斷線(xiàn)重連之后一比較,之后就可以?xún)H僅把從服務(wù)器斷線(xiàn)之后確實(shí)的這部分?jǐn)?shù)據(jù)給補(bǔ)回來(lái)了。
三、Redis Sentinel 哨兵
上圖?展示了一個(gè)典型的哨兵架構(gòu)圖,它由兩部分組成,哨兵節(jié)點(diǎn)和數(shù)據(jù)節(jié)點(diǎn):
-
哨兵節(jié)點(diǎn):?哨兵系統(tǒng)由一個(gè)或多個(gè)哨兵節(jié)點(diǎn)組成,哨兵節(jié)點(diǎn)是特殊的 Redis 節(jié)點(diǎn),不存儲(chǔ)數(shù)據(jù);
-
數(shù)據(jù)節(jié)點(diǎn):?主節(jié)點(diǎn)和從節(jié)點(diǎn)都是數(shù)據(jù)節(jié)點(diǎn);
在復(fù)制的基礎(chǔ)上,哨兵實(shí)現(xiàn)了?自動(dòng)化的故障恢復(fù)?功能,下方是官方對(duì)于哨兵功能的描述:
-
監(jiān)控(Monitoring):?哨兵會(huì)不斷地檢查主節(jié)點(diǎn)和從節(jié)點(diǎn)是否運(yùn)作正常。
-
自動(dòng)故障轉(zhuǎn)移(Automatic failover):?當(dāng)?主節(jié)點(diǎn)?不能正常工作時(shí),哨兵會(huì)開(kāi)始?自動(dòng)故障轉(zhuǎn)移操作,它會(huì)將失效主節(jié)點(diǎn)的其中一個(gè)?從節(jié)點(diǎn)升級(jí)為新的主節(jié)點(diǎn),并讓其他從節(jié)點(diǎn)改為復(fù)制新的主節(jié)點(diǎn)。
-
配置提供者(Configuration provider):?客戶(hù)端在初始化時(shí),通過(guò)連接哨兵來(lái)獲得當(dāng)前 Redis 服務(wù)的主節(jié)點(diǎn)地址。
-
通知(Notification):?哨兵可以將故障轉(zhuǎn)移的結(jié)果發(fā)送給客戶(hù)端。
其中,監(jiān)控和自動(dòng)故障轉(zhuǎn)移功能,使得哨兵可以及時(shí)發(fā)現(xiàn)主節(jié)點(diǎn)故障并完成轉(zhuǎn)移。而配置提供者和通知功能,則需要在與客戶(hù)端的交互中才能體現(xiàn)。
■快速體驗(yàn)
第一步:創(chuàng)建主從節(jié)點(diǎn)配置文件并啟動(dòng)
正確安裝好 Redis 之后,我們?nèi)サ?Redis 的安裝目錄?(mac 默認(rèn)在?/usr/local/),找到?redis.conf?文件復(fù)制三份分別命名為?redis-master.conf/redis-slave1.conf/redis-slave2.conf,分別作為?1?個(gè)主節(jié)點(diǎn)和?2?個(gè)從節(jié)點(diǎn)的配置文件?(下圖演示了我本機(jī)的redis.conf?文件的位置)
打開(kāi)可以看到這個(gè)?.conf?后綴的文件里面有很多說(shuō)明的內(nèi)容,全部刪除然后分別改成下面的樣子:
#redis-master.conf port 6379 daemonize yes logfile "6379.log" dbfilename "dump-6379.rdb"#redis-slave1.conf port 6380 daemonize yes logfile "6380.log" dbfilename "dump-6380.rdb" slaveof 127.0.0.1 6379#redis-slave2.conf port 6381 daemonize yes logfile "6381.log" dbfilename "dump-6381.rdb" slaveof 127.0.0.1 6379然后我們可以執(zhí)行?redis-server <config file path>?來(lái)根據(jù)配置文件啟動(dòng)不同的 Redis 實(shí)例,依次啟動(dòng)主從節(jié)點(diǎn):
redis-server /usr/local/redis-5.0.3/redis-master.conf redis-server /usr/local/redis-5.0.3/redis-slave1.conf redis-server /usr/local/redis-5.0.3/redis-slave2.conf節(jié)點(diǎn)啟動(dòng)后,我們執(zhí)行?redis-cli?默認(rèn)連接到我們端口為?6379?的主節(jié)點(diǎn)執(zhí)行?info Replication?檢查一下主從狀態(tài)是否正常:(可以看到下方正確地顯示了兩個(gè)從節(jié)點(diǎn))
第二步:創(chuàng)建哨兵節(jié)點(diǎn)配置文件并啟動(dòng)
按照上面同樣的方法,我們給哨兵節(jié)點(diǎn)也創(chuàng)建三個(gè)配置文件。(哨兵節(jié)點(diǎn)本質(zhì)上是特殊的 Redis 節(jié)點(diǎn),所以配置幾乎沒(méi)什么差別,只是在端口上做區(qū)分就好)
# redis-sentinel-1.conf port 26379 daemonize yes logfile "26379.log" sentinel monitor mymaster 127.0.0.1 6379 2# redis-sentinel-2.conf port 26380 daemonize yes logfile "26380.log" sentinel monitor mymaster 127.0.0.1 6379 2# redis-sentinel-3.conf port 26381 daemonize yes logfile "26381.log" sentinel monitor mymaster 127.0.0.1 6379 2其中,sentinel monitor mymaster 127.0.0.1 6379 2?配置的含義是:該哨兵節(jié)點(diǎn)監(jiān)控?127.0.0.1:6379?這個(gè)主節(jié)點(diǎn),該主節(jié)點(diǎn)的名稱(chēng)是?mymaster,最后的?2?的含義與主節(jié)點(diǎn)的故障判定有關(guān):至少需要?2?個(gè)哨兵節(jié)點(diǎn)同意,才能判定主節(jié)點(diǎn)故障并進(jìn)行故障轉(zhuǎn)移。
執(zhí)行下方命令將哨兵節(jié)點(diǎn)啟動(dòng)起來(lái):
redis-server /usr/local/redis-5.0.3/redis-sentinel-1.conf --sentinel redis-server /usr/local/redis-5.0.3/redis-sentinel-2.conf --sentinel redis-server /usr/local/redis-5.0.3/redis-sentinel-3.conf --sentinel使用?redis-cil?工具連接哨兵節(jié)點(diǎn),并執(zhí)行?info Sentinel?命令來(lái)查看是否已經(jīng)在監(jiān)視主節(jié)點(diǎn)了:
# 連接端口為 26379 的 Redis 節(jié)點(diǎn) ? ~ redis-cli -p 26379 127.0.0.1:26379> info Sentinel # Sentinel sentinel_masters:1 sentinel_tilt:0 sentinel_running_scripts:0 sentinel_scripts_queue_length:0 sentinel_simulate_failure_flags:0 master0:name=mymaster,status=ok,address=127.0.0.1:6379,slaves=2,sentinels=3此時(shí)你打開(kāi)剛才寫(xiě)好的哨兵配置文件,你還會(huì)發(fā)現(xiàn)出現(xiàn)了一些變化:
第三步:演示故障轉(zhuǎn)移
首先,我們使用?kill -9?命令來(lái)殺掉主節(jié)點(diǎn),同時(shí)?在哨兵節(jié)點(diǎn)中執(zhí)行?info Sentinel?命令來(lái)觀察故障節(jié)點(diǎn)的過(guò)程:
? ~ ps aux | grep 6379 longtao 74529 0.3 0.0 4346936 2132 ?? Ss 10:30上午 0:03.09 redis-server *:26379 [sentinel] longtao 73541 0.2 0.0 4348072 2292 ?? Ss 10:18上午 0:04.79 redis-server *:6379 longtao 75521 0.0 0.0 4286728 728 s008 S+ 10:39上午 0:00.00 grep --color=auto --exclude-dir=.bzr --exclude-dir=CVS --exclude-dir=.git --exclude-dir=.hg --exclude-dir=.svn 6379 longtao 74836 0.0 0.0 4289844 944 s006 S+ 10:32上午 0:00.01 redis-cli -p 26379 ? ~ kill -9 73541如果?剛殺掉瞬間?在哨兵節(jié)點(diǎn)中執(zhí)行?info?命令來(lái)查看,會(huì)發(fā)現(xiàn)主節(jié)點(diǎn)還沒(méi)有切換過(guò)來(lái),因?yàn)樯诒l(fā)現(xiàn)主節(jié)點(diǎn)故障并轉(zhuǎn)移需要一段時(shí)間:
# 第一時(shí)間查看哨兵節(jié)點(diǎn)發(fā)現(xiàn)并未轉(zhuǎn)移,還在 6379 端口 127.0.0.1:26379> info Sentinel # Sentinel sentinel_masters:1 sentinel_tilt:0 sentinel_running_scripts:0 sentinel_scripts_queue_length:0 sentinel_simulate_failure_flags:0 master0:name=mymaster,status=ok,address=127.0.0.1:6379,slaves=2,sentinels=3一段時(shí)間之后你再執(zhí)行?info?命令,查看,你就會(huì)發(fā)現(xiàn)主節(jié)點(diǎn)已經(jīng)切換成了?6381?端口的從節(jié)點(diǎn):
# 過(guò)一段時(shí)間之后在執(zhí)行,發(fā)現(xiàn)已經(jīng)切換了 6381 端口 127.0.0.1:26379> info Sentinel # Sentinel sentinel_masters:1 sentinel_tilt:0 sentinel_running_scripts:0 sentinel_scripts_queue_length:0 sentinel_simulate_failure_flags:0 master0:name=mymaster,status=ok,address=127.0.0.1:6381,slaves=2,sentinels=3但同時(shí)還可以發(fā)現(xiàn),哨兵節(jié)點(diǎn)認(rèn)為新的主節(jié)點(diǎn)仍然有兩個(gè)從節(jié)點(diǎn)?(上方 slaves=2),這是因?yàn)樯诒趯?6381?切換成主節(jié)點(diǎn)的同時(shí),將?6379?節(jié)點(diǎn)置為其從節(jié)點(diǎn)。雖然?6379?從節(jié)點(diǎn)已經(jīng)掛掉,但是由于?哨兵并不會(huì)對(duì)從節(jié)點(diǎn)進(jìn)行客觀下線(xiàn),因此認(rèn)為該從節(jié)點(diǎn)一直存在。當(dāng)?6379節(jié)點(diǎn)重新啟動(dòng)后,會(huì)自動(dòng)變成?6381?節(jié)點(diǎn)的從節(jié)點(diǎn)。
另外,在故障轉(zhuǎn)移的階段,哨兵和主從節(jié)點(diǎn)的配置文件都會(huì)被改寫(xiě):
-
對(duì)于主從節(jié)點(diǎn):?主要是?slaveof?配置的變化,新的主節(jié)點(diǎn)沒(méi)有了?slaveof?配置,其從節(jié)點(diǎn)則?slaveof?新的主節(jié)點(diǎn)。
-
對(duì)于哨兵節(jié)點(diǎn):?除了主從節(jié)點(diǎn)信息的變化,紀(jì)元(epoch)?(記錄當(dāng)前集群狀態(tài)的參數(shù))?也會(huì)變化,紀(jì)元相關(guān)的參數(shù)都 +1 了。
■客戶(hù)端訪(fǎng)問(wèn)哨兵系統(tǒng)代碼演示
上面我們?cè)?快速體驗(yàn)?中主要感受到了服務(wù)端自己對(duì)于當(dāng)前主從節(jié)點(diǎn)的自動(dòng)化治理,下面我們以 Java 代碼為例,來(lái)演示一下客戶(hù)端如何訪(fǎng)問(wèn)我們的哨兵系統(tǒng):
public static void testSentinel() throws Exception {String masterName = "mymaster";Set<String> sentinels = new HashSet<>();sentinels.add("127.0.0.1:26379");sentinels.add("127.0.0.1:26380");sentinels.add("127.0.0.1:26381");// 初始化過(guò)程做了很多工作JedisSentinelPool pool = new JedisSentinelPool(masterName, sentinels);Jedis jedis = pool.getResource();jedis.set("key1", "value1");pool.close(); }客戶(hù)端原理
Jedis 客戶(hù)端對(duì)哨兵提供了很好的支持。如上述代碼所示,我們只需要向 Jedis 提供哨兵節(jié)點(diǎn)集合和?masterName?,構(gòu)造?JedisSentinelPool?對(duì)象,然后便可以像使用普通 Redis 連接池一樣來(lái)使用了:通過(guò)?pool.getResource()?獲取連接,執(zhí)行具體的命令。
在整個(gè)過(guò)程中,我們的代碼不需要顯式的指定主節(jié)點(diǎn)的地址,就可以連接到主節(jié)點(diǎn);代碼中對(duì)故障轉(zhuǎn)移沒(méi)有任何體現(xiàn),就可以在哨兵完成故障轉(zhuǎn)移后自動(dòng)的切換主節(jié)點(diǎn)。之所以可以做到這一點(diǎn),是因?yàn)樵?JedisSentinelPool?的構(gòu)造器中,進(jìn)行了相關(guān)的工作;主要包括以下兩點(diǎn):
遍歷哨兵節(jié)點(diǎn),獲取主節(jié)點(diǎn)信息:?遍歷哨兵節(jié)點(diǎn),通過(guò)其中一個(gè)哨兵節(jié)點(diǎn) +?masterName獲得主節(jié)點(diǎn)的信息;該功能是通過(guò)調(diào)用哨兵節(jié)點(diǎn)的?sentinel get-master-addr-by-name命令實(shí)現(xiàn);
增加對(duì)哨兵的監(jiān)聽(tīng):?這樣當(dāng)發(fā)生故障轉(zhuǎn)移時(shí),客戶(hù)端便可以收到哨兵的通知,從而完成主節(jié)點(diǎn)的切換。具體做法是:利用 Redis 提供的?發(fā)布訂閱?功能,為每一個(gè)哨兵節(jié)點(diǎn)開(kāi)啟一個(gè)單獨(dú)的線(xiàn)程,訂閱哨兵節(jié)點(diǎn)的 + switch-master 頻道,當(dāng)收到消息時(shí),重新初始化連接池。
■新的主服務(wù)器是怎樣被挑選出來(lái)的?
故障轉(zhuǎn)移操作的第一步?要做的就是在已下線(xiàn)主服務(wù)器屬下的所有從服務(wù)器中,挑選出一個(gè)狀態(tài)良好、數(shù)據(jù)完整的從服務(wù)器,然后向這個(gè)從服務(wù)器發(fā)送?slaveof no one?命令,將這個(gè)從服務(wù)器轉(zhuǎn)換為主服務(wù)器。但是這個(gè)從服務(wù)器是怎么樣被挑選出來(lái)的呢?
簡(jiǎn)單來(lái)說(shuō) Sentinel 使用以下規(guī)則來(lái)選擇新的主服務(wù)器:
在失效主服務(wù)器屬下的從服務(wù)器當(dāng)中, 那些被標(biāo)記為主觀下線(xiàn)、已斷線(xiàn)、或者最后一次回復(fù) PING 命令的時(shí)間大于五秒鐘的從服務(wù)器都會(huì)被?淘汰。
在失效主服務(wù)器屬下的從服務(wù)器當(dāng)中, 那些與失效主服務(wù)器連接斷開(kāi)的時(shí)長(zhǎng)超過(guò) down-after 選項(xiàng)指定的時(shí)長(zhǎng)十倍的從服務(wù)器都會(huì)被?淘汰。
在?經(jīng)歷了以上兩輪淘汰之后?剩下來(lái)的從服務(wù)器中, 我們選出?復(fù)制偏移量(replication offset)最大?的那個(gè)?從服務(wù)器?作為新的主服務(wù)器;如果復(fù)制偏移量不可用,或者從服務(wù)器的復(fù)制偏移量相同,那么?帶有最小運(yùn)行 ID?的那個(gè)從服務(wù)器成為新的主服務(wù)器。
四、Redis 集群
上圖?展示了?Redis Cluster?典型的架構(gòu)圖,集群中的每一個(gè) Redis 節(jié)點(diǎn)都?互相兩兩相連,客戶(hù)端任意?直連?到集群中的?任意一臺(tái),就可以對(duì)其他 Redis 節(jié)點(diǎn)進(jìn)行?讀寫(xiě)?的操作。
基本原理
Redis 集群中內(nèi)置了?16384?個(gè)哈希槽。當(dāng)客戶(hù)端連接到 Redis 集群之后,會(huì)同時(shí)得到一份關(guān)于這個(gè)?集群的配置信息,當(dāng)客戶(hù)端具體對(duì)某一個(gè)?key?值進(jìn)行操作時(shí),會(huì)計(jì)算出它的一個(gè) Hash 值,然后把結(jié)果對(duì)?16384??求余數(shù),這樣每個(gè)?key?都會(huì)對(duì)應(yīng)一個(gè)編號(hào)在?0-16383?之間的哈希槽,Redis 會(huì)根據(jù)節(jié)點(diǎn)數(shù)量?大致均等?的將哈希槽映射到不同的節(jié)點(diǎn)。
再結(jié)合集群的配置信息就能夠知道這個(gè)?key?值應(yīng)該存儲(chǔ)在哪一個(gè)具體的 Redis 節(jié)點(diǎn)中,如果不屬于自己管,那么就會(huì)使用一個(gè)特殊的?MOVED?命令來(lái)進(jìn)行一個(gè)跳轉(zhuǎn),告訴客戶(hù)端去連接這個(gè)節(jié)點(diǎn)以獲取數(shù)據(jù):
GET x -MOVED 3999 127.0.0.1:6381MOVED?指令第一個(gè)參數(shù)?3999?是?key?對(duì)應(yīng)的槽位編號(hào),后面是目標(biāo)節(jié)點(diǎn)地址,MOVED?命令前面有一個(gè)減號(hào),表示這是一個(gè)錯(cuò)誤的消息。客戶(hù)端在收到?MOVED?指令后,就立即糾正本地的?槽位映射表,那么下一次再訪(fǎng)問(wèn)?key?時(shí)就能夠到正確的地方去獲取了。
集群的主要作用
數(shù)據(jù)分區(qū):?數(shù)據(jù)分區(qū)?(或稱(chēng)數(shù)據(jù)分片)?是集群最核心的功能。集群將數(shù)據(jù)分散到多個(gè)節(jié)點(diǎn),一方面?突破了 Redis 單機(jī)內(nèi)存大小的限制,存儲(chǔ)容量大大增加;另一方面?每個(gè)主節(jié)點(diǎn)都可以對(duì)外提供讀服務(wù)和寫(xiě)服務(wù),大大提高了集群的響應(yīng)能力。Redis 單機(jī)內(nèi)存大小受限問(wèn)題,在介紹持久化和主從復(fù)制時(shí)都有提及,例如,如果單機(jī)內(nèi)存太大,bgsave?和?bgrewriteaof?的?fork?操作可能導(dǎo)致主進(jìn)程阻塞,主從環(huán)境下主機(jī)切換時(shí)可能導(dǎo)致從節(jié)點(diǎn)長(zhǎng)時(shí)間無(wú)法提供服務(wù),全量復(fù)制階段主節(jié)點(diǎn)的復(fù)制緩沖區(qū)可能溢出……
高可用:?集群支持主從復(fù)制和主節(jié)點(diǎn)的?自動(dòng)故障轉(zhuǎn)移?(與哨兵類(lèi)似),當(dāng)任一節(jié)點(diǎn)發(fā)生故障時(shí),集群仍然可以對(duì)外提供服務(wù)。
■快速體驗(yàn)
第一步:創(chuàng)建集群節(jié)點(diǎn)配置文件
首先我們找一個(gè)地方創(chuàng)建一個(gè)名為?redis-cluster?的目錄:
mkdir -p ~/Desktop/redis-cluster然后按照上面的方法,創(chuàng)建六個(gè)配置文件,分別命名為:redis_7000.conf/redis_7001.conf.....redis_7005.conf,然后根據(jù)不同的端口號(hào)修改對(duì)應(yīng)的端口值就好了:
# 后臺(tái)執(zhí)行 daemonize yes # 端口號(hào) port 7000 # 為每一個(gè)集群節(jié)點(diǎn)指定一個(gè) pid_file pidfile ~/Desktop/redis-cluster/redis_7000.pid # 啟動(dòng)集群模式 cluster-enabled yes # 每一個(gè)集群節(jié)點(diǎn)都有一個(gè)配置文件,這個(gè)文件是不能手動(dòng)編輯的。確保每一個(gè)集群節(jié)點(diǎn)的配置文件不通 cluster-config-file nodes-7000.conf # 集群節(jié)點(diǎn)的超時(shí)時(shí)間,單位:ms,超時(shí)后集群會(huì)認(rèn)為該節(jié)點(diǎn)失敗 cluster-node-timeout 5000 # 最后將 appendonly 改成 yes(AOF 持久化) appendonly yes記得把對(duì)應(yīng)上述配置文件中根端口對(duì)應(yīng)的配置都修改掉?(port/ pidfile/ cluster-config-file)。
第二步:分別啟動(dòng) 6 個(gè) Redis 實(shí)例
redis-server ~/Desktop/redis-cluster/redis_7000.conf redis-server ~/Desktop/redis-cluster/redis_7001.conf redis-server ~/Desktop/redis-cluster/redis_7002.conf redis-server ~/Desktop/redis-cluster/redis_7003.conf redis-server ~/Desktop/redis-cluster/redis_7004.conf redis-server ~/Desktop/redis-cluster/redis_7005.conf然后執(zhí)行?ps -ef | grep redis?查看是否啟動(dòng)成功:
可以看到?6?個(gè) Redis 節(jié)點(diǎn)都以集群的方式成功啟動(dòng)了,但是現(xiàn)在每個(gè)節(jié)點(diǎn)還處于獨(dú)立的狀態(tài),也就是說(shuō)它們每一個(gè)都各自成了一個(gè)集群,還沒(méi)有互相聯(lián)系起來(lái),我們需要手動(dòng)地把他們之間建立起聯(lián)系。
第三步:建立集群
執(zhí)行下列命令:
redis-cli --cluster create --cluster-replicas 1 127.0.0.1:7000 127.0.0.1:7001 127.0.0.1:7002 127.0.0.1:7003 127.0.0.1:7004 127.0.0.1:7005-
這里稍微解釋一下這個(gè)?--replicas 1?的意思是:我們希望為集群中的每個(gè)主節(jié)點(diǎn)創(chuàng)建一個(gè)從節(jié)點(diǎn)。
觀察控制臺(tái)輸出:
看到?[OK]?的信息之后,就表示集群已經(jīng)搭建成功了,可以看到,這里我們正確地創(chuàng)建了三主三從的集群。
第四步:驗(yàn)證集群
我們先使用?redic-cli?任意連接一個(gè)節(jié)點(diǎn):
redis-cli -c -h 127.0.0.1 -p 7000 127.0.0.1:7000>-
-c表示集群模式;-h?指定 ip 地址;-p?指定端口。
然后隨便?set?一些值觀察控制臺(tái)輸入:
127.0.0.1:7000> SET name wmyskxz -> Redirected to slot [5798] located at 127.0.0.1:7001 OK 127.0.0.1:7001>可以看到這里 Redis 自動(dòng)幫我們進(jìn)行了?Redirected?操作跳轉(zhuǎn)到了?7001?這個(gè)實(shí)例上。
我們?cè)偈褂?cluster info?(查看集群信息)?和?cluster nodes?(查看節(jié)點(diǎn)列表)?來(lái)分別看看:(任意節(jié)點(diǎn)輸入均可)
127.0.0.1:7001> CLUSTER INFO cluster_state:ok cluster_slots_assigned:16384 cluster_slots_ok:16384 cluster_slots_pfail:0 cluster_slots_fail:0 cluster_known_nodes:6 cluster_size:3 cluster_current_epoch:6 cluster_my_epoch:2 cluster_stats_messages_ping_sent:1365 cluster_stats_messages_pong_sent:1358 cluster_stats_messages_meet_sent:4 cluster_stats_messages_sent:2727 cluster_stats_messages_ping_received:1357 cluster_stats_messages_pong_received:1369 cluster_stats_messages_meet_received:1 cluster_stats_messages_received:2727127.0.0.1:7001> CLUSTER NODES 56a04742f36c6e84968cae871cd438935081e86f 127.0.0.1:7003@17003 slave 4ec8c022e9d546c9b51deb9d85f6cf867bf73db6 0 1584428884000 4 connected 4ec8c022e9d546c9b51deb9d85f6cf867bf73db6 127.0.0.1:7000@17000 master - 0 1584428884000 1 connected 0-5460 e2539c4398b8258d3f9ffa714bd778da107cb2cd 127.0.0.1:7005@17005 slave a3406db9ae7144d17eb7df5bffe8b70bb5dd06b8 0 1584428885222 6 connected d31cd1f423ab1e1849cac01ae927e4b6950f55d9 127.0.0.1:7004@17004 slave 236cefaa9cdc295bc60a5bd1aed6a7152d4f384d 0 1584428884209 5 connected 236cefaa9cdc295bc60a5bd1aed6a7152d4f384d 127.0.0.1:7001@17001 myself,master - 0 1584428882000 2 connected 5461-10922 a3406db9ae7144d17eb7df5bffe8b70bb5dd06b8 127.0.0.1:7002@17002 master - 0 1584428884000 3 connected 10923-16383 127.0.0.1:7001>■數(shù)據(jù)分區(qū)方案簡(jiǎn)析
方案一:哈希值 % 節(jié)點(diǎn)數(shù)
哈希取余分區(qū)思路非常簡(jiǎn)單:計(jì)算?key?的 hash 值,然后對(duì)節(jié)點(diǎn)數(shù)量進(jìn)行取余,從而決定數(shù)據(jù)映射到哪個(gè)節(jié)點(diǎn)上。
不過(guò)該方案最大的問(wèn)題是,當(dāng)新增或刪減節(jié)點(diǎn)時(shí),節(jié)點(diǎn)數(shù)量發(fā)生變化,系統(tǒng)中所有的數(shù)據(jù)都需要?重新計(jì)算映射關(guān)系,引發(fā)大規(guī)模數(shù)據(jù)遷移。
方案二:一致性哈希分區(qū)
一致性哈希算法將?整個(gè)哈希值空間?組織成一個(gè)虛擬的圓環(huán),范圍是?[0 - 232 - 1],對(duì)于每一個(gè)數(shù)據(jù),根據(jù)?key?計(jì)算 hash 值,確數(shù)據(jù)在環(huán)上的位置,然后從此位置沿順時(shí)針行走,找到的第一臺(tái)服務(wù)器就是其應(yīng)該映射到的服務(wù)器:
?
與哈希取余分區(qū)相比,一致性哈希分區(qū)將?增減節(jié)點(diǎn)的影響限制在相鄰節(jié)點(diǎn)。以上圖為例,如果在?node1?和?node2?之間增加?node5,則只有?node2?中的一部分?jǐn)?shù)據(jù)會(huì)遷移到node5;如果去掉?node2,則原?node2?中的數(shù)據(jù)只會(huì)遷移到?node4?中,只有?node4?會(huì)受影響。
一致性哈希分區(qū)的主要問(wèn)題在于,當(dāng)?節(jié)點(diǎn)數(shù)量較少?時(shí),增加或刪減節(jié)點(diǎn),對(duì)單個(gè)節(jié)點(diǎn)的影響可能很大,造成數(shù)據(jù)的嚴(yán)重不平衡。還是以上圖為例,如果去掉?node2,node4?中的數(shù)據(jù)由總數(shù)據(jù)的?1/4?左右變?yōu)?1/2?左右,與其他節(jié)點(diǎn)相比負(fù)載過(guò)高。
方案三:帶有虛擬節(jié)點(diǎn)的一致性哈希分區(qū)
該方案在?一致性哈希分區(qū)的基礎(chǔ)上,引入了?虛擬節(jié)點(diǎn)?的概念。Redis 集群使用的便是該方案,其中的虛擬節(jié)點(diǎn)稱(chēng)為?槽(slot)。槽是介于數(shù)據(jù)和實(shí)際節(jié)點(diǎn)之間的虛擬概念,每個(gè)實(shí)際節(jié)點(diǎn)包含一定數(shù)量的槽,每個(gè)槽包含哈希值在一定范圍內(nèi)的數(shù)據(jù)。
在使用了槽的一致性哈希分區(qū)中,槽是數(shù)據(jù)管理和遷移的基本單位。槽?解耦?了?數(shù)據(jù)和實(shí)際節(jié)點(diǎn)?之間的關(guān)系,增加或刪除節(jié)點(diǎn)對(duì)系統(tǒng)的影響很小。仍以上圖為例,系統(tǒng)中有?4?個(gè)實(shí)際節(jié)點(diǎn),假設(shè)為其分配?16?個(gè)槽(0-15);
-
槽 0-3 位于 node1;4-7 位于 node2;以此類(lèi)推....
如果此時(shí)刪除?node2,只需要將槽 4-7 重新分配即可,例如槽 4-5 分配給?node1,槽 6 分配給?node3,槽 7 分配給?node4;可以看出刪除?node2?后,數(shù)據(jù)在其他節(jié)點(diǎn)的分布仍然較為均衡。
■節(jié)點(diǎn)通信機(jī)制簡(jiǎn)析
集群的建立離不開(kāi)節(jié)點(diǎn)之間的通信,例如我們上訪(fǎng)在?快速體驗(yàn)?中剛啟動(dòng)六個(gè)集群節(jié)點(diǎn)之后通過(guò)?redis-cli?命令幫助我們搭建起來(lái)了集群,實(shí)際上背后每個(gè)集群之間的兩兩連接是通過(guò)了?CLUSTER MEET <ip> <port>?命令發(fā)送?MEET?消息完成的,下面我們展開(kāi)詳細(xì)說(shuō)說(shuō)。
兩個(gè)端口
在?哨兵系統(tǒng)?中,節(jié)點(diǎn)分為?數(shù)據(jù)節(jié)點(diǎn)?和?哨兵節(jié)點(diǎn):前者存儲(chǔ)數(shù)據(jù),后者實(shí)現(xiàn)額外的控制功能。在?集群?中,沒(méi)有數(shù)據(jù)節(jié)點(diǎn)與非數(shù)據(jù)節(jié)點(diǎn)之分:所有的節(jié)點(diǎn)都存儲(chǔ)數(shù)據(jù),也都參與集群狀態(tài)的維護(hù)。為此,集群中的每個(gè)節(jié)點(diǎn),都提供了兩個(gè) TCP 端口:
-
普通端口:?即我們?cè)谇懊嬷付ǖ亩丝?(7000等)。普通端口主要用于為客戶(hù)端提供服務(wù)(與單機(jī)節(jié)點(diǎn)類(lèi)似);但在節(jié)點(diǎn)間數(shù)據(jù)遷移時(shí)也會(huì)使用。
-
集群端口:?端口號(hào)是普通端口 + 10000?(10000是固定值,無(wú)法改變),如?7000?節(jié)點(diǎn)的集群端口為?17000。集群端口只用于節(jié)點(diǎn)之間的通信,如搭建集群、增減節(jié)點(diǎn)、故障轉(zhuǎn)移等操作時(shí)節(jié)點(diǎn)間的通信;不要使用客戶(hù)端連接集群接口。為了保證集群可以正常工作,在配置防火墻時(shí),要同時(shí)開(kāi)啟普通端口和集群端口。
Gossip 協(xié)議
節(jié)點(diǎn)間通信,按照通信協(xié)議可以分為幾種類(lèi)型:單對(duì)單、廣播、Gossip 協(xié)議等。重點(diǎn)是廣播和 Gossip 的對(duì)比。
-
廣播是指向集群內(nèi)所有節(jié)點(diǎn)發(fā)送消息。優(yōu)點(diǎn)?是集群的收斂速度快(集群收斂是指集群內(nèi)所有節(jié)點(diǎn)獲得的集群信息是一致的),缺點(diǎn)?是每條消息都要發(fā)送給所有節(jié)點(diǎn),CPU、帶寬等消耗較大。
-
Gossip 協(xié)議的特點(diǎn)是:在節(jié)點(diǎn)數(shù)量有限的網(wǎng)絡(luò)中,每個(gè)節(jié)點(diǎn)都 “隨機(jī)” 的與部分節(jié)點(diǎn)通信(并不是真正的隨機(jī),而是根據(jù)特定的規(guī)則選擇通信的節(jié)點(diǎn)),經(jīng)過(guò)一番雜亂無(wú)章的通信,每個(gè)節(jié)點(diǎn)的狀態(tài)很快會(huì)達(dá)到一致。Gossip 協(xié)議的?優(yōu)點(diǎn)?有負(fù)載?(比廣播)?低、去中心化、容錯(cuò)性高?(因?yàn)橥ㄐ庞腥哂??等;缺點(diǎn)?主要是集群的收斂速度慢。
消息類(lèi)型
集群中的節(jié)點(diǎn)采用?固定頻率(每秒10次)?的?定時(shí)任務(wù)?進(jìn)行通信相關(guān)的工作:判斷是否需要發(fā)送消息及消息類(lèi)型、確定接收節(jié)點(diǎn)、發(fā)送消息等。如果集群狀態(tài)發(fā)生了變化,如增減節(jié)點(diǎn)、槽狀態(tài)變更,通過(guò)節(jié)點(diǎn)間的通信,所有節(jié)點(diǎn)會(huì)很快得知整個(gè)集群的狀態(tài),使集群收斂。
節(jié)點(diǎn)間發(fā)送的消息主要分為?5?種:meet 消息、ping 消息、pong 消息、fail 消息、publish 消息。不同的消息類(lèi)型,通信協(xié)議、發(fā)送的頻率和時(shí)機(jī)、接收節(jié)點(diǎn)的選擇等是不同的:
-
MEET 消息:?在節(jié)點(diǎn)握手階段,當(dāng)節(jié)點(diǎn)收到客戶(hù)端的?CLUSTER MEET?命令時(shí),會(huì)向新加入的節(jié)點(diǎn)發(fā)送?MEET?消息,請(qǐng)求新節(jié)點(diǎn)加入到當(dāng)前集群;新節(jié)點(diǎn)收到 MEET 消息后會(huì)回復(fù)一個(gè)?PONG?消息。
-
PING 消息:?集群里每個(gè)節(jié)點(diǎn)每秒鐘會(huì)選擇部分節(jié)點(diǎn)發(fā)送?PING?消息,接收者收到消息后會(huì)回復(fù)一個(gè)?PONG?消息。PING 消息的內(nèi)容是自身節(jié)點(diǎn)和部分其他節(jié)點(diǎn)的狀態(tài)信息,作用是彼此交換信息,以及檢測(cè)節(jié)點(diǎn)是否在線(xiàn)。PING?消息使用 Gossip 協(xié)議發(fā)送,接收節(jié)點(diǎn)的選擇兼顧了收斂速度和帶寬成本,具體規(guī)則如下:(1)隨機(jī)找 5 個(gè)節(jié)點(diǎn),在其中選擇最久沒(méi)有通信的 1 個(gè)節(jié)點(diǎn);(2)掃描節(jié)點(diǎn)列表,選擇最近一次收到?PONG?消息時(shí)間大于?cluster_node_timeout / 2?的所有節(jié)點(diǎn),防止這些節(jié)點(diǎn)長(zhǎng)時(shí)間未更新。
-
PONG消息:?PONG?消息封裝了自身狀態(tài)數(shù)據(jù)。可以分為兩種:第一種?是在接到?MEET/PING?消息后回復(fù)的?PONG?消息;第二種?是指節(jié)點(diǎn)向集群廣播?PONG?消息,這樣其他節(jié)點(diǎn)可以獲知該節(jié)點(diǎn)的最新信息,例如故障恢復(fù)后新的主節(jié)點(diǎn)會(huì)廣播?PONG?消息。
-
FAIL 消息:?當(dāng)一個(gè)主節(jié)點(diǎn)判斷另一個(gè)主節(jié)點(diǎn)進(jìn)入?FAIL?狀態(tài)時(shí),會(huì)向集群廣播這一FAIL?消息;接收節(jié)點(diǎn)會(huì)將這一?FAIL?消息保存起來(lái),便于后續(xù)的判斷。
-
PUBLISH 消息:?節(jié)點(diǎn)收到?PUBLISH?命令后,會(huì)先執(zhí)行該命令,然后向集群廣播這一消息,接收節(jié)點(diǎn)也會(huì)執(zhí)行該?PUBLISH?命令。
■數(shù)據(jù)結(jié)構(gòu)簡(jiǎn)析
節(jié)點(diǎn)需要專(zhuān)門(mén)的數(shù)據(jù)結(jié)構(gòu)來(lái)存儲(chǔ)集群的狀態(tài)。所謂集群的狀態(tài),是一個(gè)比較大的概念,包括:集群是否處于上線(xiàn)狀態(tài)、集群中有哪些節(jié)點(diǎn)、節(jié)點(diǎn)是否可達(dá)、節(jié)點(diǎn)的主從狀態(tài)、槽的分布……
節(jié)點(diǎn)為了存儲(chǔ)集群狀態(tài)而提供的數(shù)據(jù)結(jié)構(gòu)中,最關(guān)鍵的是?clusterNode?和?clusterState?結(jié)構(gòu):前者記錄了一個(gè)節(jié)點(diǎn)的狀態(tài),后者記錄了集群作為一個(gè)整體的狀態(tài)。
clusterNode 結(jié)構(gòu)
clusterNode?結(jié)構(gòu)保存了?一個(gè)節(jié)點(diǎn)的當(dāng)前狀態(tài),包括創(chuàng)建時(shí)間、節(jié)點(diǎn) id、ip 和端口號(hào)等。每個(gè)節(jié)點(diǎn)都會(huì)用一個(gè)?clusterNode?結(jié)構(gòu)記錄自己的狀態(tài),并為集群內(nèi)所有其他節(jié)點(diǎn)都創(chuàng)建一個(gè)?clusterNode?結(jié)構(gòu)來(lái)記錄節(jié)點(diǎn)狀態(tài)。
下面列舉了?clusterNode?的部分字段,并說(shuō)明了字段的含義和作用:
typedef struct clusterNode {//節(jié)點(diǎn)創(chuàng)建時(shí)間mstime_t ctime;//節(jié)點(diǎn)idchar name[REDIS_CLUSTER_NAMELEN];//節(jié)點(diǎn)的ip和端口號(hào)char ip[REDIS_IP_STR_LEN];int port;//節(jié)點(diǎn)標(biāo)識(shí):整型,每個(gè)bit都代表了不同狀態(tài),如節(jié)點(diǎn)的主從狀態(tài)、是否在線(xiàn)、是否在握手等int flags;//配置紀(jì)元:故障轉(zhuǎn)移時(shí)起作用,類(lèi)似于哨兵的配置紀(jì)元uint64_t configEpoch;//槽在該節(jié)點(diǎn)中的分布:占用16384/8個(gè)字節(jié),16384個(gè)比特;每個(gè)比特對(duì)應(yīng)一個(gè)槽:比特值為1,則該比特對(duì)應(yīng)的槽在節(jié)點(diǎn)中;比特值為0,則該比特對(duì)應(yīng)的槽不在節(jié)點(diǎn)中unsigned char slots[16384/8];//節(jié)點(diǎn)中槽的數(shù)量int numslots;………… } clusterNode;除了上述字段,clusterNode?還包含節(jié)點(diǎn)連接、主從復(fù)制、故障發(fā)現(xiàn)和轉(zhuǎn)移需要的信息等。
clusterState 結(jié)構(gòu)
clusterState?結(jié)構(gòu)保存了在當(dāng)前節(jié)點(diǎn)視角下,集群所處的狀態(tài)。主要字段包括:
typedef struct clusterState {//自身節(jié)點(diǎn)clusterNode *myself;//配置紀(jì)元uint64_t currentEpoch;//集群狀態(tài):在線(xiàn)還是下線(xiàn)int state;//集群中至少包含一個(gè)槽的節(jié)點(diǎn)數(shù)量int size;//哈希表,節(jié)點(diǎn)名稱(chēng)->clusterNode節(jié)點(diǎn)指針dict *nodes;//槽分布信息:數(shù)組的每個(gè)元素都是一個(gè)指向clusterNode結(jié)構(gòu)的指針;如果槽還沒(méi)有分配給任何節(jié)點(diǎn),則為NULLclusterNode *slots[16384];………… } clusterState;除此之外,clusterState?還包括故障轉(zhuǎn)移、槽遷移等需要的信息。
總結(jié)
以上是生活随笔為你收集整理的Redis主从与集群的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: servlet中使用db4o
- 下一篇: wow模型修改器_《魔兽世界》魔兽世界模