电商那些年,我摸爬打滚出的高并发架构实战精髓(续)
一、分層,分割,分布式
大型網(wǎng)站要很好地支撐高并發(fā),需要長(zhǎng)期的規(guī)劃設(shè)計(jì)。在初期,需要把系統(tǒng)進(jìn)行分層,在發(fā)展過(guò)程中把核心業(yè)務(wù)進(jìn)行拆分成模塊單元,根據(jù)需求進(jìn)行分布式部署,可以進(jìn)行獨(dú)立團(tuán)隊(duì)維護(hù)開(kāi)發(fā)。
分層:
-
將系統(tǒng)在橫向維度上切分成幾個(gè)部分,每個(gè)部門負(fù)責(zé)一部分相對(duì)簡(jiǎn)單并比較單一的職責(zé),然后通過(guò)上層對(duì)下層的依賴和調(diào)度組成一個(gè)完整的系統(tǒng)。
-
比如把電商系統(tǒng)分成:應(yīng)用層,服務(wù)層,數(shù)據(jù)層。(具體分多少個(gè)層次根據(jù)自己的業(yè)務(wù)場(chǎng)景)
-
應(yīng)用層:網(wǎng)站首頁(yè),用戶中心,商品中心,購(gòu)物車,紅包業(yè)務(wù),活動(dòng)中心等,負(fù)責(zé)具體業(yè)務(wù)和視圖展示。
-
服務(wù)層:訂單服務(wù)、用戶管理服務(wù)、紅包服務(wù)、商品服務(wù)等,為應(yīng)用層提供服務(wù)支持。
-
數(shù)據(jù)層:關(guān)系數(shù)據(jù)庫(kù)、NoSQL數(shù)據(jù)庫(kù)等,提供數(shù)據(jù)存儲(chǔ)查詢服務(wù)。
-
分層架構(gòu)是邏輯上的,在物理部署上可以部署在同一臺(tái)物理機(jī)器上,但是隨著網(wǎng)站業(yè)務(wù)的發(fā)展,必然需要對(duì)已經(jīng)分層的模塊分離部署,分別部署在不同的服務(wù)器上,使網(wǎng)站可以支撐更多用戶訪問(wèn)。
分割:
-
在縱向方面對(duì)業(yè)務(wù)進(jìn)行切分,將一塊相對(duì)復(fù)雜的業(yè)務(wù)分割成不同的模塊單元。
-
包裝成高內(nèi)聚低耦合的模塊不僅有助于軟件的開(kāi)發(fā)維護(hù),也便于不同模塊的分布式部署,提高網(wǎng)站的并發(fā)處理能力和功能擴(kuò)展。
-
比如用戶中心可以分割成:賬戶信息模塊、訂單模塊、充值模塊、提現(xiàn)模塊、優(yōu)惠券模塊等。
分布式:
-
分布式應(yīng)用和服務(wù),將分層或者分割后的業(yè)務(wù)分布式部署,獨(dú)立的應(yīng)用服務(wù)器、數(shù)據(jù)庫(kù)、緩存服務(wù)器。
-
當(dāng)業(yè)務(wù)達(dá)到一定用戶量時(shí),再進(jìn)行服務(wù)器均衡負(fù)載、數(shù)據(jù)庫(kù)、緩存主從集群。
-
分布式靜態(tài)資源,比如:靜態(tài)資源上傳CDN。
-
分布式計(jì)算,比如:使用Hadoop進(jìn)行大數(shù)據(jù)的分布式計(jì)算。
-
分布式數(shù)據(jù)和存儲(chǔ),比如:各分布節(jié)點(diǎn)根據(jù)哈希算法或其他算法分散存儲(chǔ)數(shù)據(jù)。
(網(wǎng)站分層-來(lái)自網(wǎng)絡(luò))
二、集群
對(duì)于用戶訪問(wèn)集中的業(yè)務(wù)獨(dú)立部署服務(wù)器、應(yīng)用服務(wù)器、數(shù)據(jù)庫(kù)、NoSQL數(shù)據(jù)庫(kù),核心業(yè)務(wù)基本上需要搭建集群,即多臺(tái)服務(wù)器部署相同的應(yīng)用構(gòu)成一個(gè)集群,通過(guò)負(fù)載均衡設(shè)備共同對(duì)外提供服務(wù), 服務(wù)器集群能夠?yàn)橄嗤姆?wù)提供更多的并發(fā)支持,因此當(dāng)有更多的用戶訪問(wèn)時(shí),只需要向集群中加入新的機(jī)器即可,另外可以實(shí)現(xiàn)當(dāng)其中的某臺(tái)服務(wù)器發(fā)生故障時(shí),可通過(guò)負(fù)載均衡的失效轉(zhuǎn)移機(jī)制將請(qǐng)求轉(zhuǎn)移至集群中其他的服務(wù)器上,因而提高系統(tǒng)的可用性。
應(yīng)用服務(wù)器集群:
-
Nginx 反向代理
-
SLB
-
… …
(關(guān)系/NoSQL)數(shù)據(jù)庫(kù)集群:
-
主從分離,從庫(kù)集群
(通過(guò)反向代理均衡負(fù)載-來(lái)自網(wǎng)絡(luò))
三、異步
在高并發(fā)業(yè)務(wù)中如果涉及到數(shù)據(jù)庫(kù)操作,主要壓力都是在數(shù)據(jù)庫(kù)服務(wù)器上面,雖然使用主從分離,但是數(shù)據(jù)庫(kù)操作都是在主庫(kù)上操作,單臺(tái)數(shù)據(jù)庫(kù)服務(wù)器連接池允許的最大連接數(shù)量是有限的?。
當(dāng)連接數(shù)量達(dá)到最大值時(shí),其它需要連接數(shù)據(jù)操作的請(qǐng)求就需要等待有空閑的連接,這樣高并發(fā)的時(shí)候很多請(qǐng)求就會(huì)出現(xiàn)connection time out的情況?。
那么,像這種高并發(fā)業(yè)務(wù)我們要如何設(shè)計(jì)開(kāi)發(fā)方案可以降低數(shù)據(jù)庫(kù)服務(wù)器的壓力呢?
如:
-
自動(dòng)彈窗簽到,雙11跨0點(diǎn)的時(shí)候并發(fā)請(qǐng)求簽到接口;
-
雙11搶紅包活動(dòng);
-
雙11訂單入庫(kù);
-
……
設(shè)計(jì)考慮:
-
逆向思維,壓力在數(shù)據(jù)庫(kù),那業(yè)務(wù)接口就不進(jìn)行數(shù)據(jù)庫(kù)操作不就沒(méi)壓力了?
-
數(shù)據(jù)持久化是否允許延遲?
-
如何讓業(yè)務(wù)接口不直接操作DB,又可以讓數(shù)據(jù)持久化?
方案設(shè)計(jì):
-
像這種涉及數(shù)據(jù)庫(kù)操作的高并發(fā)的業(yè)務(wù),就要考慮使用異步了。
-
客戶端發(fā)起接口請(qǐng)求,服務(wù)端快速響應(yīng),客戶端展示結(jié)果給用戶,數(shù)據(jù)庫(kù)操作通過(guò)異步同步。
-
如何實(shí)現(xiàn)異步同步?
-
使用消息隊(duì)列,將入庫(kù)的內(nèi)容enqueue到消息隊(duì)列中,業(yè)務(wù)接口快速響應(yīng)給用戶結(jié)果(可以溫馨提示高峰期延遲到賬)。
-
然后再寫(xiě)個(gè)獨(dú)立程序從消息隊(duì)列dequeue數(shù)據(jù)出來(lái)進(jìn)行入庫(kù)操作,入庫(kù)成功后刷新用戶相關(guān)緩存,如果入庫(kù)失敗記錄日志,方便反饋查詢和重新持久化。
-
這樣一來(lái)數(shù)據(jù)庫(kù)操作就只有一個(gè)程序(多線程)來(lái)完成,不會(huì)給數(shù)據(jù)帶來(lái)壓力。
補(bǔ)充:
-
消息隊(duì)列除了可以用在高并發(fā)業(yè)務(wù),其它只要有相同需求的業(yè)務(wù)也是可以使用,如:短信發(fā)送中間件等。
-
高并發(fā)下異步持久化數(shù)據(jù)可能會(huì)影響用戶的體驗(yàn),可以通過(guò)可配置的方式,或者自動(dòng)化監(jiān)控資源消耗來(lái)切換時(shí)時(shí)或者使用異步,這樣在正常流量的情況下可以使用時(shí)操作數(shù)據(jù)庫(kù)來(lái)提高用戶體驗(yàn)。
-
異步同時(shí)也可以指編程上的異步函數(shù)、異步線程,有的時(shí)候可以使用異步操作,把不需要等待結(jié)果的操作放到異步中,然后繼續(xù)后面的操作,節(jié)省了等待的這部分操作的時(shí)間。
四、緩存
高并發(fā)業(yè)務(wù)接口多數(shù)都是進(jìn)行業(yè)務(wù)數(shù)據(jù)的查詢,如:商品列表、商品信息
用戶信息、紅包信息等,這些數(shù)據(jù)都是不會(huì)經(jīng)常變化,并且持久化在數(shù)據(jù)庫(kù)中。
高并發(fā)的情況下直接連接從庫(kù)做查詢操作,多臺(tái)從庫(kù)服務(wù)器也抗不住這么大量的連接請(qǐng)求數(shù)(前面說(shuō)過(guò),單臺(tái)數(shù)據(jù)庫(kù)服務(wù)器允許的最大連接數(shù)量是有限的),那么在這種高并發(fā)的業(yè)務(wù)接口要如何設(shè)計(jì)呢?
設(shè)計(jì)考慮:
-
還是逆向思維,壓力在數(shù)據(jù)庫(kù),那么我們就不進(jìn)行數(shù)據(jù)庫(kù)查詢?
-
數(shù)據(jù)不經(jīng)常變化,我們?yōu)樯兑恢辈樵僁B?
-
數(shù)據(jù)不變化客戶端為啥要向服務(wù)器請(qǐng)求返回一樣的數(shù)據(jù)?
方案設(shè)計(jì):
-
數(shù)據(jù)不經(jīng)常變化,我們可以把數(shù)據(jù)進(jìn)行緩存,緩存的方式有很多種,一般的:應(yīng)用服務(wù)器直接Cache內(nèi)存,主流的:存儲(chǔ)在memcache、Redis內(nèi)存數(shù)據(jù)庫(kù)。
-
Cache是直接存儲(chǔ)在應(yīng)用服務(wù)器中,讀取速度快,內(nèi)存數(shù)據(jù)庫(kù)服務(wù)器允許連接數(shù)可以支撐到很大,而且數(shù)據(jù)存儲(chǔ)在內(nèi)存,讀取速度快,再加上主從集群,可以支撐很大的并發(fā)查詢。
-
根據(jù)業(yè)務(wù)情景,使用配合客戶端本地存,如果我們數(shù)據(jù)內(nèi)容不經(jīng)常變化,為啥要一直請(qǐng)求服務(wù)器獲取相同數(shù)據(jù),可以通過(guò)匹配數(shù)據(jù)版本號(hào),如果版本號(hào)不一樣接口重新查詢緩存返回?cái)?shù)據(jù)和版本號(hào),如果一樣則不查詢數(shù)據(jù)直接響應(yīng)。
-
這樣不僅可以提高接口響應(yīng)速度,也可以節(jié)約服務(wù)器帶寬,雖然有些服務(wù)器帶寬是按流量計(jì)費(fèi),但是也不是絕對(duì)無(wú)限的,在高并發(fā)的時(shí)候服務(wù)器帶寬也可能導(dǎo)致請(qǐng)求響應(yīng)慢的問(wèn)題。
補(bǔ)充:
-
緩存同時(shí)也指靜態(tài)資源客戶端緩存;
-
CDN緩存,靜態(tài)資源通過(guò)上傳CDN,CDN節(jié)點(diǎn)緩存我們的靜態(tài)資源,減少服務(wù)器壓力;
-
Redis的使用技巧參考我的博文:
[大話Redis基礎(chǔ)]-?https://blog.thankbabe.com/2016/04/01/redis/
[大話Redis進(jìn)階]-?https://blog.thankbabe.com/2016/08/05/redis-up/
五、面向服務(wù)
-
SOA面向服務(wù)架構(gòu)設(shè)計(jì)
-
微服務(wù)更細(xì)粒度服務(wù)化,一系列的獨(dú)立的服務(wù)共同組成系統(tǒng)
使用服務(wù)化思維,將核心業(yè)務(wù)或者通用的業(yè)務(wù)功能抽離成服務(wù)獨(dú)立部署,對(duì)外提供接口的方式提供功能。
最理想化的設(shè)計(jì)是可以把一個(gè)復(fù)雜的系統(tǒng)抽離成多個(gè)服務(wù),共同組成系統(tǒng)的業(yè)務(wù),優(yōu)點(diǎn):松耦合、高可用性、高伸縮性、易維護(hù)。
通過(guò)面向服務(wù)化設(shè)計(jì),獨(dú)立服務(wù)器部署,均衡負(fù)載,數(shù)據(jù)庫(kù)集群,可以讓服務(wù)支撐更高的并發(fā)。
服務(wù)例子:?用戶行為跟蹤記錄統(tǒng)計(jì)
說(shuō)明:
通過(guò)上報(bào)應(yīng)用模塊,操作事件,事件對(duì)象,等數(shù)據(jù),記錄用戶的操作行為。
比如:記錄用戶在某個(gè)商品模塊,點(diǎn)擊了某一件商品,或者瀏覽了某一件商品
背景:
由于服務(wù)需要記錄用戶的各種操作行為,并且可以重復(fù)上報(bào),準(zhǔn)備接入服務(wù)的業(yè)務(wù)又是核心業(yè)務(wù)的用戶行為跟蹤,所以請(qǐng)求量很大,高峰期會(huì)產(chǎn)生大量并發(fā)請(qǐng)求。
架構(gòu):
-
nodejs WEB應(yīng)用服務(wù)器均衡負(fù)載
-
Redis主從集群
-
MySQL主
-
nodejs+express+ejs+Redis+MySQL
-
服務(wù)端采用nodejs,nodejs是單進(jìn)程(PM2根據(jù)cpu核數(shù)開(kāi)啟多個(gè)工作進(jìn)程),采用事件驅(qū)動(dòng)機(jī)制,適合I/O密集型業(yè)務(wù),處理高并發(fā)能力強(qiáng)
業(yè)務(wù)設(shè)計(jì):
-
并發(fā)量大,所以不能直接入庫(kù),采用:異步同步數(shù)據(jù),消息隊(duì)列。
-
請(qǐng)求接口上報(bào)數(shù)據(jù),接口將上報(bào)數(shù)據(jù)push到redis的list隊(duì)列中。
-
nodejs寫(xiě)入庫(kù)腳本,循環(huán)pop redis list數(shù)據(jù),將數(shù)據(jù)存儲(chǔ)入庫(kù),并進(jìn)行相關(guān)統(tǒng)計(jì)Update,無(wú)數(shù)據(jù)時(shí)sleep幾秒。
-
因?yàn)閿?shù)據(jù)量會(huì)比較大,上報(bào)的數(shù)據(jù)表按天命名存儲(chǔ)。
接口:
-
上報(bào)數(shù)據(jù)接口
-
統(tǒng)計(jì)查詢接口
上線跟進(jìn):
-
服務(wù)業(yè)務(wù)基本正常
-
每天的上報(bào)表有上千萬(wàn)的數(shù)據(jù)
六、冗余,自動(dòng)化
當(dāng)高并發(fā)業(yè)務(wù)所在的服務(wù)器出現(xiàn)宕機(jī)時(shí),需要有備用服務(wù)器進(jìn)行快速的替代,在應(yīng)用服務(wù)器壓力大的時(shí)候可以快速添加機(jī)器到集群中,所以我們就需要有備用機(jī)器可以隨時(shí)待命。
最理想的方式是可以通過(guò)自動(dòng)化監(jiān)控服務(wù)器資源消耗來(lái)進(jìn)行報(bào)警,自動(dòng)切換降級(jí)方案,自動(dòng)地進(jìn)行服務(wù)器替換和添加操作等,通過(guò)自動(dòng)化可以減少人工的操作的成本,而且可以快速操作,避免人為操作上面的失誤。
冗余:
-
數(shù)據(jù)庫(kù)備份
-
備用服務(wù)器
自動(dòng)化:
-
自動(dòng)化監(jiān)控
-
自動(dòng)化報(bào)警
-
自動(dòng)化降級(jí)
通過(guò)GitLab事件,我們應(yīng)該反思,做了備份數(shù)據(jù)并不代表就萬(wàn)無(wú)一失了,我們需要保證高可用性,首先備份是否正常進(jìn)行,備份數(shù)據(jù)是否可用,需要我們進(jìn)行定期的檢查,或者自動(dòng)化監(jiān)控, 還有包括如何避免人為上的操作失誤問(wèn)題。(不過(guò)事件中Gitlab的開(kāi)放性姿態(tài),積極的處理方式還是值得學(xué)習(xí)的)
總結(jié)
高并發(fā)架構(gòu)是一個(gè)不斷衍變的過(guò)程,冰洞三尺非一日之寒,長(zhǎng)城筑成非一日之功。打好基礎(chǔ)架構(gòu)方便以后的拓展,這點(diǎn)很重要。
總結(jié)
以上是生活随笔為你收集整理的电商那些年,我摸爬打滚出的高并发架构实战精髓(续)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 电商那些年,我摸爬打滚出的高并发架构实战
- 下一篇: Visual Studio Code高效