探秘大型B2C网站如何实现高性能可伸缩架构技术
作為國內最大的B2C網站,其網站架構一直承載著數(shù)據量高速增長壓力,要保證良好的負載和流程的使用體驗,一個可伸縮性的高性能網站架構必不可少。
一、應用無狀態(tài)
一個系統(tǒng)的伸縮性的好壞取決于應用的狀態(tài)如何管理。試想一下,假如我們在session中保存了大量與客戶端的狀態(tài)信息的話,那么當保存狀態(tài)信息的server宕機的時候,我們怎么辦?通常來說,我們都是通過集群來解決這個問題,而通常所說的集群,不僅有負載均衡,更重要的是要有失效恢復failover,比如tomcat采用的集群節(jié)點廣播復制,Jboss采用的配對復制等session狀態(tài)復制策略,但是集群中的狀態(tài)恢復也有其缺點,那就是嚴重影響了系統(tǒng)的伸縮性,系統(tǒng)不能通過增加更多的機器來達到良好的水平伸縮,因為集群節(jié)點間session的通信會隨著節(jié)點的增多而開銷增大,因此要想做到應用本身的伸縮性,我們需要保證應用的無狀態(tài)性,這樣集群中的各個節(jié)點來說都是相同的,從而是的系統(tǒng)更好的水平伸縮。
上面說了無狀態(tài)的重要性,那么具體如何實現(xiàn)無狀態(tài)呢?此時一個session框架就會發(fā)揮作用了。一般通過cookie來實現(xiàn),或者也可以采用集中式session管理來完成,說具體點就是多個無狀態(tài)的應用節(jié)點連接一個session 服務器,session服務器將session保存到緩存中,session服務器后端再配有底層持久性數(shù)據源,比如數(shù)據庫,文件系統(tǒng)等等。
二、有效使用緩存
做互聯(lián)網應用的兄弟應該都清楚,緩存對于一個互聯(lián)網應用是多么的重要,從瀏覽器緩存,反向代理緩存,頁面緩存,局部頁面緩存,對象緩存等等都是緩存應用的場景。
一般來說緩存根據與應用程序的遠近程度不同可以分為:local cache 和 remote cache。一般系統(tǒng)中要么采用local cache,要么采用remote cache,兩者混合使用的話對于local cache和remote cache的數(shù)據一致性處理會變大比較麻煩。
在大部分情況下,我們所說到的緩存都是讀緩存,緩存還有另外一個類型:寫緩存。對于一些讀寫比不高,同時對數(shù)據安全性需求不高的數(shù)據,我們可以將其緩存起來從而減少對底層數(shù)據庫的訪問,比如統(tǒng)計商品的訪問次數(shù),統(tǒng)計API的調用量等等,可以采用先寫內存緩存然后延遲持久化到數(shù)據庫,這樣可以大大減少對數(shù)據庫的寫壓力。
三、應用拆分
首先,在說明應用拆分之前,我們先來回顧一下一個系統(tǒng)從小變大的過程中遇到的一些問題,通過這些問題我們會發(fā)現(xiàn)拆分對于構建一個大型系統(tǒng)是如何的重要。
系統(tǒng)剛上線初期,用戶數(shù)并不多,所有的邏輯也許都是放在一個系統(tǒng)中的,所有邏輯跑到一個進程或者一個應用當中,這個時候因為比較用戶少,系統(tǒng)訪問量低,因此將全部的邏輯都放在一個應用未嘗不可。但是,兄弟們都清楚,好景不長,隨著系統(tǒng)用戶的不斷增加,系統(tǒng)的訪問壓力越來越多,同時隨著系統(tǒng)發(fā)展,為了滿足用戶的需求,原有的系統(tǒng)需要增加新的功能進來,系統(tǒng)變得越來越復雜的時候,我們會發(fā)現(xiàn)系統(tǒng)變得越來越難維護,難擴展,同時系統(tǒng)伸縮性和可用性也會受到影響。那么這個時候我們如何解決這些問題呢?明智的辦法就是拆分(這也算是一種解耦),我們需要將原來的系統(tǒng)根據一定的標準,比如業(yè)務相關性等分為不同的子系統(tǒng),不同的系統(tǒng)負責不同的功能,這樣切分以后,我們可以對單獨的子系統(tǒng)進行擴展和維護,從而提高系統(tǒng)的擴展性和可維護性,同時我們系統(tǒng)的水平伸縮性scale out大大的提升了,因為我們可以有針對性的對壓力大的子系統(tǒng)進行水平擴展而不會影響到其它的子系統(tǒng),而不會像拆分以前,每次系統(tǒng)壓力變大的時候,我們都需要對整個大系統(tǒng)進行伸縮,而這樣的成本是比較大的,另外經過切分,子系統(tǒng)與子系統(tǒng)之間的耦合減低了,當某個子系統(tǒng)暫時不可用的時候,整體系統(tǒng)還是可用的,從而整體系統(tǒng)的可用性也大大增強了。
因此一個大型的互聯(lián)網應用,肯定是要經過拆分,因為只有拆分了,系統(tǒng)的擴展性,維護性,伸縮性,可用性才會變的更好。但是拆分也給系統(tǒng)帶來了問題,就是子系統(tǒng)之間如何通信的問題,而具體的通信方式有哪些呢?一般有同步通信和異步通信,這里我們首先來說下同步通信,下面的主題“消息系統(tǒng)”會說到異步通信。既然需要通信,這個時候一個高性能的遠程調用框架就顯得非常總要。
?
上面所說的都是拆分的好處,但是拆分以后必然的也會帶來新的問題,除了剛才說的子系統(tǒng)通信問題外,最值得關注的問題就是系統(tǒng)之間的依賴關系,因為系統(tǒng)多了,系統(tǒng)的依賴關系就會變得復雜,此時就需要更好的去關注拆分標準,比如能否將一些有依賴的系統(tǒng)進行垂直化,使得這些系統(tǒng)的功能盡量的垂直,這也是目前公司正在做的系統(tǒng)垂直化,同時一定要注意系統(tǒng)之間的循環(huán)依賴,如果出現(xiàn)循環(huán)依賴一定要小心,因為這可能導致系統(tǒng)連鎖啟動失敗。
從上面可以看出,一個大型系統(tǒng)要想變得可維護,可擴展,可伸縮,我們必須的對它進行拆分,拆分必然也帶來系統(tǒng)之間如何通信以及系統(tǒng)之間依賴管理等問題。
四、數(shù)據庫拆分
在前面“應用拆分”主題中,我們提到了一個大型互聯(lián)網應用需要進行良好的拆分,而那里我們僅僅說了”應用級別”的拆分,其實我們的互聯(lián)網應用除了應用級別的拆分以外,還有另外一個很重要的層面就是存儲如何拆分的。因此這個主題主要涉及到如何對存儲系統(tǒng),通常就是所說的RDBMS進行拆分。
確定了這個小節(jié)的主題之后,我們回顧一下,一個互聯(lián)網應用從小變大的過程中遇到的一些問題,通過遇到的問題來引出我們拆分RDBMS的重要性。
系統(tǒng)剛開始的時候,因為系統(tǒng)剛上線,用戶不多,那個時候,所有的數(shù)據都放在了同一個數(shù)據庫中,這個時候因為用戶少壓力小,一個數(shù)據庫完全可以應付的了,但是隨著運營那些哥們辛苦的吶喊和拼命的推廣以后,突然有一天發(fā)現(xiàn),oh,god,用戶數(shù)量突然變多了起來,隨之而來的就是數(shù)據庫這哥們受不了,它終于在某一天大家都和愜意的時候掛掉啦。此時,咱們搞技術的哥們,就去看看究竟是啥原因,我們查了查以后,發(fā)現(xiàn)原來是數(shù)據庫讀取壓力太大了,此時咱們都清楚是到了讀寫分離的時候,這個時候我們會配置一個server為master節(jié)點,然后配幾個salve節(jié)點,這樣以來通過讀寫分離,使得讀取數(shù)據的壓力分攤到了不同的salve節(jié)點上面,系統(tǒng)終于又恢復了正常,開始正常運行了。但是好景還是不長,有一天我們發(fā)現(xiàn)master這哥們撐不住了,它負載老高了,汗流浹背,隨時都有翹掉的風險,這個時候就需要咱們垂直分區(qū)啦(也就是所謂的分庫),比如將商品信息,用戶信息,交易信息分別存儲到不同的數(shù)據庫中,同時還可以針對商品信息的庫采用master,salve模式,OK,通過分庫以后,各個按照功能拆分的數(shù)據庫寫壓力被分擔到了不同的server上面,這樣數(shù)據庫的壓力終于有恢復到正常狀態(tài)。但是是不是這樣,我們就可以高枕無憂了呢?NO,這個NO,不是我說的,是前輩們通過經驗總結出來的,隨著用戶量的不斷增加,你會發(fā)現(xiàn)系統(tǒng)中的某些表會變的異常龐大,比如好友關系表,店鋪的參數(shù)配置表等,這個時候無論是寫入還是讀取這些表的數(shù)據,對數(shù)據庫來說都是一個很耗費精力的事情,因此此時就需要我們進行“水平分區(qū)”了(這就是俗話說的分表,或者說sharding)。
上面說了很多,無非就是告訴大家一個事實“數(shù)據庫是系統(tǒng)中最不容易scale out的一層”,一個大型的互聯(lián)網應用必然會經過一個從單一DB server,到Master/salve,再到垂直分區(qū)(分庫),然后再到水平分區(qū)(分表,sharding)的過程,而在這個過程中,Master/salve 以及垂直分區(qū)相對比較容易,對應用的影響也不是很大,但是分表會引起一些棘手的問題,比如不能跨越多個分區(qū)join查詢數(shù)據,如何平衡各個shards的負載等等,這個時候就需要一個通用的DAL框架來屏蔽底層數(shù)據存儲對應用邏輯的影響,使得底層數(shù)據的訪問對應用透明化。
?
五、異步通信
在”遠程調用框架”的介紹中,我們說了一個大型的系統(tǒng)為了擴展性和伸縮性方面的需求,肯定是要進行拆分,但是拆分了以后,子系統(tǒng)之間如何通信就成了我們首要的問題,在”遠程調用框架”小節(jié)中,我們說了同步通信在一個大型分布式系統(tǒng)中的應用,那么這一小節(jié)我們就來說說異步通信。好了,既然說到了異步通信,那么”消息中間件”就要登場了,采用異步通信這其實也是關系到系統(tǒng)的伸縮性,以及最大化的對各個子系統(tǒng)進行解耦。
說到異步通信,我們需要關注的一點是這里的異步一定是根據業(yè)務特點來的,一定是針對業(yè)務的異步,通常適合異步的場合是一些松耦合的通信場合,而對于本身業(yè)務上關聯(lián)度比較大的業(yè)務系統(tǒng)之間,我們還是要采用同步通信比較靠譜。
OK,那么下一步我們說說異步能給系統(tǒng)帶來什么樣子的好處。首先我們想想,假如系統(tǒng)有A和B兩個子系統(tǒng)構成,假如A和B是同步通信的話,那么要想使得系統(tǒng)整體伸縮性提高必須同時對A和B進行伸縮,這就影響了對整個系統(tǒng)進行scale out。其次,同步調用還會影響到可用性,從數(shù)學推理的角度來說,A同步調用B,如果A可用,那么B可用,逆否命題就是如果B不可用,那么A也不可用,這將大大影響到系統(tǒng)可用性,再次,系統(tǒng)之間異步通信以后可以大大提高系統(tǒng)的響應時間,使得每個請求的響應時間變短,從而提高用戶體驗,因此異步在提高了系統(tǒng)的伸縮性以及可用性的同時,也大大的增強了請求的響應時間(當然了,請求的總體處理時間也許不會變少)。
?
六、非結構化數(shù)據存儲
在一個大型的互聯(lián)網應用當中,我們會發(fā)現(xiàn)并不是所有的數(shù)據都是結構化的,比如一些配置文件,一個用戶對應的動態(tài),以及一次交易的快照等信息,這些信息一般不適合保存到RDBMS中,它們更符合一種Key-value的結構,另外還有一類數(shù)據,數(shù)據量非常的大,但是實時性要求不高,此時這些數(shù)據也需要通過另外的一種存儲方式進行存儲,另外一些靜態(tài)文件,比如各個商品的圖片,商品描述等信息,這些信息因為比較大,放入RDBMS會引起讀取性能問題,從而影響到其它的數(shù)據讀取性能,因此這些信息也需要和其它信息分開存儲,而一般的互聯(lián)網應用系統(tǒng)都會選擇把這些信息保存到分布式文件系統(tǒng)中。
隨著互聯(lián)網的發(fā)展,業(yè)界從08年下半年開始逐漸流行了一個概念就是NOSQL。我們都知道根據CAP理論,一致性,可用性和分區(qū)容錯性3者不能同時滿足,最多只能同時滿足兩個,我們傳統(tǒng)的關系數(shù)據采用了ACID的事務策略,而ACID的事務策略更加講究的是一種高一致性而降低了可用性的需求,但是互聯(lián)網應用往往對可用性的要求要略高于一致性的需求,這個時候我們就需要避免采用數(shù)據的ACID事務策略,轉而采用BASE事務策略,BASE事務策略是基本可用性,事務軟狀態(tài)以及最終一致性的縮寫,通過BASE事務策略,我們可以通過最終一致性來提升系統(tǒng)的可用性,這也是目前很多NOSQL產品所采用的策略,包括facebook 的cassandra,apache hbase,google bigtable等,這些產品非常適合一些非結構化的數(shù)據,比如key-value形式的數(shù)據存儲,并且這些產品有個很好的優(yōu)點就是水平伸縮性。目前公司也在研究和使用一些成熟的NOSQL產品。
?????
七 監(jiān)控、預警系統(tǒng)
對于大型的系統(tǒng)來說,唯一可靠的就是系統(tǒng)的各個部分是不可靠。
因為一個大型的分布式系統(tǒng)中勢必會涉及到各種各樣的設備,比如網絡交換機,普通PC機,各種型號的網卡,硬盤,內存等等,而這些東東都在數(shù)量非常多的時候,出現(xiàn)錯誤的概率也會變大,因此我們需要時時刻刻監(jiān)控系統(tǒng)的狀態(tài),而監(jiān)控也有粒度的粗細之分,粒度粗一點的話,我們需要對整個應用系統(tǒng)進行監(jiān)控,比如目前的系統(tǒng)網絡流量是多少,內存利用率是多少,IO,CPU的負載是多少,服務的訪問壓力是多少,服務的響應時間是多少等這一系列的監(jiān)控,而細粒度一點的話,我們就需對比如應用中的某個功能,某個URL的訪問量是多,每個頁面的PV是多少,頁面每天占用的帶寬是多少,頁面渲染時間是多少,靜態(tài)資源比如圖片每天占用的帶寬是多少等等進行進一步細粒度的監(jiān)控。因此一個監(jiān)控系統(tǒng)就變得必不可少了。
前面說了一個監(jiān)控系統(tǒng)的重要性,有了監(jiān)控系統(tǒng)以后,更重要的是要和預警系統(tǒng)結合起來,比如當某個頁面訪問量增多的時候,系統(tǒng)能自動預警,某臺Server的CPU和內存占用率突然變大的時候,系統(tǒng)也能自動預警,當并發(fā)請求丟失嚴重的時候,系統(tǒng)也能自動預警等等,這樣以來通過監(jiān)控系統(tǒng)和預警系統(tǒng)的結合可以使得我們能快速響應系統(tǒng)出現(xiàn)的問題,提高系統(tǒng)的穩(wěn)定性和可用性。
八、配置統(tǒng)一管理
一個大型的分布式應用,一般都是有很多節(jié)點構成的,如果每次一個新的節(jié)點加入都要更改其它節(jié)點的配置,或者每次刪除一個節(jié)點也要更改配置的話,這樣不僅不利于系統(tǒng)的維護和管理,同時也更加容易引入錯誤。另外很多時候集群中的很多系統(tǒng)的配置都是一樣的,如果不進行統(tǒng)一的配置管理,就需要再所有的系統(tǒng)上維護一份配置,這樣會造成配置的管理維護很麻煩,而通過一個統(tǒng)一的配置管理可以使得這些問題得到很好的解決,當有新的節(jié)點加入或者刪除的時候,配置管理系統(tǒng)可以通知各個節(jié)點更新配置,從而達到所有節(jié)點的配置一致性,這樣既方便也不會出錯。
文章來自學IT網:http://www.xueit.com/webdeveloper/show-7521-2.aspx
?
轉載于:https://www.cnblogs.com/FredChan/archive/2010/07/27/1786226.html
總結
以上是生活随笔為你收集整理的探秘大型B2C网站如何实现高性能可伸缩架构技术的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Iveely搜索引擎二三题,用你的智慧来
- 下一篇: [译]Vulkan教程(32)生成mip