當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

探秘大型B2C网站如何实现高性能可伸缩架构技术

發(fā)布時間：2024/4/15 编程问答 37 豆豆

生活随笔收集整理的這篇文章主要介紹了探秘大型B2C网站如何实现高性能可伸缩架构技术小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

作為國內最大的B2C網站，其網站架構一直承載著數(shù)據量高速增長壓力，要保證良好的負載和流程的使用體驗，一個可伸縮性的高性能網站架構必不可少。

一、應用無狀態(tài)

一個系統(tǒng)的伸縮性的好壞取決于應用的狀態(tài)如何管理。試想一下，假如我們在session中保存了大量與客戶端的狀態(tài)信息的話，那么當保存狀態(tài)信息的server宕機的時候，我們怎么辦？通常來說，我們都是通過集群來解決這個問題，而通常所說的集群，不僅有負載均衡，更重要的是要有失效恢復failover,比如tomcat采用的集群節(jié)點廣播復制，Jboss采用的配對復制等session狀態(tài)復制策略，但是集群中的狀態(tài)恢復也有其缺點，那就是嚴重影響了系統(tǒng)的伸縮性，系統(tǒng)不能通過增加更多的機器來達到良好的水平伸縮，因為集群節(jié)點間session的通信會隨著節(jié)點的增多而開銷增大，因此要想做到應用本身的伸縮性，我們需要保證應用的無狀態(tài)性，這樣集群中的各個節(jié)點來說都是相同的，從而是的系統(tǒng)更好的水平伸縮。

上面說了無狀態(tài)的重要性，那么具體如何實現(xiàn)無狀態(tài)呢？此時一個session框架就會發(fā)揮作用了。一般通過cookie來實現(xiàn)，或者也可以采用集中式session管理來完成，說具體點就是多個無狀態(tài)的應用節(jié)點連接一個session 服務器，session服務器將session保存到緩存中，session服務器后端再配有底層持久性數(shù)據源，比如數(shù)據庫，文件系統(tǒng)等等。

二、有效使用緩存

做互聯(lián)網應用的兄弟應該都清楚，緩存對于一個互聯(lián)網應用是多么的重要，從瀏覽器緩存，反向代理緩存，頁面緩存，局部頁面緩存，對象緩存等等都是緩存應用的場景。

一般來說緩存根據與應用程序的遠近程度不同可以分為：local cache 和 remote cache。一般系統(tǒng)中要么采用local cache，要么采用remote cache,兩者混合使用的話對于local cache和remote cache的數(shù)據一致性處理會變大比較麻煩。

在大部分情況下,我們所說到的緩存都是讀緩存,緩存還有另外一個類型:寫緩存。對于一些讀寫比不高，同時對數(shù)據安全性需求不高的數(shù)據，我們可以將其緩存起來從而減少對底層數(shù)據庫的訪問,比如統(tǒng)計商品的訪問次數(shù),統(tǒng)計API的調用量等等,可以采用先寫內存緩存然后延遲持久化到數(shù)據庫，這樣可以大大減少對數(shù)據庫的寫壓力。

三、應用拆分

首先，在說明應用拆分之前，我們先來回顧一下一個系統(tǒng)從小變大的過程中遇到的一些問題，通過這些問題我們會發(fā)現(xiàn)拆分對于構建一個大型系統(tǒng)是如何的重要。
系統(tǒng)剛上線初期，用戶數(shù)并不多，所有的邏輯也許都是放在一個系統(tǒng)中的，所有邏輯跑到一個進程或者一個應用當中，這個時候因為比較用戶少，系統(tǒng)訪問量低，因此將全部的邏輯都放在一個應用未嘗不可。但是，兄弟們都清楚，好景不長，隨著系統(tǒng)用戶的不斷增加，系統(tǒng)的訪問壓力越來越多，同時隨著系統(tǒng)發(fā)展，為了滿足用戶的需求，原有的系統(tǒng)需要增加新的功能進來，系統(tǒng)變得越來越復雜的時候，我們會發(fā)現(xiàn)系統(tǒng)變得越來越難維護，難擴展，同時系統(tǒng)伸縮性和可用性也會受到影響。那么這個時候我們如何解決這些問題呢？明智的辦法就是拆分（這也算是一種解耦），我們需要將原來的系統(tǒng)根據一定的標準，比如業(yè)務相關性等分為不同的子系統(tǒng)，不同的系統(tǒng)負責不同的功能，這樣切分以后，我們可以對單獨的子系統(tǒng)進行擴展和維護，從而提高系統(tǒng)的擴展性和可維護性，同時我們系統(tǒng)的水平伸縮性scale out大大的提升了，因為我們可以有針對性的對壓力大的子系統(tǒng)進行水平擴展而不會影響到其它的子系統(tǒng)，而不會像拆分以前，每次系統(tǒng)壓力變大的時候，我們都需要對整個大系統(tǒng)進行伸縮，而這樣的成本是比較大的，另外經過切分，子系統(tǒng)與子系統(tǒng)之間的耦合減低了，當某個子系統(tǒng)暫時不可用的時候，整體系統(tǒng)還是可用的，從而整體系統(tǒng)的可用性也大大增強了。

因此一個大型的互聯(lián)網應用，肯定是要經過拆分，因為只有拆分了，系統(tǒng)的擴展性，維護性,伸縮性，可用性才會變的更好。但是拆分也給系統(tǒng)帶來了問題，就是子系統(tǒng)之間如何通信的問題，而具體的通信方式有哪些呢？一般有同步通信和異步通信，這里我們首先來說下同步通信，下面的主題“消息系統(tǒng)”會說到異步通信。既然需要通信，這個時候一個高性能的遠程調用框架就顯得非常總要。
?
上面所說的都是拆分的好處，但是拆分以后必然的也會帶來新的問題，除了剛才說的子系統(tǒng)通信問題外，最值得關注的問題就是系統(tǒng)之間的依賴關系，因為系統(tǒng)多了，系統(tǒng)的依賴關系就會變得復雜，此時就需要更好的去關注拆分標準，比如能否將一些有依賴的系統(tǒng)進行垂直化，使得這些系統(tǒng)的功能盡量的垂直，這也是目前公司正在做的系統(tǒng)垂直化，同時一定要注意系統(tǒng)之間的循環(huán)依賴，如果出現(xiàn)循環(huán)依賴一定要小心，因為這可能導致系統(tǒng)連鎖啟動失敗。

從上面可以看出，一個大型系統(tǒng)要想變得可維護，可擴展，可伸縮，我們必須的對它進行拆分，拆分必然也帶來系統(tǒng)之間如何通信以及系統(tǒng)之間依賴管理等問題。

四、數(shù)據庫拆分

在前面“應用拆分”主題中，我們提到了一個大型互聯(lián)網應用需要進行良好的拆分，而那里我們僅僅說了”應用級別”的拆分，其實我們的互聯(lián)網應用除了應用級別的拆分以外，還有另外一個很重要的層面就是存儲如何拆分的。因此這個主題主要涉及到如何對存儲系統(tǒng)，通常就是所說的RDBMS進行拆分。

確定了這個小節(jié)的主題之后，我們回顧一下，一個互聯(lián)網應用從小變大的過程中遇到的一些問題，通過遇到的問題來引出我們拆分RDBMS的重要性。

系統(tǒng)剛開始的時候，因為系統(tǒng)剛上線，用戶不多，那個時候，所有的數(shù)據都放在了同一個數(shù)據庫中，這個時候因為用戶少壓力小，一個數(shù)據庫完全可以應付的了，但是隨著運營那些哥們辛苦的吶喊和拼命的推廣以后，突然有一天發(fā)現(xiàn)，oh,god,用戶數(shù)量突然變多了起來，隨之而來的就是數(shù)據庫這哥們受不了，它終于在某一天大家都和愜意的時候掛掉啦。此時，咱們搞技術的哥們，就去看看究竟是啥原因，我們查了查以后，發(fā)現(xiàn)原來是數(shù)據庫讀取壓力太大了，此時咱們都清楚是到了讀寫分離的時候，這個時候我們會配置一個server為master節(jié)點，然后配幾個salve節(jié)點，這樣以來通過讀寫分離，使得讀取數(shù)據的壓力分攤到了不同的salve節(jié)點上面，系統(tǒng)終于又恢復了正常，開始正常運行了。但是好景還是不長，有一天我們發(fā)現(xiàn)master這哥們撐不住了，它負載老高了，汗流浹背，隨時都有翹掉的風險，這個時候就需要咱們垂直分區(qū)啦（也就是所謂的分庫），比如將商品信息，用戶信息，交易信息分別存儲到不同的數(shù)據庫中，同時還可以針對商品信息的庫采用master，salve模式，OK，通過分庫以后，各個按照功能拆分的數(shù)據庫寫壓力被分擔到了不同的server上面，這樣數(shù)據庫的壓力終于有恢復到正常狀態(tài)。但是是不是這樣，我們就可以高枕無憂了呢？NO,這個NO，不是我說的，是前輩們通過經驗總結出來的，隨著用戶量的不斷增加，你會發(fā)現(xiàn)系統(tǒng)中的某些表會變的異常龐大，比如好友關系表，店鋪的參數(shù)配置表等，這個時候無論是寫入還是讀取這些表的數(shù)據，對數(shù)據庫來說都是一個很耗費精力的事情，因此此時就需要我們進行“水平分區(qū)”了（這就是俗話說的分表，或者說sharding）。

上面說了很多，無非就是告訴大家一個事實“數(shù)據庫是系統(tǒng)中最不容易scale out的一層”，一個大型的互聯(lián)網應用必然會經過一個從單一DB server,到Master/salve,再到垂直分區(qū)（分庫），然后再到水平分區(qū)（分表，sharding）的過程，而在這個過程中，Master/salve 以及垂直分區(qū)相對比較容易，對應用的影響也不是很大，但是分表會引起一些棘手的問題，比如不能跨越多個分區(qū)join查詢數(shù)據，如何平衡各個shards的負載等等，這個時候就需要一個通用的DAL框架來屏蔽底層數(shù)據存儲對應用邏輯的影響，使得底層數(shù)據的訪問對應用透明化。
?
五、異步通信

在”遠程調用框架”的介紹中,我們說了一個大型的系統(tǒng)為了擴展性和伸縮性方面的需求,肯定是要進行拆分,但是拆分了以后,子系統(tǒng)之間如何通信就成了我們首要的問題,在”遠程調用框架”小節(jié)中,我們說了同步通信在一個大型分布式系統(tǒng)中的應用,那么這一小節(jié)我們就來說說異步通信。好了,既然說到了異步通信,那么”消息中間件”就要登場了,采用異步通信這其實也是關系到系統(tǒng)的伸縮性,以及最大化的對各個子系統(tǒng)進行解耦。

說到異步通信，我們需要關注的一點是這里的異步一定是根據業(yè)務特點來的，一定是針對業(yè)務的異步，通常適合異步的場合是一些松耦合的通信場合，而對于本身業(yè)務上關聯(lián)度比較大的業(yè)務系統(tǒng)之間，我們還是要采用同步通信比較靠譜。

OK,那么下一步我們說說異步能給系統(tǒng)帶來什么樣子的好處。首先我們想想，假如系統(tǒng)有A和B兩個子系統(tǒng)構成，假如A和B是同步通信的話，那么要想使得系統(tǒng)整體伸縮性提高必須同時對A和B進行伸縮，這就影響了對整個系統(tǒng)進行scale out。其次，同步調用還會影響到可用性，從數(shù)學推理的角度來說，A同步調用B，如果A可用，那么B可用，逆否命題就是如果B不可用，那么A也不可用，這將大大影響到系統(tǒng)可用性，再次，系統(tǒng)之間異步通信以后可以大大提高系統(tǒng)的響應時間，使得每個請求的響應時間變短，從而提高用戶體驗，因此異步在提高了系統(tǒng)的伸縮性以及可用性的同時，也大大的增強了請求的響應時間（當然了，請求的總體處理時間也許不會變少）。
?
六、非結構化數(shù)據存儲

在一個大型的互聯(lián)網應用當中，我們會發(fā)現(xiàn)并不是所有的數(shù)據都是結構化的，比如一些配置文件，一個用戶對應的動態(tài)，以及一次交易的快照等信息，這些信息一般不適合保存到RDBMS中，它們更符合一種Key-value的結構，另外還有一類數(shù)據，數(shù)據量非常的大，但是實時性要求不高，此時這些數(shù)據也需要通過另外的一種存儲方式進行存儲，另外一些靜態(tài)文件，比如各個商品的圖片，商品描述等信息，這些信息因為比較大，放入RDBMS會引起讀取性能問題，從而影響到其它的數(shù)據讀取性能，因此這些信息也需要和其它信息分開存儲，而一般的互聯(lián)網應用系統(tǒng)都會選擇把這些信息保存到分布式文件系統(tǒng)中。

隨著互聯(lián)網的發(fā)展，業(yè)界從08年下半年開始逐漸流行了一個概念就是NOSQL。我們都知道根據CAP理論，一致性，可用性和分區(qū)容錯性3者不能同時滿足，最多只能同時滿足兩個，我們傳統(tǒng)的關系數(shù)據采用了ACID的事務策略，而ACID的事務策略更加講究的是一種高一致性而降低了可用性的需求，但是互聯(lián)網應用往往對可用性的要求要略高于一致性的需求，這個時候我們就需要避免采用數(shù)據的ACID事務策略，轉而采用BASE事務策略，BASE事務策略是基本可用性，事務軟狀態(tài)以及最終一致性的縮寫，通過BASE事務策略，我們可以通過最終一致性來提升系統(tǒng)的可用性，這也是目前很多NOSQL產品所采用的策略，包括facebook 的cassandra,apache hbase,google bigtable等，這些產品非常適合一些非結構化的數(shù)據，比如key-value形式的數(shù)據存儲，并且這些產品有個很好的優(yōu)點就是水平伸縮性。目前公司也在研究和使用一些成熟的NOSQL產品。
?????
七監(jiān)控、預警系統(tǒng)

對于大型的系統(tǒng)來說，唯一可靠的就是系統(tǒng)的各個部分是不可靠。

因為一個大型的分布式系統(tǒng)中勢必會涉及到各種各樣的設備，比如網絡交換機，普通PC機，各種型號的網卡，硬盤，內存等等，而這些東東都在數(shù)量非常多的時候，出現(xiàn)錯誤的概率也會變大，因此我們需要時時刻刻監(jiān)控系統(tǒng)的狀態(tài)，而監(jiān)控也有粒度的粗細之分，粒度粗一點的話，我們需要對整個應用系統(tǒng)進行監(jiān)控，比如目前的系統(tǒng)網絡流量是多少，內存利用率是多少，IO，CPU的負載是多少，服務的訪問壓力是多少，服務的響應時間是多少等這一系列的監(jiān)控，而細粒度一點的話，我們就需對比如應用中的某個功能，某個URL的訪問量是多，每個頁面的PV是多少，頁面每天占用的帶寬是多少，頁面渲染時間是多少，靜態(tài)資源比如圖片每天占用的帶寬是多少等等進行進一步細粒度的監(jiān)控。因此一個監(jiān)控系統(tǒng)就變得必不可少了。

前面說了一個監(jiān)控系統(tǒng)的重要性，有了監(jiān)控系統(tǒng)以后，更重要的是要和預警系統(tǒng)結合起來，比如當某個頁面訪問量增多的時候，系統(tǒng)能自動預警，某臺Server的CPU和內存占用率突然變大的時候，系統(tǒng)也能自動預警，當并發(fā)請求丟失嚴重的時候，系統(tǒng)也能自動預警等等，這樣以來通過監(jiān)控系統(tǒng)和預警系統(tǒng)的結合可以使得我們能快速響應系統(tǒng)出現(xiàn)的問題，提高系統(tǒng)的穩(wěn)定性和可用性。

八、配置統(tǒng)一管理

一個大型的分布式應用，一般都是有很多節(jié)點構成的，如果每次一個新的節(jié)點加入都要更改其它節(jié)點的配置，或者每次刪除一個節(jié)點也要更改配置的話，這樣不僅不利于系統(tǒng)的維護和管理，同時也更加容易引入錯誤。另外很多時候集群中的很多系統(tǒng)的配置都是一樣的，如果不進行統(tǒng)一的配置管理，就需要再所有的系統(tǒng)上維護一份配置，這樣會造成配置的管理維護很麻煩，而通過一個統(tǒng)一的配置管理可以使得這些問題得到很好的解決，當有新的節(jié)點加入或者刪除的時候，配置管理系統(tǒng)可以通知各個節(jié)點更新配置，從而達到所有節(jié)點的配置一致性，這樣既方便也不會出錯。
文章來自學IT網：http://www.xueit.com/webdeveloper/show-7521-2.aspx

轉載于:https://www.cnblogs.com/FredChan/archive/2010/07/27/1786226.html

總結

以上是生活随笔為你收集整理的探秘大型B2C网站如何实现高性能可伸缩架构技术的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： Iveely搜索引擎二三题，用你的智慧来
下一篇： [译]Vulkan教程(32)生成mip