如何使用AHAS故障演练,实现具备韧性的系统架构?
親寶寶是一個專注于為孕期以及 0-6 歲家庭提供育兒服務的移動互聯網平臺。公司旨在運用科技的力量,幫助家庭更好地關愛和培育孩子。核心產品“親寶寶 APP”于 2013 年正式上線,以成長記錄、智能育兒助手為核心功能,為年輕家庭提供私密親子空間、線上早教、專業養育知識、 社區交流、母嬰商品等一站式育兒服務,截至 2019 年底,親寶寶的注冊用戶已經超過 1 億。
2020年上半年,親寶寶用戶保持高速增長,其技術團隊也逐步發展壯大。系統穩定性風險是技術團隊面臨的最大挑戰之一,特別是在容器技術下的微服務架構,服務間調用錯綜復雜,應用依賴眾多,對系統穩定性提出了以下訴求:
? 在微服務依賴治理,需具備超時、重試、降級及預案等容錯能力。
? 容器架構模式下,需具備業務面對突發流量的彈性伸縮能力。
? 中間件或云服務在出現故障時,業務需要具備容錯能力。
? 應用服務在面對不穩定網絡環境時,需要具備自愈能力。
如何滿足親寶寶對穩定性的需求?
解決方案架構圖
為了快速驗證系統的容錯能力,親寶寶采用了阿里云應用高可用服務AHAS中的故障演練平臺解決方案:
? 通過模擬殺服務Pod、殺節點、增大Pod資源負載,觀察系統服務可用性,驗證集群的彈性伸縮能力是否符合預期。
? 通過模擬應用無法連接消息、緩存以及數據庫,驗證系統在超時設置以及預案的有效性。
? 通過模擬網絡不穩定場景,驗證業務系統的影響范圍。
通過引入成熟、穩定的阿里云混沌工程解決方案,親寶寶的系統架構在面對復雜業務下頻繁迭代時,系統依然具備面對失敗的容錯能力,業務表現得更穩定、健壯、彈性。親寶寶的IT團隊也通過方案背后所融入的方法論,掌握了一套適合自己團隊的應對故障的預防機制,并且開始實踐演練常態化、自動化機制。
關聯產品
應用高可用服務 AHAS :https://www.aliyun.com/product/ahas
原文鏈接:https://developer.aliyun.com/article/781234?
版權聲明:本文內容由阿里云實名注冊用戶自發貢獻,版權歸原作者所有,阿里云開發者社區不擁有其著作權,亦不承擔相應法律責任。具體規則請查看《阿里云開發者社區用戶服務協議》和《阿里云開發者社區知識產權保護指引》。如果您發現本社區中有涉嫌抄襲的內容,填寫侵權投訴表單進行舉報,一經查實,本社區將立刻刪除涉嫌侵權內容。總結
以上是生活随笔為你收集整理的如何使用AHAS故障演练,实现具备韧性的系统架构?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 函数计算FC让游戏群采集营销数据滴水不漏
- 下一篇: 阿里云控制台门户升级,V2.0 乘风破浪