阿里云服务网格ASM集成SLS告警
簡介:隨著微服務(wù)的流行,微服務(wù)的架構(gòu)也在不斷的發(fā)展演進(jìn),Spring Cloud 與 Dubbo為代表的微服務(wù)開發(fā)框架也得到了普及和落地;在云原生時(shí)代,無侵入的服務(wù)網(wǎng)格(Service Mesh)開始走向成熟,相對于傳統(tǒng)微服務(wù)架構(gòu),服務(wù)網(wǎng)格具有可觀察性、流量控制、安全性三大優(yōu)勢。服務(wù)網(wǎng)格將之前服務(wù)治理中的復(fù)雜性從應(yīng)用中分離出來,將這些復(fù)雜性放到了服務(wù)代理中,包括流量控制,斷路,服務(wù)發(fā)現(xiàn),安全性,可觀測性等;開發(fā)時(shí)應(yīng)用只需要關(guān)心業(yè)務(wù)功能實(shí)現(xiàn),讓責(zé)任劃分變得更加清楚。
1. 前言
隨著微服務(wù)的流行,微服務(wù)的架構(gòu)也在不斷的發(fā)展演進(jìn),Spring Cloud 與 Dubbo為代表的微服務(wù)開發(fā)框架也得到了普及和落地;在云原生時(shí)代,無侵入的服務(wù)網(wǎng)格(Service Mesh)開始走向成熟,相對于傳統(tǒng)微服務(wù)架構(gòu),服務(wù)網(wǎng)格具有可觀察性、流量控制、安全性三大優(yōu)勢。服務(wù)網(wǎng)格將之前服務(wù)治理中的復(fù)雜性從應(yīng)用中分離出來,將這些復(fù)雜性放到了服務(wù)代理中,包括流量控制,斷路,服務(wù)發(fā)現(xiàn),安全性,可觀測性等;開發(fā)時(shí)應(yīng)用只需要關(guān)心業(yè)務(wù)功能實(shí)現(xiàn),讓責(zé)任劃分變得更加清楚。
阿里云服務(wù)網(wǎng)格是阿里云提供的全托管式服務(wù)網(wǎng)格平臺,兼容Istio。在可觀測性方面,與SLS深度集成,提供了日志采集、可視化、告警一站式可觀察性解決方案。本文主要介紹介紹服務(wù)網(wǎng)格新推出的控制面日志采集和告警配置,同時(shí)也會涵蓋數(shù)據(jù)面訪問日志的采集和可視化;未來數(shù)據(jù)面的訪問日志的告警也將推出更多內(nèi)置告警規(guī)則,實(shí)現(xiàn)可以在SLS上一站式進(jìn)行告警管理。
2. 阿里云服務(wù)網(wǎng)格(ASM)介紹
阿里云服務(wù)網(wǎng)格(Alibaba Cloud Service Mesh,簡稱ASM)提供一個(gè)全托管式的服務(wù)網(wǎng)格平臺,兼容社區(qū)Istio開源服務(wù)網(wǎng)格,用于簡化服務(wù)的治理,包括服務(wù)調(diào)用之間的流量路由與拆分管理、服務(wù)間通信的認(rèn)證安全以及網(wǎng)格可觀測性能力,從而極大地減輕開發(fā)與運(yùn)維的工作負(fù)擔(dān)。
ASM中的控制平面組件完全有阿里云托管,兼容Istio,用戶只需要掛住業(yè)務(wù)應(yīng)用的開發(fā)部署。 對于ACK托管集群,專有集群,Serverless集群,混合云或者多云場景,提供一致的流量控制,安全和可觀測性管理,控制平面核心組件由阿里云托管,最大限度降低用戶資源的開銷和運(yùn)維成本。
在可觀測性方面,ASM支持使用SLS控制平面和數(shù)據(jù)平面的日志,并提供了內(nèi)置的儀表盤及告警,未來將增加更多內(nèi)置告警的內(nèi)置告警規(guī)則,借助SLS強(qiáng)大的告警管理和通知功能,用戶可以更加對ASM的運(yùn)行狀態(tài)更加了解,并及時(shí)獲得告警通知以進(jìn)行下一步操作。
3. SLS告警介紹
日志服務(wù)SLS是云原生觀測與分析平臺,為Log、Metric、Trace等數(shù)據(jù)提供大規(guī)模、低成本、實(shí)時(shí)的平臺化服務(wù)。日志服務(wù)提供一站式數(shù)據(jù)采集、加工、查詢與分析、可視化、告警、消費(fèi)與投遞等功能。
SLS告警是一站式的告警監(jiān)控、降噪、事務(wù)管理、通知分派的智能運(yùn)維平臺。SLS告警的核心功能組件主包括數(shù)據(jù)存儲,告警監(jiān)控,告警管理,行動管理和開放告警幾個(gè)子系統(tǒng)。
SLS告警來源主要包括自定義告警,系統(tǒng)內(nèi)置告警和開放告警。各類告警源產(chǎn)生告警后,告警會發(fā)送給告警管理系統(tǒng),通過告警管理系統(tǒng),用戶可以進(jìn)行合并,抑制,靜默等處理;然后告警會到通知管理系統(tǒng),在通知管理中,可以設(shè)置根據(jù)不同的告警屬性將將通知分派到不同的通知渠道。
4. ASM可觀測性日志采集及可視化
ASM可觀測性的日志主要包括控制平面和數(shù)據(jù)平面的日志:
- 控制平面日志ASM提供了基于SLS的告警功能;
- 數(shù)據(jù)平面日志主要包括入口網(wǎng)關(guān)日志,Envoy Access Log,在數(shù)據(jù)平面日志中ASM提供了基于SLS的內(nèi)置儀表盤功能。
4.1. 數(shù)據(jù)平面入口網(wǎng)關(guān)日志采集及可視化
接入數(shù)據(jù)平面入口網(wǎng)關(guān)日志可以參考服務(wù)網(wǎng)格接入入口網(wǎng)關(guān)日志。主要包括安裝日志服務(wù)組件和采集配置,完成采集后,在ASM控制臺內(nèi)嵌了入口網(wǎng)關(guān)概覽、入口網(wǎng)關(guān)訪問中心、入口網(wǎng)關(guān)監(jiān)控中心三個(gè)儀表盤。
4.2. Envoy Access Log采集及可視化
接入Envoy Access Log可以參考使用日志服務(wù)采集數(shù)據(jù)平面入口網(wǎng)關(guān)日志,主要步驟包括安裝日志服務(wù)組件和采集配置,完成采集后可以在ASM控制臺查看訪問日志監(jiān)控中心和訪問日志詳細(xì)記錄。
4.3. 控制平面日志采集及告警
ASM支持將控制平面的日志采集到SLS,然后根據(jù)日志進(jìn)行告警配置,接下來著重介紹下如何開啟控制面日志采集及告警。
4.3.1 在ASM控制臺開啟告警
4.3.2 在SLS控制臺配置告警通知人
告警管理中心是SLS下基于業(yè)務(wù)的統(tǒng)一智能告警運(yùn)維平臺,可以在全局配置->通知策略->行動策略中找到“SLS服務(wù)網(wǎng)關(guān)內(nèi)置行動策略”,點(diǎn)擊修改可以查看其告警通知接收人,通知模板等。
在接收到告警后,可以根據(jù)告警中的內(nèi)容提示進(jìn)行一些處理建議。
| 錯(cuò)誤信息 | 處理建議 |
| Internal:Error adding/updating listener(s) 0.0.0.0_443: Failed to load certificate chain from <inline>, only P-256 ECDSA certificates are supported | 該告警信息表示數(shù)據(jù)面集群不支持您為數(shù)據(jù)面配置的證書,當(dāng)前僅支持P-256 ECDSA證書。您需要重新配置證書,具體操作,請參見通過服務(wù)網(wǎng)關(guān)啟用HTTPS安全服務(wù) 。 |
| Internal:Error adding/updating listener(s) 0.0.0.0_443: Invalid path: **** | 該告警信息表示您為數(shù)據(jù)面配置的證書路徑有誤或證書不存在,您需要檢查證書掛載路徑是否與Gateway中配置的路徑相符。具體操作,請參見通過服務(wù)網(wǎng)關(guān)啟用HTTPS安全服務(wù) 。 |
| Internal:Error adding/updating listener(s) 0.0.0.0_xx: duplicate listener 0.0.0.0_xx found | 該告警信息表示您為網(wǎng)關(guān)配置的監(jiān)聽端口重復(fù),請檢查您的Gateway,刪除重復(fù)的端口。 |
| Internal:Error adding/updating listener(s) 192.168.33.189_15021: Didn't find a registered implementation for name: '***' | 該告警信息表示在Sidecar和Ingressgateway中無法找到您通過EnvoyFilter針對15021這個(gè)Listener patch的配置中引用的***,您需要?jiǎng)h除該引用。 |
| Internal:Error adding/updating listener(s) 0.0.0.0_80: V2 (and AUTO) xDS transport protocol versions are deprecated in grpc_service *** | 該告警信息表示即將棄用您數(shù)據(jù)面的XDS V2協(xié)議,這通常是因?yàn)槟臄?shù)據(jù)面Sidecar的版本與控制平面不符所致。升級數(shù)據(jù)平面的Sidecar可以解決該問題,您需要?jiǎng)h除Pod,該P(yáng)od自動重新創(chuàng)建后會自動注入最新版本的Sidecar。 |
5. 總結(jié)
本文主要描述了如果在阿里云服務(wù)網(wǎng)格中開啟數(shù)據(jù)面訪問日志及控制面日志,并且簡單介紹了數(shù)據(jù)面日志中的內(nèi)置儀表盤和控制面日志的告警配置。借助SLS告警,用戶可以一站式的進(jìn)行告警的管理,可以有效的提供運(yùn)維效率。目前SLS支持了ASM控制面日志告警,未來,在ASM數(shù)據(jù)面日志采集和可視化基礎(chǔ)上,SLS將提供更多的內(nèi)置告警規(guī)則,在ASM控制臺可以實(shí)現(xiàn)一鍵開啟內(nèi)置告警規(guī)則,完善服務(wù)網(wǎng)格可觀測性的閉環(huán),用戶也可以在SLS上實(shí)現(xiàn)統(tǒng)一的告警管理,敬請期待。
原文鏈接
本文為阿里云原創(chuàng)內(nèi)容,未經(jīng)允許不得轉(zhuǎn)載。
總結(jié)
以上是生活随笔為你收集整理的阿里云服务网格ASM集成SLS告警的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: HMS数据库设置和优化
- 下一篇: 贾扬清演讲实录:一个AI开发者的奇幻漂流