让bug无处藏身,Java 线上问题排查思路、常用工具
本文總結(jié)了一些常見的線上應(yīng)急現(xiàn)象和對應(yīng)排查步驟和工具。分享的主要目的是想讓對線上問題接觸少的同學(xué)有個預(yù)先認(rèn)知,免得在遇到實(shí)際問題時手忙腳亂。
只不過這里先提示一下。在線上應(yīng)急過程中要記住,只有一個總體目標(biāo):盡快恢復(fù)服務(wù),消除影響。不管處于應(yīng)急的哪個階段,我們首先必須想到的是恢復(fù)問題,恢復(fù)問題不一定能夠定位問題,也不一定有完美的解決方案,也許是通過經(jīng)驗(yàn)判斷,也許是預(yù)設(shè)開關(guān)等,但都可能讓我們達(dá)到快速恢復(fù)的目的,然后保留部分現(xiàn)場,再去定位問題、解決問題和復(fù)盤。
在大多數(shù)情況下,我們都是先優(yōu)先恢復(fù)服務(wù),保留下當(dāng)時的異常信息(內(nèi)存dump、線程dump、gc log等等,在緊急情況下甚至可以不用保留,等到事后去復(fù)現(xiàn)),等到服務(wù)正常,再去復(fù)盤問題。
好,現(xiàn)在讓我們進(jìn)入正題吧。
常見現(xiàn)象:CPU 利用率高/飆升
場景預(yù)設(shè):
監(jiān)控系統(tǒng)突然告警,提示服務(wù)器負(fù)載異常。
預(yù)先說明:
CPU飆升只是一種現(xiàn)象,其中具體的問題可能有很多種?
總結(jié)
以上是生活随笔為你收集整理的让bug无处藏身,Java 线上问题排查思路、常用工具的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 完美解答35K月薪的MySQL面试题(三
- 下一篇: LDA主题模型——gensim实战