一个java内存泄漏的排查案例
這是個比較典型的java內(nèi)存使用問題,定位過程也比較直接,但對新人還是有點參考價值的,所以就紀錄了一下。
下面介紹一下在不了解系統(tǒng)代碼的情況下,如何一步步分析和定位到具體代碼的排查過程
(以便新人參考和自己回顧)
初步的現(xiàn)象
業(yè)務(wù)系統(tǒng)消費MQ中消息速度變慢,積壓了200多萬條消息,通過jstat觀察到業(yè)務(wù)系統(tǒng)fullgc比較頻繁,到最后干脆OOM了:
?
進一步分析
既然知道了內(nèi)存使用存在問題,那么就要知道是哪些對象占用了大量內(nèi)存.
很多人都會想到把堆dump下來再用MAT等工具進行分析,但dump堆要花較長的時間,并且文件巨大,再從服務(wù)器上拖回本地導(dǎo)入工具,這個過程太折騰不到萬不得已最好別這么干。
可以用更輕量級的在線分析,用jmap查看存活的對象情況(jmap -histo:live [pid]),可以看出HashTable中的元素有5000多萬,占用內(nèi)存大約1.5G的樣子:
?
定位到代碼
現(xiàn)在已經(jīng)知道了是HashTable的問題,那么就要定位出什么代碼引起的
接下來自然要看看是什么代碼往HashTable里瘋狂的put數(shù)據(jù),于是用神器btrace跟蹤Hashtable.put調(diào)用的堆棧。
首先寫btrace腳本TracingHashTable.java:
import com.sun.btrace.annotations.*;
import static com.sun.btrace.BTraceUtils.*;
@BTrace
public class TracingHashTable {
/*指明要查看的方法,類*/
@OnMethod(
clazz="java.util.Hashtable",
method="put",
location=@Location(Kind.RETURN))
public static void traceExecute(@Self java.util.Hashtable object){
println("調(diào)用堆棧!!");
jstack();
}
}
然后運行:
bin/btrace -cp build 4947 TracingHashTable.java
看到有大量類似下圖的調(diào)用堆棧
?
可以看出是在接收到消息后查詢?nèi)霂斓拇a造成的,業(yè)務(wù)方法調(diào)用ibatis再到mysql jdbc驅(qū)動執(zhí)行statement時put了大量的屬性到HashTable中。
通過以上排查已基本定位了由那塊代碼引起的,接下來就是打開代碼工程進行白盒化改造了,對相應(yīng)代碼進行優(yōu)化(不在本文范圍內(nèi)了。幾個圖中的pid不一致就別糾結(jié)了,有些是系統(tǒng)重啟過再截圖的).
更多精彩內(nèi)容請訪問首發(fā)博客http://jenwang.me
進一步交流:
- Email:jenwang@foxmail.com
- 對于本博客某些話題感興趣,希望進一步交流的,請加 qq 群:2825967
- 更多技術(shù)交流分享在圈子「架構(gòu)雜談」,跟老司機們聊聊互聯(lián)網(wǎng)前沿技術(shù)、架構(gòu)、工具、解決方案等
總結(jié)
以上是生活随笔為你收集整理的一个java内存泄漏的排查案例的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 民族习俗与家养动物有何联系
- 下一篇: python初识(2)