最近項目中出現(xiàn)了一個問題,服務(wù)器端程序會突然崩潰退出,我們采取了coredump技術(shù)以找到崩潰原因,即確定進程退出時正在執(zhí)行的函數(shù)是哪個,其狀態(tài)如何。
如果系統(tǒng)開啟了coredump,準(zhǔn)確的說如果當(dāng)前的shell環(huán)境開啟了coredump,當(dāng)前shell環(huán)境下的程序崩潰退出時,會把當(dāng)時進程的棧的內(nèi)存狀態(tài)寫入core文件。使用gdb可以查看這個core文件中保存的棧的狀態(tài),gdb a.out core。(關(guān)于coredump的開啟和對shell的理解,請參考本人另一篇博客《使用dotnet-dump 查找 .net core 3.0 占用CPU 100%的原因解析》,關(guān)于gdb請參考《gdb調(diào)試命令的使用及總結(jié)》)
core文件生成的位置默認是可執(zhí)行文件所在的位置,名稱默認為core,其位置和名稱是可以設(shè)置的,我的設(shè)置為:
mkdir /home/corefile
echo “/home/corefile/core-%e-%p-%t” > /proc/sys/kernel/core_pattern
這樣,生成的core文件會放在/home/corefile目錄下,core文件名會以core-%e-%p-%t的形式出現(xiàn),其中%e表示可執(zhí)行文件的名稱,%p表示進程,%t表示生成core文件的時間(注意是unix時間)。
下面是一個可以導(dǎo)致coredump的例程:

劃線處是會導(dǎo)致coredump處。執(zhí)行后會在/home/corefile目錄下產(chǎn)生以下文件:
[root@localhostwin7]# ls /home/corefile/

a.out是可執(zhí)行文件名,5082是PID,1490760381是產(chǎn)生該文件的unix時間。把a.out 和core文件放在一個目錄下,使用命令:
gdb a.out core-a.out-5082-1490760381
進入gdb,然后使用backtrace命令,即可看進程退出時的棧的內(nèi)存狀態(tài),如下所示:

可見,進程退出時,執(zhí)行的最后一個函數(shù)是square函數(shù)。 ————————————————
總結(jié)
以上所述是小編給大家介紹的Linux下利用coredump技術(shù)追查進程崩潰原因,希望對大家有所幫助,如果大家有任何疑問歡迎給我留言,小編會及時回復(fù)大家的!