在UNIX 系統(tǒng)中,一個進(jìn)程結(jié)束了,但是他的父進(jìn)程沒有等待(調(diào)用wait / waitpid)他, 那么他將變成一個僵尸進(jìn)程. 在fork()/execve()過程中,假設(shè)子進(jìn)程結(jié)束時父進(jìn)程仍存在,而父進(jìn)程fork()之前既沒安裝SIGCHLD信號處理函數(shù)調(diào)用 waitpid()等待子進(jìn)程結(jié)束,又沒有顯式忽略該信號,則子進(jìn)程成為僵尸進(jìn)程。
一個進(jìn)程在調(diào)用exit命令結(jié)束自己的生命的時候,其實(shí)它并沒有真正的被銷毀, 而是留下一個稱為僵尸進(jìn)程(Zombie)的數(shù)據(jù)結(jié)構(gòu)(系統(tǒng)調(diào)用exit,它的作用是 使進(jìn)程退出,但也僅僅限于將一個正常的進(jìn)程變成一個僵尸進(jìn)程,并不能將其完全銷毀)
進(jìn)程的危害
由于子進(jìn)程的結(jié)束和父進(jìn)程的運(yùn)行是一個異步過程,即父進(jìn)程永遠(yuǎn)無法預(yù)測子進(jìn)程 到底什么時候結(jié)束. 那么會不會因?yàn)楦高M(jìn)程太忙來不及wait子進(jìn)程,或者說不知道 子進(jìn)程什么時候結(jié)束,而丟失子進(jìn)程結(jié)束時的狀態(tài)信息呢? 不會。因?yàn)閁NⅨ提供了一種機(jī)制可以保證只要父進(jìn)程想知道子進(jìn)程結(jié)束時的狀態(tài)信息, 就可以得到。這種機(jī)制就是: 在每個進(jìn)程退出的時候,內(nèi)核釋放該進(jìn)程所有的資源,包括打開的文件,占用的內(nèi)存等。但是仍然為其保留一定的信息(包括進(jìn)程號the process ID,退出狀態(tài)the termination status of the process,運(yùn)行時間the amount of CPU time taken by the process等)。直到父進(jìn)程通過wait / waitpid來取時才釋放. 但這樣就導(dǎo)致了問題,如果進(jìn)程不調(diào)用wait / waitpid的話,那么保留的那段信息就不會釋放,其進(jìn)程號就會一直被占用,但是系統(tǒng)所能使用的進(jìn)程號是有限的,如果大量的產(chǎn)生僵死進(jìn)程,將因?yàn)闆]有可用的進(jìn)程號而導(dǎo)致系統(tǒng)不能產(chǎn)生新的進(jìn)程. 此即為僵尸進(jìn)程的危害,應(yīng)當(dāng)避免。
1、如何查看僵尸進(jìn)程?
如何查看linux系統(tǒng)上的僵尸進(jìn)程,如何統(tǒng)計有多少僵尸進(jìn)程?
#ps -ef | grep defunct
或者查找狀態(tài)為Z的進(jìn)程,Z就是代表zombie process,僵尸進(jìn)程的意思。
另外使用top命令查看時有一欄為S,如果狀態(tài)為Z說明它就是僵尸進(jìn)程。
Tasks: 95 total, 1 running, 94 sleeping, 0 stopped, 0 zombie
top命令中也統(tǒng)計了僵尸進(jìn)程?;蛘呤褂孟旅娴拿睿?br />
ps -ef | grep defunct | grep -v grep | wc -l
2、如何殺死僵尸進(jìn)程?
一般僵尸進(jìn)程很難直接kill掉,不過您可以kill僵尸爸爸。父進(jìn)程死后,僵尸進(jìn)程成為”孤兒進(jìn)程”,過繼給1號進(jìn)程init,init始終會負(fù)責(zé)清理僵尸進(jìn)程.它產(chǎn)生的所有僵尸進(jìn)程也跟著消失。
ps -e -o ppid,stat | grep Z | cut –d” ” -f2 | xargs kill -9
或
kill -HUP `ps -A -ostat,ppid | grep -e ’^[Zz]‘ | awk ’{print $2}’`
當(dāng)然您可以自己編寫更好的shell腳本,歡迎與大家分享。
另外子進(jìn)程死后,會發(fā)送SIGCHLD信號給父進(jìn)程,父進(jìn)程收到此信號后,執(zhí)行waitpid()函數(shù)為子進(jìn)程收尸。就是基于這樣的原理:就算父進(jìn)程沒有調(diào)用wait,內(nèi)核也會向它發(fā)送SIGCHLD消息,而此時,盡管對它的默認(rèn)處理是忽略,如果想響應(yīng)這個消息,可以設(shè)置一個處理函數(shù)。
3、如何避免僵尸進(jìn)程?
處理SIGCHLD信號并不是必須的。但對于某些進(jìn)程,特別是服務(wù)器進(jìn)程往往在請求到來時生成子進(jìn)程處理請求。如果父進(jìn)程不等待子進(jìn)程結(jié) 束,子進(jìn)程將成為僵尸進(jìn)程(zombie)從而占用系統(tǒng)資源。如果父進(jìn)程等待子進(jìn)程結(jié)束,將增加父進(jìn)程的負(fù)擔(dān),影響服務(wù)器進(jìn)程的并發(fā)性能。在Linux下 可以簡單地將 SIGCHLD信號的操作設(shè)為SIG_IGN。
signal(SIGCHLD,SIG_IGN);
這樣,內(nèi)核在子進(jìn)程結(jié)束時不會產(chǎn)生僵尸進(jìn)程。這一點(diǎn)與BSD4不同,BSD4下必須顯式等待子進(jìn)程結(jié)束才能釋放僵尸進(jìn)程
或者
用兩次fork(),而且使緊跟的子進(jìn)程直接退出,是的孫子進(jìn)程成為孤兒進(jìn)程,從而init進(jìn)程將負(fù)責(zé)清除這個孤兒進(jìn)程。