0514-86177077
9:00-17:00(工作日)
在排除了硬件故障/firmware版本/BIOS等等問題之外, Linux死機通常可能碰到如下幾種情況 1, 如果你的Linux死機的時候控制臺上有亂七八糟的字符。恭喜你,這種情況叫做oops. 通常是Linux kernel認為自己發(fā)生了異常造成的。 可以通過oops消息查找出錯的地方。 2, 如果你的機器僵死,那么問題麻煩了。這種時候,通常是Kernel出現(xiàn)了死鎖。Kernel不會知道自己死鎖了,所以不會在屏幕上顯示任何咚咚。 如果運氣好,此時Kernel也許可能能夠響應(yīng)中斷。不管怎樣,你都無法進一步操作了。 3, 嚴格來說,這第三種情況不算死機,現(xiàn)象如下:輸入命令回車之后命令不能返回任何結(jié)果, 但是控制臺對回車可能有相應(yīng)。但是命令無法結(jié)束,也不會有輸出結(jié)果。 但是可以換到下一個控制臺, 而且還可以繼續(xù)輸入命令,但是輸入命令之后還是沒有輸出。這種情況會有很多可能。通常是應(yīng)用程序的系統(tǒng)調(diào)用長時間沒有返回或者是滿足不了應(yīng)用的要求。 以上三種情況,system log的作用都不大。通常日志都不會紀錄。所以只能使用Kernel的Debug工具。 不過Linus比較狠,人說Kernel不需要Debug工具。所以kernel.org中的代碼是沒有debug工具的。不過目前絕大多數(shù)發(fā)行版的kernel都帶了debug工具,而且工具都不一樣。 通常進行kernel debug都需要在出現(xiàn)故障的時候采集vmcore. 就是把故障發(fā)生的時memory dump出來。(還記得Windows 藍屏的時候會出現(xiàn)1%-100%跳動的一個數(shù)字和c盤dump.sys文件, 這回知道干什么的了吧? ) 然后進行分析。也許你會擔心Linux死機了,還怎么dump memory啊,這個不用擔心,Kernel還是留了好幾條路子。其中一個是NMI。 那么到底怎么dump memory呢? 這里用REDHAT為例,RHEL3,RHEL4中都使用了netdump作為采集工具,RHEL5使用kdump作為采集工具。 采集完畢就可以對vmcore進行分析,步驟就不細說了??梢詤⒖既缦挛恼?http://people.redhat.com/anderson/crash_whitepaper/ 但是對于管理員來說,任何一個debug工具都需要代碼開發(fā)的經(jīng)歷才能順利使用。 最后說一句,最近在壇中看到有人看到死機就往應(yīng)用程序上懷疑。這是很好的自我批評的精神,要大力發(fā)揚。 那么,腳本,應(yīng)用程序會不會導致死機? 當然,但是問題還是出在Kernel上。就比如,應(yīng)用程序?qū)懳募?,系統(tǒng)可能會掛起在kernel中的文件系統(tǒng)代碼上。
標簽:桂林 賀州 吉安 錫林郭勒盟 襄陽 河源 陜西 宜賓
上一篇:解決linux不能上傳大于2M文件
下一篇:Linux系統(tǒng)下掛載Windows分區(qū)的方法和技巧
Copyright ? 1999-2012 誠信 合法 規(guī)范的巨人網(wǎng)絡(luò)通訊始建于2005年
蘇ICP備15040257號-8