背景-線上告警
線上一臺服務(wù)器告警,磁盤利用率 disk.util > 90,并持續(xù)告警。
登錄該服務(wù)器后通過iostat -x 1 10查看了相關(guān)磁盤使用信息。相關(guān)截圖如下:
# 如果沒有 iostat 命令,那么使用 yum install sysstat 進(jìn)行安裝
# iostat -x 1 10
由上圖可知,vdb磁盤的 %util【IO】幾乎都在100%,原因是頻繁的讀取數(shù)據(jù)造成的。
其他字段說明
Device:設(shè)備名稱
tps:每秒的IO讀、寫請求數(shù)量,多個邏輯請求可以組合成對設(shè)備的單個I/O請求。
Blk_read/s (kB_read/s, MB_read/s):從設(shè)備讀取的數(shù)據(jù)量,以每秒若干塊(千字節(jié)、兆字節(jié))表示。塊相當(dāng)于扇區(qū),因此塊大小為512字節(jié)。
Blk_wrtn/s (kB_wrtn/s, MB_wrtn/s):寫入設(shè)備的數(shù)據(jù)量,以每秒若干塊(千字節(jié)、兆字節(jié))表示。塊相當(dāng)于扇區(qū),因此塊大小為512字節(jié)。
Blk_read (kB_read, MB_read):讀取塊的總數(shù)(千字節(jié)、兆字節(jié))。
Blk_wrtn (kB_wrtn, MB_wrtn):寫入塊的總數(shù)(千字節(jié),兆字節(jié))。
rrqm/s:每秒合并到設(shè)備的讀請求數(shù)。即delta(rmerge)/s
wrqm/s:每秒合并到設(shè)備的寫入請求數(shù)。即delta(wmerge)/s
r/s:每秒完成的讀I/O設(shè)備次數(shù)。即delta(rio)/s
w/s:每秒完成的寫I/0設(shè)備次數(shù)。即delta(wio)/s
rsec/s (rkB/s, rMB/s):每秒讀取設(shè)備的扇區(qū)數(shù)(千字節(jié)、兆字節(jié))。每扇區(qū)大小為512字節(jié)
wsec/s (wkB/s, wMB/s):每秒寫入設(shè)備的扇區(qū)數(shù)(千字節(jié)、兆字節(jié))。每扇區(qū)大小為512字節(jié)
avgrq-sz:平均每次設(shè)備I/O操作的數(shù)據(jù)量(扇區(qū)為單位)。即delta(rsec+wsec)/delta(rio+wio)
avgqu-sz:平均每次發(fā)送給設(shè)備的I/O隊列長度。
await:平均每次IO請求等待時間。(包括等待隊列時間和處理時間,毫秒為單位)
r_await:平均每次IO讀請求等待時間。(包括等待隊列時間和處理時間,毫秒為單位)
w_await:平均每次IO寫請求等待時間。(包括等待隊列時間和處理時間,毫秒為單位)
svctm:平均每次設(shè)備I/O操作的處理時間(毫秒)。警告!不要再相信這個字段值,這個字段將在將來的sysstat版本中刪除。
%util:一秒中有百分之多少的時間用于I/O操作,或者說一秒中有多少時間I/O隊列是非空的。當(dāng)該值接近100%時,設(shè)備飽和發(fā)生。
找到 IO 占用高的進(jìn)程
通過 iotop 命令
如果沒有該命令,請通過yum install iotop進(jìn)行安裝。
# iotop -oP
通過這個命令可以看見比較詳細(xì)信息,如:進(jìn)程號,磁盤讀取量,磁盤寫入量,IO百分比,涉及到的命令是什么「兩個都是 grep 命令造成的IO讀取量大」。
通過 pidstat 命令
# 命令的含義:展示I/O統(tǒng)計,每秒更新一次
# pidstat -d 1
可見其中 grep 命令占用了大量的讀IO,之后可根據(jù) PID 查看相關(guān)進(jìn)程信息。
說明:本圖與上圖的PID不同,原因是上圖涉及的進(jìn)程執(zhí)行完了,本圖是之后執(zhí)行產(chǎn)生的進(jìn)程【都執(zhí)行的同一個腳本】。
總結(jié)
以上所述是小編給大家介紹的Linux 查看磁盤IO并找出占用IO讀寫很高的進(jìn)程,希望對大家有所幫助!