linux系统查看CPU使用含义、IO、内存、硬盘使用、负载
一、Linux系統查看CPU使用率命令
在linux的系統維護中,可能需要經常查看cpu使用率,分析系統整體的運行情況。而監控CPU的性能一般包括以下3點:運行隊列、CPU使用率和上下文切換。
對于每一個CPU來說運行隊列最好不要超過3,例如,如果是雙核CPU就不要超過6。如果隊列長期保持在3以上,說明任何一個進程運行時都不能馬上得到cpu的響應,這時可能需要考慮升級cpu。另外滿負荷運行cpu的使用率最好是user空間保持在65%~70%,system空間保持在30%,空閑保持在0%~5% 。
下面總結下查看CPU使用率常用的幾個命令。
1、top
這個命令很常用,在第三行有顯示CPU當前的使用情況。
首先介紹top中一些字段的含義:
VIRT:virtual memory usage 虛擬內存
1、進程“需要的”虛擬內存大小,包括進程使用的庫、代碼、數據等
2、假如進程申請100m的內存,但實際只使用了10m,那么它會增長100m,而不是實際的使用量
RES:resident memory usage 常駐內存
1、進程當前使用的內存大小,但不包括swap out
2、包含其他進程的共享
3、如果申請100m的內存,實際使用10m,它只增長10m,與VIRT相反
4、關于庫占用內存的情況,它只統計加載的庫文件所占內存大小
SHR:shared memory 共享內存
1、除了自身進程的共享內存,也包括其他進程的共享內存
2、雖然進程只使用了幾個共享庫的函數,但它包含了整個共享庫的大小
3、計算某個進程所占的物理內存大小公式:RES – SHR
4、swap out后,它將會降下來
DATA
1、數據占用的內存。如果top沒有顯示,按f鍵可以顯示出來。
2、真正的該程序要求的數據空間,是真正在運行中要使用的。
top 運行中可以通過 top 的內部命令對進程的顯示方式進行控制。內部命令如下:
s – 改變畫面更新頻率
l – 關閉或開啟第一部分第一行 top 信息的表示
t – 關閉或開啟第一部分第二行 Tasks 和第三行 Cpus 信息的表示
m – 關閉或開啟第一部分第四行 Mem 和 第五行 Swap 信息的表示
N – 以 PID 的大小的順序排列表示進程列表
P – 以 CPU 占用率大小的順序排列進程列表
M – 以內存占用率大小的順序排列進程列表
h – 顯示幫助
n – 設置在進程列表所顯示進程的數量
q – 退出 top
s – 改變畫面更新周期
序號 列名 含義
a PID 進程id
b PPID 父進程id
c RUSER Real user name
d UID 進程所有者的用戶id
e USER 進程所有者的用戶名
f GROUP 進程所有者的組名
g TTY 啟動進程的終端名。不是從終端啟動的進程則顯示為 ?
h PR 優先級
i NI nice值。負值表示高優先級,正值表示低優先級
j P 最后使用的CPU,僅在多CPU環境下有意義
k %CPU 上次更新到現在的CPU時間占用百分比
l TIME 進程使用的CPU時間總計,單位秒
m TIME+ 進程使用的CPU時間總計,單位1/100秒
n %MEM 進程使用的物理內存百分比
o VIRT 進程使用的虛擬內存總量,單位kb。VIRT=SWAP+RES
p SWAP 進程使用的虛擬內存中,被換出的大小,單位kb。
q RES 進程使用的、未被換出的物理內存大小,單位kb。RES=CODE+DATA
r CODE 可執行代碼占用的物理內存大小,單位kb
s DATA 可執行代碼以外的部分(數據段+棧)占用的物理內存大小,單位kb
t SHR 共享內存大小,單位kb
u nFLT 頁面錯誤次數
v nDRT 最后一次寫入到現在,被修改過的頁面數。
w S 進程狀態。(D=不可中斷的睡眠狀態,R=運行,S=睡眠,T=跟蹤/停止,Z=僵尸進程)
x COMMAND 命令名/命令行
y WCHAN 若該進程在睡眠,則顯示睡眠中的系統函數名
z Flags 任務標志,參考 sched.h
默認情況下僅顯示比較重要的 PID、USER、PR、NI、VIRT、RES、SHR、S、%CPU、%MEM、TIME+、COMMAND 列。可以通過下面的快捷鍵來更改顯示內容。
通過 f 鍵可以選擇顯示的內容。按 f 鍵之后會顯示列的列表,按 a-z 即可顯示或隱藏對應的列,最后按回車鍵確定。
按 o 鍵可以改變列的顯示順序。按小寫的 a-z 可以將相應的列向右移動,而大寫的 A-Z 可以將相應的列向左移動。最后按回車鍵確定。
按大寫的 F 或 O 鍵,然后按 a-z 可以將進程按照相應的列進行排序。而大寫的 R 鍵可以將當前的排序倒轉。
top使用方法:
使用格式:
top [-] [d] [p] [q] [c] [C] [S] [s] [n]
參數說明:
d:指定每兩次屏幕信息刷新之間的時間間隔。當然用戶可以使用s交互命令來改變之。
p:通過指定監控進程ID來僅僅監控某個進程的狀態。
q:該選項將使top沒有任何延遲的進行刷新。如果調用程序有超級用戶權限,那么top將以盡可能高的優先級運行。
S:指定累計模式。
s:使top命令在安全模式中運行。這將去除交互命令所帶來的潛在危險。
i:使top不顯示任何閑置或者僵死進程。
c:顯示整個命令行而不只是顯示命令名。
常用命令說明:
Ctrl+L:擦除并且重寫屏幕
K:終止一個進程。系統將提示用戶輸入需要終止的進程PID,以及需要發送給該進程什么樣的信號。一般的終止進程可以使用15信號;如果不能正常結束那就使用信號9強制結束該進程。默認值是信號15。在安全模式中此命令被屏蔽。
i:忽略閑置和僵死進程。這是一個開關式命令。
q:退出程序
r:重新安排一個進程的優先級別。系統提示用戶輸入需要改變的進程PID以及需要設置的進程優先級值。輸入一個正值將使優先級降低,反之則可以使該進程擁有更高的優先權。默認值是10。
S:切換到累計模式。
s:改變兩次刷新之間的延遲時間。系統將提示用戶輸入新的時間,單位為s。如果有小數,就換算成m s。輸入0值則系統將不斷刷新,默認值是5 s。需要注意的是如果設置太小的時間,很可能會引起不斷刷新,從而根本來不及看清顯示的情況,而且系統負載也會大大增加。
f或者F:從當前顯示中添加或者刪除項目。
o或者O:改變顯示項目的順序
l:切換顯示平均負載和啟動時間信息。
m:切換顯示內存信息。
t:切換顯示進程和CPU狀態信息。
c:切換顯示命令名稱和完整命令行。
M:根據駐留內存大小進行排序。
P:根據CPU使用百分比大小進行排序。
T:根據時間/累計時間進行排序。
W:將當前設置寫入~/.toprc文件中。
輸入top命令:
如上所示,top命令可以看到總體的系統運行狀態和cpu的使用率 。
%us:表示用戶空間程序的cpu使用率(沒有通過nice調度)
%sy:表示系統空間的cpu使用率,主要是內核程序。
%ni:表示用戶空間且通過nice調度過的程序的cpu使用率。
%id:空閑cpu
%wa:cpu運行時在等待io的時間
%hi:cpu處理硬中斷的數量
%si:cpu處理軟中斷的數量
%st:被虛擬機偷走的cpu
1.1 系統運行時間和平均負載:
top命令的頂部顯示與uptime命令相似的輸出
這些字段顯示:
- 當前時間
- 系統已運行的時間
- 當前登錄用戶的數量
- 相應最近5、10和15分鐘內的平均負載。
可以使用'l'命令切換uptime的顯示。
21:45:11 — 當前系統時間
0 days, 4:54 — 系統已經運行了4小時54分鐘(在這期間沒有重啟過)
2 users — 當前有2個用戶登錄系統
load average:0.24, 0.15, 0.19 — load average后面的三個數分別是5分鐘、10分鐘、15分鐘的負載情況。
load average數據是每隔5秒鐘檢查一次活躍的進程數,然后按特定算法計算出的數值。如果這個數除以邏輯CPU的數量,結果高于5的時候就表明系統在超負荷運轉了。
1.2 任務:
Tasks — 任務(進程),系統現在共有144個進程,其中處于運行中的有1個,143個在休眠(sleep),stoped狀態的有0個,zombie狀態(僵尸)的有0個。
第二行顯示的是任務或者進程的總結。進程可以處于不同的狀態。這里顯示了全部進程的數量。除此之外,還有正在運行、睡眠、停止、僵尸進程的數量(僵尸是一種進程的狀態)。這些進程概括信息可以用't'切換顯示
1.3 CPU 狀態:
這里顯示不同模式下所占cpu時間百分比,這些不同的cpu時間表示:
- us, user: 運行(未調整優先級的) 用戶進程的CPU時間
- sy,system: 運行內核進程的CPU時間
- ni,niced:運行已調整優先級的用戶進程的CPU時間
- wa,IO wait: 用于等待IO完成的CPU時間
- hi:處理硬件中斷的CPU時間
- si: 處理軟件中斷的CPU時間
- st:這個虛擬機被hypervisor偷去的CPU時間(譯注:如果當前處于一個hypervisor下的vm,實際上hypervisor也是要消耗一部分CPU處理時間的)。
可以使用't'命令切換顯示。
1.3% us — 用戶空間占用CPU的百分比。
1.0% sy — 內核空間占用CPU的百分比。
0.0% ni — 改變過優先級的進程占用CPU的百分比
97.3% id — 空閑CPU百分比
0.0% wa — IO等待占用CPU的百分比
0.3% hi — 硬中斷(Hardware IRQ)占用CPU的百分比
0.0% si — 軟中斷(Software Interrupts)占用CPU的百分比
在這里CPU的使用比率和windows概念不同,如果你不理解用戶空間和內核空間,需要充充電了。
1.4 內存使用:
接下來兩行顯示內存使用率,有點像'free'命令。第一行是物理內存使用,第二行是虛擬內存使用(交換空間)。
物理內存顯示如下:全部可用內存、已使用內存、空閑內存、緩沖內存。相似地:交換部分顯示的是:全部、已使用、空閑和緩沖交換空間。
內存顯示可以用'm'命令切換。
509248k total — 物理內存總量(509M)
495964k used — 使用中的內存總量(495M)
13284k free — 空閑內存總量(13M)
25364k buffers — 緩存的內存量 (25M)
swap交換分區
492536k total — 交換區總量(492M)
11856k used — 使用的交換區總量(11M)
480680k free — 空閑交換區總量(480M)
202224k cached — 緩沖的交換區總量(202M)
這里要說明的是不能用windows的內存概念理解這些數據,如果按windows的方式此臺服務器“危矣”:8G的內存總量只剩下530M的可用內存。Linux的內存管理有其特殊性,復雜點需要一本書來說明,這里只是簡單說點和我們傳統概念(windows)的不同。
第四行中使用中的內存總量(used)指的是現在系統內核控制的內存數,空閑內存總量(free)是內核還未納入其管控范圍的數量。納入內核管理的內存不見得都在使用中,還包括過去使用過的現在可以被重復利用的內存,內核并不把這些可被重新使用的內存交還到free中去,因此在linux上free內存會越來越少,但不用為此擔心。
如果出于習慣去計算可用內存數,這里有個近似的計算公式:第四行的free + 第四行的buffers + 第五行的cached,按這個公式此臺服務器的可用內存:
13284+25364+202224 = 240M。
對于內存監控,在top里我們要時刻監控第五行swap交換分區的used,如果這個數值在不斷的變化,說明內核在不斷進行內存和swap的數據交換,這是真正的內存不夠用了。
2、vmstat
之前在本博客中有介紹過vmstat的使用,詳細使用和參數介紹參考網址:http://www.sijitao.net/1925.html 。
[root@li676-235 ~]# vmstat 1 5 procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu-----r b swpd free buff cache si so bi bo in cs us sy id wa st2 0 34792 68376 147688 356132 16 16 421 385 2 2 5 4 91 1 03 0 34792 97368 147688 326884 0 0 0 0 133 134 15 6 79 0 01 0 34792 62432 147696 360704 0 0 0 88 267 278 63 18 19 0 00 0 34792 97160 147696 326904 0 0 0 0 71 82 12 4 84 0 01 0 34792 56572 147696 364540 0 0 0 4 261 246 61 23 16 0 03、sar
sar命令語法和vmstat一樣。命令不存在時需要安裝sysstat包,這個包很有用。
CPU使用率
例如每1秒采集一次CPU使用率,共采集5次。
[root@li676-235 ~]# sar -u 1 5 Linux 3.18.5-x86_64-linode52 (li676-235) 07/20/2015 _x86_64_ (1 CPU) 02:41:25 PM CPU %user %nice %system %iowait %steal %idle 02:41:26 PM all 64.71 0.00 18.63 0.00 0.98 15.69 02:41:27 PM all 29.47 0.00 22.11 14.74 0.00 33.68 02:41:28 PM all 67.33 0.00 31.68 0.99 0.00 0.00 02:41:29 PM all 7.00 0.00 2.00 0.00 0.00 91.00 02:41:30 PM all 69.00 0.00 23.00 0.00 0.00 8.00 Average: all 47.79 0.00 19.48 3.01 0.20 29.52和top一樣,可以看到所有cpu的使用情況。如果需要查看某顆cpu的使用可以用-P參數。例如指定顯示0號cpu 的使用情況。
[root@li676-235 ~]# sar -P 0 -u 1 5 Linux 3.18.5-x86_64-linode52 (li676-235) 07/20/2015 _x86_64_ (1 CPU) 02:45:14 PM CPU %user %nice %system %iowait %steal %idle 02:45:15 PM 0 44.00 0.00 52.00 4.00 0.00 0.00 02:45:16 PM 0 9.28 0.00 26.80 62.89 1.03 0.00 02:45:17 PM 0 3.06 0.00 14.29 81.63 1.02 0.00 02:45:18 PM 0 4.12 0.00 22.68 72.16 1.03 0.00 02:45:19 PM 0 4.12 0.00 22.68 72.16 1.03 0.00 Average: 0 13.09 0.00 27.81 58.28 0.82 0.00進程隊列長度和平均負載狀態
例如每1秒采集一次,共采集5次。
[root@li676-235 ~]# sar -q 1 5 Linux 3.18.5-x86_64-linode52 (li676-235) 07/20/2015 _x86_64_ (1 CPU) 02:48:47 PM runq-sz plist-sz ldavg-1 ldavg-5 ldavg-15 02:48:48 PM 1 133 0.34 0.43 0.41 02:48:49 PM 2 132 0.34 0.43 0.41 02:48:50 PM 1 133 0.34 0.43 0.41 02:48:51 PM 2 134 0.31 0.42 0.40 02:48:52 PM 1 133 0.31 0.42 0.40 Average: 1 133 0.33 0.43 0.41輸出項:
runq-sz:運行隊列的長度(等待運行的進程數)
plist-sz:進程列表中進程(processes)和線程(threads)的數量
ldavg-1:最后1分鐘的系統平均負載(System load average)
ldavg-5:過去5分鐘的系統平均負載
ldavg-15:過去15分鐘的系統平均負載
進程創建的平均值和上下文切換的次數
例如每1秒收集一次,共收集5次。
[root@li676-235 ~]# sar -w 1 5 Linux 3.18.5-x86_64-linode52 (li676-235) 07/20/2015 _x86_64_ (1 CPU) 02:54:03 PM proc/s cswch/s 02:54:04 PM 1.01 156.57 02:54:05 PM 1.00 132.00 02:54:06 PM 2.00 201.00 02:54:07 PM 2.02 126.26 02:54:08 PM 2.00 114.00 Average: 1.61 145.98sar命令也可以獲取過去指定日期的性能參數。
[root@li676-235 ~]# sar -u -f /var/log/sa/sa20 Linux 3.18.5-x86_64-linode52 (li676-235) 07/20/2015 _x86_64_ (1 CPU) 01:10:01 PM CPU %user %nice %system %iowait %steal %idle 01:20:02 PM all 25.78 0.00 8.88 3.59 0.15 61.60 01:30:01 PM all 26.06 0.00 9.96 3.33 0.10 60.55 01:40:01 PM all 25.73 0.00 9.17 3.70 0.09 61.32 01:50:01 PM all 25.70 0.00 9.50 2.79 0.12 61.89 02:00:01 PM all 26.70 0.00 9.73 2.20 0.10 61.28 02:10:01 PM all 26.16 0.00 9.56 4.34 0.11 59.82 02:20:01 PM all 25.49 0.00 9.61 2.76 0.07 62.07 02:30:01 PM all 26.47 0.00 9.94 0.64 0.30 62.65 02:40:02 PM all 27.32 0.00 10.37 3.86 0.15 58.30 02:50:02 PM all 26.98 0.00 10.38 4.56 0.13 57.95 Average: all 26.24 0.00 9.71 3.18 0.13 60.744、mpstat
這個命令也在sysstat包中,語法類似。
例如每1秒收集一次,共5次。
[root@li676-235 ~]# mpstat 1 5 Linux 3.18.5-x86_64-linode52 (li676-235) 07/20/2015 _x86_64_ (1 CPU) 03:01:18 PM CPU %usr %nice %sys %iowait %irq %soft %steal %guest %idle 03:01:19 PM all 52.53 0.00 23.23 0.00 0.00 0.00 0.00 0.00 24.24 03:01:20 PM all 21.00 0.00 4.00 0.00 0.00 0.00 0.00 0.00 75.00 03:01:21 PM all 53.00 0.00 18.00 0.00 0.00 0.00 0.00 0.00 29.00 03:01:22 PM all 26.00 0.00 3.00 0.00 0.00 0.00 0.00 0.00 71.00 03:01:23 PM all 46.00 0.00 18.00 0.00 0.00 0.00 0.00 0.00 36.00 Average: all 39.68 0.00 13.23 0.00 0.00 0.00 0.00 0.00 47.09cpu使用情況比sar更加詳細些,也可以用-P指定某顆cpu 。
5、iostat
這個命令主要用來查看io使用情況,也可以來查看cpu,個人感覺不常用。
[root@li676-235 ~]# iostat -c 1 2 Linux 3.18.5-x86_64-linode52 (li676-235) 07/20/2015 _x86_64_ (1 CPU) avg-cpu: %user %nice %system %iowait %steal %idle4.53 0.01 3.81 0.63 0.04 90.99 avg-cpu: %user %nice %system %iowait %steal %idle38.00 0.00 14.00 0.00 0.00 48.006、dstat
每秒cpu使用率情況獲取
[root@li676-235 ~]# dstat -c ----total-cpu-usage---- usr sys idl wai hiq siq5 4 91 1 0 027 11 62 0 0 052 11 37 0 0 026 10 63 0 0 150 13 37 0 0 121 6 72 0 0 0最占cpu的進程獲取
[root@li676-235 ~]# dstat --top-cpu -most-expensive-cpu process mysqld 1.5 php-fpm: pool 24 mysqld 59二、內存的查看
# free? 或者? free -m? ? ? ?//換算成MB? ? ? ? ? ? ?free -g? ? ? ? ? ? ? ? //換算成GB
?
三、查看系統負載
# uptime
四、硬盤使用
#? df -h? ? ? ? ? ? 或者? ?#? ?df -Th
?
五、查看cpu IO
#? iostat -k 1 3
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
總結
以上是生活随笔為你收集整理的linux系统查看CPU使用含义、IO、内存、硬盘使用、负载的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: linux资源利用率检查_使用free命
- 下一篇: Windows 命令窗口(cmd)命令不