管理員必備的Linux系統(tǒng)監(jiān)控工具
#1: top - 進(jìn)程活動(dòng)
top提供一個(gè)當(dāng)前運(yùn)行系統(tǒng)實(shí)時(shí)動(dòng)態(tài)的視圖,
也就是正在運(yùn)行進(jìn)程。在默認(rèn)情況下,顯示系統(tǒng)
中CPU使用率最高的任務(wù),并每5秒鐘刷新一次。
#2: vmstat -系統(tǒng)活動(dòng)、硬件及系統(tǒng)信息
使用vmstat命令可以得到關(guān)于進(jìn)程、內(nèi)存、
內(nèi)存分頁、堵塞IO、traps及CPU活動(dòng)的信息。
#3: w - 顯示誰已登錄,他們正在做什么?
w命令顯示系統(tǒng)當(dāng)前用戶及其運(yùn)行進(jìn)程的信息。
#4:uptime - 告訴系統(tǒng)已經(jīng)運(yùn)行了多久?
uptime命令過去只顯示系統(tǒng)運(yùn)行多久,F(xiàn)在,
可以顯示系統(tǒng)運(yùn)行多久、當(dāng)前有多少的用戶登錄、
在過去的1,5,15分鐘里平均負(fù)載時(shí)多少。
#5:ps - 顯示進(jìn)程
ps命令顯示當(dāng)前運(yùn)行進(jìn)程的快照。使用-A或-
e 顯示所有進(jìn)程。ps 與 top 非常相似,但ps 提
供更多的信息。
#6: free - 內(nèi)存使用情況
free命令顯示系統(tǒng)中空閑的、已用的物理內(nèi)存
及swap內(nèi)存,及被內(nèi)核使用的buffer。
#7: iostat - CPU平均負(fù)載,硬盤活動(dòng)
iostat命令可報(bào)告中央處理器(CPU)的統(tǒng)計(jì)
信息,各種設(shè)備、分區(qū)及網(wǎng)絡(luò)文件系統(tǒng)輸入/輸出
的統(tǒng)計(jì)信息。
#8: sar - 搜集和報(bào)告系統(tǒng)活動(dòng)
sar命令用來搜集、報(bào)告和儲(chǔ)存系統(tǒng)活動(dòng)信息。
#9:mpstat - 多處理器使用率
mpstat命令可以顯示所有可用處理器的使用
情況,處理器編號(hào)從 0開始。mpstat -P ALL 顯
示每個(gè)處理器的平均使用率。
#10: pmap - 進(jìn)程的內(nèi)存使用
pmap命令可以顯示進(jìn)程的內(nèi)存映射,使用這
個(gè)命令可以找出造成內(nèi)存瓶頸的原因。
#11:netstat - 網(wǎng)絡(luò)相關(guān)信息
netstat 可以顯示網(wǎng)絡(luò)鏈接、路由表信息、接
口統(tǒng)計(jì)信息、偽裝鏈接和多播成員(multicast
memberships)
#12:ss - 網(wǎng)絡(luò)相關(guān)信息
ss命令用來顯示網(wǎng)絡(luò)套接字信息,它允許顯示
類似netstat一樣的信息。
#13: iptraf - 網(wǎng)絡(luò)實(shí)時(shí)信息
iptraf是一個(gè)可交互式的IP網(wǎng)絡(luò)監(jiān)控工具。它
可以生成多種網(wǎng)絡(luò)統(tǒng)計(jì)信息包括:TCP 信息、
UDP數(shù)量、ICMP和OSPF信息、以太網(wǎng)負(fù)載信
息、節(jié)點(diǎn)狀態(tài)、IP校驗(yàn)錯(cuò)誤等。
#14:tcpdump:詳細(xì)的網(wǎng)絡(luò)流量分析
tcpdump 是一個(gè)簡(jiǎn)單網(wǎng)絡(luò)流量轉(zhuǎn)儲(chǔ)工具,然
而要使用好需要對(duì)TCP/IP協(xié)議非常熟悉。
#15:strace - 系統(tǒng)調(diào)用
追蹤系統(tǒng)調(diào)用和型號(hào),這對(duì)于調(diào)試 Web服務(wù)
器和其他服務(wù)器非常有用。了解怎樣追蹤進(jìn)程和
他功能。
#16:/proc文件系統(tǒng) - 各種內(nèi)核信息
/proc目錄下文件提供了很多不同硬件設(shè)備和
內(nèi)核的詳細(xì)信息。
#17:Nagios - 服務(wù)器及網(wǎng)絡(luò)監(jiān)控
Nagios 是一款非常流行的系統(tǒng)及網(wǎng)絡(luò)監(jiān)控軟
件。你可以輕松監(jiān)控所有的主機(jī)、網(wǎng)絡(luò)設(shè)備及服
務(wù)。它能在發(fā)生故障和重新恢復(fù)后發(fā)送警訊。
#18:Cacti - 基于Web的監(jiān)控工具
Cacti是一套完成的網(wǎng)絡(luò)圖形化解決方案,基
于RRDTool的資料存儲(chǔ)和圖形化功能。Cacti提
供一個(gè)快速的輪詢器、進(jìn)階的圖形化模板、多種
數(shù)據(jù)采集方法和用戶管理功能。這些功能都擁有
非常友好易用的界面,確?梢圆渴鹪谝粋(gè)包含
數(shù)百臺(tái)設(shè)備的復(fù)雜網(wǎng)絡(luò)中。它提供關(guān)于網(wǎng)絡(luò)
CPU、內(nèi)存、已登錄用戶、Apache、DNS等信
息。
#19:KDE System Guard
KSysguard 是在 KDE 桌面下一個(gè)網(wǎng)絡(luò)化的系
統(tǒng)監(jiān)控工具。這個(gè)工具可以通過SSH會(huì)話運(yùn)行。
它提供很多功能,例如可以監(jiān)控本機(jī)和遠(yuǎn)程主機(jī)
的客戶端/服務(wù)器架構(gòu),前端圖形界面使用所謂傳
感器得到信息并展現(xiàn)出來。傳感器返回的可以是
一個(gè)簡(jiǎn)單的數(shù)值或是一組表格的信息。針對(duì)不同
的信息類型,提供一個(gè)或多個(gè)顯示。這些顯示被
組織多個(gè)工作表中,可以工作表可以獨(dú)體儲(chǔ)存和
加載。所以,KSysguard不只是一個(gè)簡(jiǎn)單的任務(wù)
管理器,還是一個(gè)可以控制多臺(tái)服務(wù)器的強(qiáng)大工
具。
#20:Gnome System Monitor
System Monitor可以顯示系統(tǒng)基本信息、監(jiān)
控系統(tǒng)進(jìn)程、系統(tǒng)資源及文件系統(tǒng)使用率。你也
可以使用System Monitor監(jiān)控和修改系統(tǒng)行為。
盡管沒有KDE System Guard功能強(qiáng)大,但其提
供的基本信息對(duì)于入門用戶還是非常有用的。
Linux常用監(jiān)控命令簡(jiǎn)介 - top
指令介紹
-b : 批次模式運(yùn)行。
-c : 顯示執(zhí)行任務(wù)的命令行。
-d : 設(shè)定延遲時(shí)間
-h : 幫助
-H : 顯示線程。將顯示所有進(jìn)程產(chǎn)生的線程。
-i : 顯示空閑的進(jìn)程。
-n : 執(zhí)行次數(shù)。一般與-b搭配使用
-u : 監(jiān)控指定用戶相關(guān)進(jìn)程
-U : 監(jiān)控指定用戶相關(guān)進(jìn)程
-p : 監(jiān)控指定的進(jìn)程。
-s : 安全模式操作
-S : 累計(jì)時(shí)間模式
-v : 顯示top版本,然后退出。
-M : 自動(dòng)顯示內(nèi)存單位(k/M/G)
top作為日常管理工作中最常用也是最重要的
Linux 系統(tǒng)監(jiān)控工具之一,可以動(dòng)態(tài)觀察系統(tǒng)進(jìn)
程狀況。top命令顯示的項(xiàng)目很多,默認(rèn)值是每
5秒更新一次,按q鍵可以退出。顯示的各項(xiàng)目
為:
輸出數(shù)值解讀 為:
15:06:57 up 129 days, 19:03, 5 users, load average: 1.21, 1.20, 1.25
uptime 該項(xiàng)顯示的是系統(tǒng)啟動(dòng)時(shí)間、已經(jīng)運(yùn)行的時(shí)間和三個(gè)平均負(fù)載值(最近1秒,5秒,15秒的
負(fù)載值)。
222 processes: 219 sleeping, 2 running, 1 zombie, 0 stopped
processes 自最近一次刷新以來的運(yùn)行進(jìn)程總數(shù)。這些進(jìn)程被分為正在運(yùn)行的,休眠的,停止的。
CPU states: cpu user nice system irq softirq iowait idle
total 0.9% 0.0% 27.4% 0.0% 0.0% 0.2% 71.2%
cpu00 1.9% 0.0% 19.4% 0.0% 0.0% 0.0% 78.6%
cpu01 0.0% 0.0% 33.0% 0.0% 0.0% 0.0% 66.9%
cpu02 1.9% 0.0% 22.3% 0.0% 0.0% 0.9% 74.7%
cpu03 0.0% 0.0% 35.2% 0.0% 0.0% 0.0% 64.7%
CPU states 顯示用戶模式,系統(tǒng)模式,優(yōu)先級(jí)進(jìn)程(只有優(yōu)先級(jí)為負(fù)的列入考慮)和閑置等各種
情況所占用CPU時(shí)間的百分比。優(yōu)先級(jí)進(jìn)程所消耗的時(shí)間也被列入到用戶和系統(tǒng)的時(shí)間中,所以總
的百分比將大于100%。
Mem: 16214336k av, 15682832k used, 531504k free, 0k shrd, 215016k buff
10896844k actv, 3379680k in_d, 446432k in_c
Mem 內(nèi)存使用情況統(tǒng)計(jì),其中包括總的可用內(nèi)存,空閑內(nèi)存,已用內(nèi)存,共享內(nèi)存和緩存所占內(nèi)存
的情況。
Swap: 10482404k av, 0k used, 10482404k free 14856500k cached
Swap 交換空間統(tǒng)計(jì),其中包括總的交換空間,可用交換空間,已用交換空間。
PID USER PRI NI SIZE RSS SHARE STAT %CPU %MEM TIME CPU COMMAND
27869 root 25 0 460M 460M 455M R 25.0 2.9 12559m 1 vmware-vmx
31819 root 16 0 6016 6016 5048 S 1.6 0.0 17573m 2 magicdev
27837 root 15 -10 460M 460M 455M S < 0.7 2.9 1328m 0 vmware-vmx
27868 root 15 -10 460M 460M 455M S < 0.3 2.9 644:35 3 vmware-vmx
PID 每個(gè)進(jìn)程的ID。PPID 每個(gè)進(jìn)程的父進(jìn)程ID。UID 每個(gè)進(jìn)程所有者的UID 。
USER 每個(gè)進(jìn)程所有者的用戶名。
PRI 每個(gè)進(jìn)程的優(yōu)先級(jí)別。
NI 該進(jìn)程的優(yōu)先級(jí)值。
SIZE 該進(jìn)程的代碼大小加上數(shù)據(jù)大小再加上堆?臻g大小的總數(shù)。單位是KB。
TSIZE 該進(jìn)程的代碼大小。對(duì)于內(nèi)核進(jìn)程這是一個(gè)很奇怪的值。
DSIZE 數(shù)據(jù)和堆棧的大小。
TRS 文本駐留大小。
D 被標(biāo)記為“不干凈”的頁項(xiàng)目。
LIB 使用的庫頁的大小。對(duì)于ELF進(jìn)程沒有作用。
RES 該進(jìn)程占用的物理內(nèi)存的總數(shù)量,單位是KB。
SHARE 該進(jìn)程使用共享內(nèi)存的數(shù)量。
STAT 該進(jìn)程的狀態(tài)。S=休眠;D=不可中斷的休眠;R=運(yùn)行;Z=僵死;T=停止或跟蹤。