sar命令一些用法

一、sar介绍
sar是用于监控Linux系统各个性能的优秀工具,包括:文件的读写情况、系统调用的使用情况、磁盘I/O、CPU效率、内存使用状况、进程活动及IPC有关的活动等。

性能数据
整体CPU使用统计
各个CPU使用统计
内存使用情况统计
整体I/O情况
各个I/O设备情况
网络统计

sar -n DEV  2 3
-n:类型,要获取的类型的指标数据
DEV:类型参数
2:时间间隔,多少秒采集一次数据
3:检测次数

二、CPU资源监控
1、整体CPU使用统计(-u)
使用-u选项,sar输出整体CPU的使用情况,不加选项时,默认使用的就是-u选项。以下命令显示采样时间为3s,采样次数为2次,整体CPU的使用情况:
sar 3 2 
或者 
sar -u 3 2

选项 说明
CPU all表示统计信息为所有CPU的平均值。
%usr CPU在用户态执行进程的时间百分比。
%nice CPU在用户态模式下,用于nice操作,所占用CPU总时间的百分比。
%system CPU处在内核态执行进程的时间百分比。
%iowait CPU用于等待I/O操作占用CPU总时间的百分比。
%steal 管理程序(hypervisor)为另一个虚拟进程提供服务而等待虚拟CPU的百分比。
%idle CPU空闲时间百分比。  

若 %iowait 的值过高,表示硬盘存在I/O瓶颈
若 %idle 的值高但系统响应慢时,有可能是 CPU 等待分配内存,此时应加大内存容量
若 %idle 的值持续低于1,则系统的 CPU 处理能力相对较低,表明系统中最需要解决的资源是 CPU

2、各个CPU实用统计(-P)
使用-P ALL选项指示对每个内核输出统计信息,这里显示一共有4个CPU,分别是0、1、2、3对应指定每一个CPU的使用情况和信息
sar -P ALL
sar -P ALL 1 1
也可以通过指定CPU的核数来查询单独每个内核的显示(从0开始计算第一个内核)
sar -P 0
sar -P 0 1 1
可以将CPU的使用情况保存到文件中(test文件是提前创建好的)
sar -u -o test 4 3
sar -u 0f test

三、内存监控
1、内存和交换空间的监控(-r)
使用-r选项可显示内存统计信息,以下命令显示以1秒为采样时间,显示2次内存信息:
sar -r 1 2

选项  说明
kbmemfree 这个值和free命令中的free值基本一致,所以它不包括buffer和cache的空间
kbmemused 这个值和free命令中的used值基本一致,所以它包括buffer和cache的空间
%memused 这个值是kbmemused和内存总量(不包括swap)的一个百分比
kbbuffers 这个值就是free命令中的buffer
kbcached 这个值就是free命令中的cache
kbcommit 保证当前系统所需要的内存,即为了确保不溢出而需要的内存(RAM+swap)
%commit 这个值是kbcommit与内存总量(包括swap)的一个百分比

2、内存分页监控(-B)
使用-B选项可以分页监控内存,每5秒采样一次,连续3次,显示如下:
sar -B 5 3

选项  说明
pgpgin/s 表示每秒从磁盘或SWAP置换到内存的字节数(KB)
pgpgout/s 表示每秒从内存置换到磁盘或SWAP的字节数(KB)
fault/s 每秒钟系统产生的缺页数,即主缺页与次缺页之和(major + minor)
majflt/s 每秒钟产生的主缺页数
pgfree/s 每秒被放入空闲队列中的页个数
pgscank/s 每秒被kswapd扫描的页个数
pgscand/s 每秒直接被扫描的页个数
pgsteal/s 每秒钟从cache中被清除来满足内存需要的页个数
%vmeff 每秒清除的页(pgsteal)占总扫描页(pgscank+pgscand)的百分比

四、I/O监控
1、I/O整体情况监控(-b)
使用-b选项,可以显示磁盘I/O的使用情况:
sar -b 2 3

选项 说明
tps 每秒钟物理设备的 I/O 传输总量
rtps 每秒钟从物理设备读入的数据总量
wtps 每秒钟向物理设备写入的数据总量
bread/s 每秒钟从物理设备读入的数据量,单位为 块/s
bwrtn/s 每秒钟向物理设备写入的数据量,单位为 块/s

2、设备使用情况监控(-d)
每2秒采样一次,连续采样1次,报告设备使用情况,需键入如下命令:
sar -d -p 2 1  #-d表示输出每一块设备的信息,参数-p可以打印出sda,hdc等磁盘设备名称,如果不用参数-p,设备节点则有可能是dev8-0,dev22-0

选项 说明
tps 每秒从物理磁盘I/O的次数.多个逻辑请求会被合并为一个I/O磁盘请求,一次传输的大小是不确定的
rd_sec/s 每秒读扇区的次数
wr_sec/s 每秒写扇区的次数
avgrq-sz 平均每次设备I/O操作的数据大小(扇区)
avgqu-sz 磁盘请求队列的平均长度
await 从请求磁盘操作到系统完成处理,每次请求的平均消耗时间,包括请求队列等待时间,单位是毫秒(1秒=1000毫秒)
svctm 系统处理每次请求的平均时间,不包括在请求队列中消耗的时间
%util I/O请求占CPU的百分比,比率越大,说明越饱和

如果 %util 接近 100%,说明产生的I/O请求太多,I/O系统已经满负荷,该磁盘可能存在瓶颈
如果 svctm 比较接近 await,说明 I/O 几乎没有等待时间;如果 await 远大于 svctm,说明I/O 队列太长,io响应太慢,则需要进行必要优化
如果avgqu-sz比较大,也表示有大量io在等待
avgqu-sz 的值较低时,设备的利用率较高
当%util的值接近 100% 时,表示设备带宽已经占满

3、进程队列长度和平均负载状态监控(-q)
每3秒采样一次,连续采样3次,监控进程队列长度和平均负载状态:
sar -q 3 3

选项 说明
runq-sz 运行队列的长度(等待运行的进程数)
plist-sz 进程列表中进程(processes)和线程(threads)的数量
ldavg-1 最后1分钟的系统平均负载(System load average)
ldavg-5 过去5分钟的系统平均负载
ldavg-15 过去15分钟的系统平均负载

4、系统交换活动信息监控(-W)
每5秒采样一次,连续采样3次,监控系统交换活动信息:
sar -W 5 3

选项 说明
pswpin/s 每秒系统换入的交换页面(swap page)数量
pswpout/s 每秒系统换出的交换页面(swap page)数量

总结
如何判断什么时候是用什么参数选项?
怀疑CPU存在瓶颈,可用 sar -u 和 sar -q 等来查看
怀疑内存存在瓶颈,可用 sar -B、sar -r 和 sar -W 等来查看
怀疑I/O存在瓶颈,可用 sar -b、sar -u 和 sar -d 等来查看


分享到:

网友留言(0 条)

发表评论