Linux常用系统性能监控命令

vmstat是Virtual Meomory Statistics(虚拟内存统计)的缩写, 是实时系统监控工具。该命令通过使用knlist子程序和/dev/kmen伪设备驱动器访问这些数据,输出信息直接打印在屏幕。
首页 新闻资讯 行业资讯 Linux常用系统性能监控命令

5467fbb4901b36d3f178071ad8adbae21f2def.jpg

监控CPU使用率

使用下面的命令:

复制

[root@localhost ~]# gnome-system-monitor
  • 1.

将会出现图形化工具GNOME System Monitor,如下图所示:

e96afda75c14388f00c724fd715ddf9e1ff4ef.jpg

监控CPU调度程序运行队列

linux可以使用vmstat命令

vmstat是Virtual Meomory Statistics(虚拟内存统计)的缩写, 是实时系统监控工具。该命令通过使用knlist子程序和/dev/kmen伪设备驱动器访问这些数据,输出信息直接打印在屏幕。vmstat反馈的与CPU相关的信息包括:

(1)多少任务在运行

(2)CPU使用的情况

(3)CPU收到多少中断

(4)发生多少上下文切换

下面只介绍 Vmstat与CPU相关的参数

vmstat的语法如下:

复制

vmstat [delay [count]]
  • 1.

参数的含义如下:

参数

解释

delay

相邻的两次采样的间隔时间

count

采样的次数,count只能和delay一起使用

当没有参数时,vmstat则显示系统启动以后所有信息的平均值。有delay时,第一行的信息自系统启动以来的平均信息。从第二行开始,输出为前一个delay时间段的平均信息。当系统有多个CPU时,输出为所有CPU的平均值。

参数

解释

从/proc/stat获得数据

r

在internal时间段里,运行队列里等待CPU的任务(任务)的个数,即不包含vmstat进程

procs_running-1

b

在internal时间段里,被资源阻塞的任务数(I/0,页面调度,等等.)通常情况下是接近0的

procs_blocked

us

在internal时间段里,用户态的CPU时间(%),包含 nice值为负进程

(user+nice)/total*100

sy

在internal时间段里,核心态的CPU时间(%)


(system+irq+softirq)/total*100

id

在internal时间段里,cpu空闲的时间,不包括等待i/o的时间(%)

idle/total*100

wa

在internal时间段里,等待i/o的时间(%)

iowait/total*100

in

在internal时间段里,每秒发生中断的次数

intr/interval

cs

在internal时间段里,每秒上下文切换的次数,即每秒内核任务交换的次数

ctxt/interval

复制

total_cur = user + system + nice + idle + iowait + irq + softirq
   total_pre = pre_user + pre_system + pre_nice + pre_idle + pre_iowait + pre_irq + pre_softirq
   total = total_cur - total_pre
   [root@localhost ~]# vmstat
  • 1.

  • 2.

  • 3.

  • 4.

运行结果如下:

48f15b7855370399ed6828be035332e9c88546.jpg

监控锁竞争

使用 sysstat包中的pidstat命令来监控

复制

[root@localhost ~]# pidstat
  • 1.

运行结果如下:

复制

Linux 2.6.32-431.el6.x86_64 (localhost.localdomain) 05/07/15 _x86_64_ (1 CPU)   09:58:18 PID %usr %system %guest %CPU CPU Command   09:58:18 1 0.00 0.00 0.00 0.00 0 init   09:58:18 4 0.00 0.00 0.00 0.00 0 ksoftirqd/0
   ……   09:58:18 37143 0.00 0.00 0.00 0.00 0 dbus-launch   09:58:18 37144 0.00 0.00 0.00 0.00 0 dbus-daemon   09:58:18 37268 0.00 0.00 0.00 0.00 0 fprintd   09:58:18 37272 0.00 0.00 0.00 0.00 0 pidstat
  • 1.

  • 2.

  • 3.

  • 4.

  • 5.

  • 6.

  • 7.

  • 8.

  • 9.

监控网络I/O使用率

nicstat原本是Solaris平台下显示网卡流量的工具,Tim Cook将它移植到linux平台

首先安装之,源码在这里下, 这里使用的版本是1.92。

安装make环境:

复制

yum install gcc gcc-c++ make automake autoconf -y
  • 1.

由于nicstat依赖32 bit glibc package,所以

复制

yum install libgcc.i686 glibc.i686 glibc-devel.i686  -y
  • 1.

下载文件并安装:

复制

# wget -c http://nchc.dl.sourceforge.net/project/nicstat/nicstat-1.92.tar.gz
   # tar zxvf nicstat-1.92.tar.gz
   # cd nicstat-1.92
   # cp Makefile.Linux Makefile
   # uname -m
  • 1.

  • 2.

  • 3.

  • 4.

  • 5.

复制

[root@localhost nicstat-1.92]# make
   gcc -O3 -m32 nicstat.c -o nicstat
   nicstat.c:99:1: warning: "DUPLEX_UNKNOWN" redefined
   In file included from nicstat.c:84:
   /usr/include/linux/ethtool.h:691:1: warning: this is the location of the previous definition   mv nicstat `./nicstat.sh --bin-name`
  • 1.

  • 2.

  • 3.

  • 4.

  • 5.

  • 6.

复制

[root@localhost nicstat-1.92]# ./nicstat.sh
  • 1.

763ee2b92d9df67493a074f067553cd9e6e682.jpg

磁盘I/O使用率

   iostat [-t] [-c] [interval [count]]

参数的含义如下:

参数

解释

T

表示输出采用的时间

C


表示只显示CPU的信息

Internal

相邻的两次采样的间隔时间

count

采样的次数,count只能和delay一起使用

当没有参数时,iostat则显示系统启动以后所有信息的平均值。与CPU有关的输出的含义

参数

解释

从/proc/stat获得

CPU

处理器ID

user

在internal时间段里,用户态的CPU时间(%) ,不包含 nice值为负进程

usr/total*100

nice

在internal时间段里,nice值为负进程的CPU时间(%)

nice/total*100

sys

在internal时间段里,核心时间(%)

(system+irq+softirq)/total*100

iowait

在internal时间段里,硬盘IO等待时间(%)

iowait/total*100

idle

在internal时间段里,CPU除去等待磁盘IO操作外的因为任何原因而空闲的时间闲置时间 (%)

idle/total*100

复制

total_cur = user + system + nice + idle + iowait + irq + softirq
   total_pre = pre_user + pre_system + pre_nice + pre_idle + pre_iowait + pre_irq + pre_softirq
   total = total_cur - total_pre
  • 1.

  • 2.

  • 3.

有interval时,第一行的信息自系统启动以来的平均信息。从第二行开始,输出为前一个interval时间段的平均信息。

使用iostat命令

复制

[root@localhost ~]# iostat
  • 1.

运行结果如下:

复制

Linux 2.6.32-431.el6.x86_64 (localhost.localdomain) 05/07/15 _x86_64_ (1 CPU)
   avg-cpu: %user %nice %system %iowait %steal %idle   6.12 0.00 1.35 2.35 0.00 90.19
   Device: tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn
   sda 6.03 267.11 272.53 26904430 27450404
  • 1.

  • 2.

  • 3.

  • 4.

  • 5.

PS:附上Brendan Gregg 个人站点上分享了很多 Linux 性能相关的资源:

Linux observability tools | Linux 性能观测工具

b9575e535c479c252967313f95a9436969b676.jpg

Linux benchmarking tools | Linux 性能测评工具

52dc623955df19c6ba43522218afa199e34bf4.jpg

Linux tuning tools | Linux 性能调优工具

67c2c5c24ebfc987429217dafffcbd6504559f.jpg

Linux observability sar

936dc73648abd3949b83534b6a074cd7b270bc.jpg

30    2022-07-26 10:28:00    Linux 监控 命令