Linux系统平均负载指标解读

一.使用`top`命令,看到右上角有个平均负载指标

top - 11:47:03 up 356 days, 20:33,  8 users,  load average: 10.08, 11.02, 12.23
Tasks: 159 total,   3 running, 156 sleeping,   0 stopped,   0 zombie
%Cpu0  : 55.8 us, 11.5 sy,  0.0 ni, 17.3 id,  0.0 wa,  0.0 hi, 15.4 si,  0.0 st
%Cpu1  : 36.7 us, 16.3 sy,  0.0 ni, 46.9 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
%Cpu2  : 37.3 us, 15.7 sy,  0.0 ni, 47.1 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
%Cpu3  : 30.8 us, 11.5 sy,  0.0 ni, 57.7 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
KiB Mem : 16268500 total,   169076 free,  8331188 used,  7768236 buff/cache
KiB Swap:        0 total,        0 free,        0 used.  7399704 avail Mem

当前cpu为4核逻辑处理器,如上所示,怎么判断当前系统是否超载?
参考:https://blog.csdn.net/chenxiao_ji/article/details/46897695
在Linux shell下，有很多命令可以看到Load Average，例如：

1 2	root@Slyar.com:~# uptime 12:49:10 up 182 days, 16:54, 2 users, load average: 0.08, 0.04, 0.01

1 2	root@Slyar.com:~# top top - 12:50:28 up 182 days, 16:55, 2 users, load average: 0.02, 0.05, 0.00

先大致给一下这3个数字的含义：分别表示系统在过去1分钟、5分钟、15分钟内运行进程队列中的平均进程数量。
运行队列嘛，没有等待IO，没有WAIT，没有KILL的进程通通都进这个队列。
另外还有一个最直接的显示系统平均负载的命令

1 2	[172.23.6.189:hadoop@sz-pg-smce-cce-016:/home/hadoop]$ cat /proc/loadavg 12.04 11.32 12.15 26/664 6142

除了前3个数字表示平均进程数量外，后面的1个分数，分母表示系统进程总数，分子表示正在运行的进程数；最后一个数字表示最近运行的进程ID.

二.系统平均负载-进阶解释

只是上面那一句话的解释，基本等于没解释。写这篇文章的缘由就是因为看到了一篇老外写的关于Load Average的文章，觉得解释的很好，所以才打算摘取一部分用自己的话翻译一下。
@scoutapp Thanks for your article Understanding Linux CPU Load, I just translate and share it to Chinese audiences.

为了更好地理解系统负载，我们用交通流量来做类比。
1、单核CPU - 单车道 - 数字在0.00-1.00之间正常
路况管理员会告知司机，如果前面比较拥堵，那司机就要等待，如果前面一路畅通，那么司机就可以驾车直接开过。

具体来说：
0.00-1.00 之间的数字表示此时路况非常良好，没有拥堵，车辆可以毫无阻碍地通过。
1.00 表示道路还算正常，但有可能会恶化并造成拥堵。此时系统已经没有多余的资源了，管理员需要进行优化。
1.00-*** 表示路况不太好了，如果到达2.00表示有桥上车辆一倍数目的车辆正在等待。这种情况你必须进行检查了。
到这里,可以判断,单核CPU处理时,平均负载数超过>=2(一般看近5分钟,中间数值),即CPU出现超载

2、多核CPU - 多车道 - 数字/CPU核数在0.00-1.00之间正常

多核CPU的话，满负荷状态的数字为 “1.00 * CPU核数”，即双核CPU为2.00，四核CPU为4.00。

3、安全的系统平均负载
作者认为单核负载在0.7以下是安全的，超过0.7就需要进行优化了。

4、应该看哪一个数字，1分钟，5分钟还是15分钟？
作者认为看5分钟和15分钟的比较好，即后面2个数字。

5、怎样知道我的CPU是几核呢？
使用以下命令可以直接获得CPU核心数目

grep ‘model name’ /proc/cpuinfo | wc -l

结论:
取得CPU核心数目N，观察后面2个数字，用数字/N，如果得到的值小于0.7即可无忧

一.使用top命令,看到右上角有个平均负载指标

二.系统平均负载-进阶解释

一.使用`top`命令,看到右上角有个平均负载指标