linux CPU性能诊断
<p><strong>CPU 性能分析命令,以及 CPU 性能分析方法</strong></p>
<h2>CPU 性能分析命令</h2>
<ul>
<li>
<h3>top</h3>
<p>top 命令经常用来监控 Linux 的系统状况,比如 CPU、内存的使用,如下图所示:
<img src="http://60.191.64.5:16100/server/index.php?s=/api/attachment/visitFile/sign/55cc94101f01dae6c35e6efb01bd0d64" alt="" /></p>
<pre><code>第三行 CPU 信息统计数据如下所示:
Cpu(s):
0.0% us: 用户空间占用 CPU 百分比。
0.3% sy: 内核(系统)空间占用 CPU 百分比。
0.0% ni: 用户进程空间内改变过优先级的进程占用 CPU 百分比。
99.7% id: 空闲 CPU 百分比。
0.0% wa: 等待输入输出的 CPU 时间百分比。
0.0%hi: 硬件 CPU 中断占用百分比。
0.0%si: 软中断占用百分比。
0.0%st: 虚拟机(虚拟化技术)占用百分比。</code></pre>
<p>系统性能评估标准:</p>
</li>
</ul>
<table>
<thead>
<tr>
<th>影响性能因素</th>
<th>好</th>
<th>坏</th>
<th>糟糕</th>
</tr>
</thead>
<tbody>
<tr>
<td>CPU</td>
<td>user% + sys%< 70%</td>
<td>user% + sys%= 85%</td>
<td>user% + sys% >=90%</td>
</tr>
</tbody>
</table>
<ul>
<li>
<h3>vmstat</h3>
<p>vmstat 是 Virtual Meomory Statistics(虚拟内存统计)的缩写,可对操作系统的虚拟内存、进程、IO 读写、CPU 活动等进行监视,如下图所示:
<img src="http://60.191.64.5:16100/server/index.php?s=/api/attachment/visitFile/sign/a16c51b26622b0d1f44ffa3dcef162a6" alt="" /></p>
<pre><code>CPU 以百分比显示如下所示:
us(user time):用户进程执行时间。
sy(system time):系统进程执行时间。
id:空闲时间(包括 IO 等待时间)。
wa:等待 IO 时间,wa 的值高时,说明 IO 等待比较严重,这可能由于磁盘大量做随机访问造成的,也有可能是磁盘出现瓶颈。
st:表示被偷走的 CPU 所占百分比(一般都为 0,不用关注)。
us + sy + id + wa =100% 近似为 100%</code></pre>
</li>
</ul>
<h2>CPU 性能诊断</h2>
<p>使用 vmstat 查看系统的 CPU 整体运行状况,如下所示:
<code>vmstat 1 10</code>
<img src="http://60.191.64.5:16100/server/index.php?s=/api/attachment/visitFile/sign/75402d9590f3f439d53bd79c50423499" alt="" /></p>
<ul>
<li>
<h3>指标解读如下所示:</h3>
<pre><code>r:如果在 procs 中运行的序列 (process r) 是连续的大于在系统中的 CPU 的个数,表示 CPU 比较忙,系统现在运行比较慢,有多数的进程等待 CPU。如果 r 的输出数大于系统中可用 CPU 个数的 4 倍的话,则系统面临着 CPU 短缺的问题,或者是 CPU 的速率过低,系统中有多数的进程在等待 CPU,造成系统中进程运行过慢。
b:如果在 procs 中运行的序列 (process b),即处于不可中断状态的进程数,连续为 CPU 的 2~3 倍就表明 CPU 排队比较严重了。
SYSTEM:
in:每秒产生的中断次数。
cs:每秒产生的上下文切换次数。
in 和 cs 这两个值越大,会看到由内核消耗的 CPU 时间会越大。
CPU:
us:用户进程消耗的 CPU 时间百分。us 的值比较高时,说明用户进程消耗的 CPU 时间多,在服务高峰期持续大于 50~60,是可以接受,但是如果长期超 50% ,那么我们就该考虑优化程序算法。
sy:内核进程消耗的 CPU 时间百分比。sy 的值高时,说明系统内核消耗的 CPU 资源多,这并不是良性表现,我们应该检查原因。
wa:IO 等待消耗的CPU时间百分比。wa 的值高时,说明 IO 等待比较严重,这可能由于磁盘大量作随机访问造成,也有可能磁盘出现瓶颈(块操作)。
id:CPU 处于空闲状态时间百分比,如果空闲时间 (cpu id) 持续为 0 并且系统时间 (cpu sy) 是用户时间的两倍 (cpu us) 系统则面临着 CPU 资源的短缺,在服务高峰期持续小于 50,可以接受。</code></pre>
</li>
<li>
<h3>通过以下方式可以判断 CPU 性能:</h3>
<pre><code>如果 r 连续大于 CPU 的个数,甚至几倍 CPU 个数;b 也有持续有值,甚至 CPU 的 2~3 倍,并且 id 也持续小于 50%,wa 也比较小,这就表明 CPU 负荷很严重。
再详细确认用:sar -u 1 5,sar -q 1 5,可以观察 CPU 的使用率和 CPU 运行进程队列长度及负载。
查看具体是什么进程在消耗 CPU,就要使用命令:top,ps –auxw | more。
知道了某个进程消耗大量的 CPU,想知道这个进程在做成什么,那就用命令:strace</code></pre>
</li>
</ul>