知识库

标准化实施手册及常见错误


linux CPU性能诊断

<p><strong>CPU 性能分析命令,以及 CPU 性能分析方法</strong></p> <h2>CPU 性能分析命令</h2> <ul> <li> <h3>top</h3> <p>top 命令经常用来监控 Linux 的系统状况,比如 CPU、内存的使用,如下图所示: <img src="http://60.191.64.5:16100/server/index.php?s=/api/attachment/visitFile/sign/55cc94101f01dae6c35e6efb01bd0d64" alt="" /></p> <pre><code>第三行 CPU 信息统计数据如下所示: Cpu(s):   0.0% us:  用户空间占用 CPU 百分比。   0.3% sy:  内核(系统)空间占用 CPU 百分比。   0.0% ni:  用户进程空间内改变过优先级的进程占用 CPU 百分比。   99.7% id: 空闲 CPU 百分比。   0.0% wa: 等待输入输出的 CPU 时间百分比。   0.0%hi:  硬件 CPU 中断占用百分比。   0.0%si:  软中断占用百分比。   0.0%st:  虚拟机(虚拟化技术)占用百分比。</code></pre> <p>系统性能评估标准:</p> </li> </ul> <table> <thead> <tr> <th>影响性能因素</th> <th>好</th> <th>坏</th> <th>糟糕</th> </tr> </thead> <tbody> <tr> <td>CPU</td> <td>user% + sys%&lt; 70%</td> <td>user% + sys%= 85%</td> <td>user% + sys% &gt;=90%</td> </tr> </tbody> </table> <ul> <li> <h3>vmstat</h3> <p>vmstat 是 Virtual Meomory Statistics(虚拟内存统计)的缩写,可对操作系统的虚拟内存、进程、IO 读写、CPU 活动等进行监视,如下图所示: <img src="http://60.191.64.5:16100/server/index.php?s=/api/attachment/visitFile/sign/a16c51b26622b0d1f44ffa3dcef162a6" alt="" /></p> <pre><code>CPU 以百分比显示如下所示: us(user time):用户进程执行时间。 sy(system time):系统进程执行时间。 id:空闲时间(包括 IO 等待时间)。 wa:等待 IO 时间,wa 的值高时,说明 IO 等待比较严重,这可能由于磁盘大量做随机访问造成的,也有可能是磁盘出现瓶颈。 st:表示被偷走的 CPU 所占百分比(一般都为 0,不用关注)。 us + sy + id + wa =100% 近似为 100%</code></pre> </li> </ul> <h2>CPU 性能诊断</h2> <p>使用 vmstat 查看系统的 CPU 整体运行状况,如下所示: <code>vmstat 1 10</code> <img src="http://60.191.64.5:16100/server/index.php?s=/api/attachment/visitFile/sign/75402d9590f3f439d53bd79c50423499" alt="" /></p> <ul> <li> <h3>指标解读如下所示:</h3> <pre><code>r:如果在 procs 中运行的序列 (process r) 是连续的大于在系统中的 CPU 的个数,表示 CPU 比较忙,系统现在运行比较慢,有多数的进程等待 CPU。如果 r 的输出数大于系统中可用 CPU 个数的 4 倍的话,则系统面临着 CPU 短缺的问题,或者是 CPU 的速率过低,系统中有多数的进程在等待 CPU,造成系统中进程运行过慢。 b:如果在 procs 中运行的序列 (process b),即处于不可中断状态的进程数,连续为 CPU 的 2~3 倍就表明 CPU 排队比较严重了。 SYSTEM: in:每秒产生的中断次数。 cs:每秒产生的上下文切换次数。 in 和 cs 这两个值越大,会看到由内核消耗的 CPU 时间会越大。 CPU: us:用户进程消耗的 CPU 时间百分。us 的值比较高时,说明用户进程消耗的 CPU 时间多,在服务高峰期持续大于 50~60,是可以接受,但是如果长期超 50% ,那么我们就该考虑优化程序算法。 sy:内核进程消耗的 CPU 时间百分比。sy 的值高时,说明系统内核消耗的 CPU 资源多,这并不是良性表现,我们应该检查原因。 wa:IO 等待消耗的CPU时间百分比。wa 的值高时,说明 IO 等待比较严重,这可能由于磁盘大量作随机访问造成,也有可能磁盘出现瓶颈(块操作)。 id:CPU 处于空闲状态时间百分比,如果空闲时间 (cpu id) 持续为 0 并且系统时间 (cpu sy) 是用户时间的两倍 (cpu us) 系统则面临着 CPU 资源的短缺,在服务高峰期持续小于 50,可以接受。</code></pre> </li> <li> <h3>通过以下方式可以判断 CPU 性能:</h3> <pre><code>如果 r 连续大于 CPU 的个数,甚至几倍 CPU 个数;b 也有持续有值,甚至 CPU 的 2~3 倍,并且 id 也持续小于 50%,wa 也比较小,这就表明 CPU 负荷很严重。 再详细确认用:sar -u 1 5,sar -q 1 5,可以观察 CPU 的使用率和 CPU 运行进程队列长度及负载。 查看具体是什么进程在消耗 CPU,就要使用命令:top,ps –auxw | more。 知道了某个进程消耗大量的 CPU,想知道这个进程在做成什么,那就用命令:strace</code></pre> </li> </ul>

页面列表

ITEM_HTML