服务器负载过高分析 | 您所在的位置:网站首页 › nga服务器负载过高不让发言 › 服务器负载过高分析 |
一、问题现象
top 命令查看显示服务器负载情况,服务器负载1.31,而且长时间没降下去,CPU使用率99.9%也异常飚高 load average :系统平均负载均值,三列分别代表 1分钟、5分钟、15分钟。理论上,值越小越好。负载越高,说明可能跑的程序出现异常情况。 一般,如果只是 1 分钟内的负载比较高,其他两个负载参数较低, 这说明是暂时现象,问题不大。如果5分钟、15分钟负载都超过 1 的话,那就要考虑程序方面的问题了。 CPU使用率:有 10 个开发任务,4名开发人员,但是 10个任务都分配给一个人了,那么此时的CPU使用率为 25%,负载非常高。 CPU平均负载:负载就是cpu在一段时间内正在处理以及等待cpu处理的进程数之和的统计信息,也就是cpu使用队列的长度统计信息,这个数字越小越好(如果超过CPU核心*0.7就是不正常)。 高速入口,系统负载为0,此时没车,收费员闲着。负载0.5,一半的车流了,收费员比较闲。负载1,满负荷,没时间歇着了。负载1.5,车队已经排到500米开外了,没得歇。负载越高,过站时间越长。 二、查看分析 1、磁盘空间 df -l ,空余足,无问题 S0C / S1C:年轻代 Survivor 区容量 S0U / S1U:年轻代 Survivor 区使用量 EC / EU :年轻代 Eden 区容量 / 使用量 OC / OU :Old老年代容量 / 使用量 MC / MU :Metaspace 元空间初始大小 / 使用量 YGC / YGCT :程序启动到采样时的年轻代GC次数 / 耗时 FGC / FGCT:程序启动到采样时的老年代GC次数 / 耗时 5、查看运行中的Java程序进程 5.1、查看异常CPU使用率进程 原因:等待磁盘I/O完成的进程过多,导致进程队列长度过大,但是CPU运行的进程却很少,这样就体现到负载过大了,CPU使用率低。 |
CopyRight 2018-2019 实验室设备网 版权所有 |