首先通过uptime和top命令确认系统负载及高CPU进程,再用top -H -p PID定位高耗线程,接着将线程ID转为十六进制,最后通过jstack分析堆栈找出问题代码。

系统CPU过高时,排查的核心是层层下钻,从宏观负载到具体代码。关键在于快速定位消耗资源的进程和线程,并结合日志与堆栈分析根本原因。整个过程不需要复杂的理论,掌握几个命令组合就能应对大部分场景。
第一步是确认问题是否存在以及严重程度。使用 uptime 命令查看系统平均负载(load average),如果这个值持续高于你的CPU逻辑核心数,说明系统有压力。接着运行 top 命令,它会列出所有进程,默认按CPU使用率排序。找到%CPU列数值最高的那个进程,记下它的PID(进程ID)。此时按Shift+P可以确保列表始终按CPU占用降序排列。这一步就锁定了“元凶”进程。
一个进程可能包含多个线程,真正吃掉CPU的往往是其中某一个。使用命令 top -H -p PID(将PID替换为上一步找到的进程号),可以查看该进程下所有线程的资源消耗情况。同样按CPU使用率排序,找到占用最高的线程TID。接下来需要把这个十进制的线程ID转换成十六进制,因为后续工具会用到。执行 printf "%x\n" TID 即可完成转换,屏幕上输出的就是目标线程的16进制表示。
对于Java应用,这是最关键的一步。利用JDK自带的 jstack 工具打印出目标进程的线程快照,然后搜索之前得到的十六进制线程ID。执行 jstack PID | grep -A 20 十六进制TID,命令中的-A参数表示输出匹配行及之后的20行内容,这部分就是该线程的调用堆栈(stack trace)。仔细阅读堆栈信息,最顶部的方法通常就是正在疯狂消耗CPU的代码。结合业务知识,就能迅速定位到是哪个类、哪个方法出了问题,比如死循环或低效算法。非Java程序可用perf top -p PID或strace -p PID进行类似的动态追踪。
基本上就这些步骤。从系统到进程,再到线程,最后落到代码,逻辑清晰。平时准备好如show-busy-java-threads.sh这类封装脚本,能在紧急情况下节省大量时间。以上就是Linux如何排查系统CPU过高_Linux性能异常定位步骤的详细内容,更多请关注php中文网其它相关文章!
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号