0

0

Linux 高 CPU 使用率的排查顺序

冰川箭仙

冰川箭仙

发布时间:2026-01-28 19:57:32

|

824人浏览过

|

来源于php中文网

原创

先看load average和%Cpu(s)再排查:4核机load>4说明排队,wa高表明磁盘等待而非CPU瓶颈,sy>30%提示锁竞争;线程TID需转16进制才能用jstack定位;perf top可查native热点,需root及调参;strace和pidstat仅作辅助验证。

linux 高 cpu 使用率的排查顺序

先看负载和利用率,别急着杀进程

Linux 中 CPU 100% 不等于真“满载”,得拆开看两个关键指标:load average%Cpu(s)。用 top 一进来就按 P 排序,但别只盯着第一行的 99.9% —— 先看右上角的 load average: 4.15, 3.80, 3.20:如果机器是 4 核,1 分钟负载 >4 就说明有任务在排队;再看下方 %Cpu(s): 85.5us, 10.2sy, 0.2wa:若 wa(iowait)高,说明 CPU 在干等磁盘,不是计算瓶颈,杀进程没用;若 sy 持续 >30%,大概率是锁竞争或频繁系统调用,不是业务代码问题。

定位到线程 ID 后,必须转 16 进制再查堆

找到高 CPU 的 PID(比如 2633)后,用 top -H -p 2633ps -mp 2633 -o THREAD,tid,time | sort -rn 找出最耗时的线程 TID(比如 3626)。这一步很多人直接拿十进制 TID 去 jstack 里搜,结果啥也找不到——因为 JVM 的线程快照里显示的是十六进制小写格式。必须执行:printf "%x\n" 3626 得到 e18,再用 jstack 2633 | grep "e18" -A 30 才能准确定位到对应线程的堆栈。漏掉这步转换,等于白忙活。

perf top -p 是验证“到底在算什么”的最终手段

jstack 显示线程在 RUNNABLE 状态但堆栈全是 native 方法(比如 Unsafe.parkpthread_mutex_lock),或者压根没 Java 线程占高 CPU,就得怀疑是不是 JNI、GC、JIT 编译或内核路径在吃资源。这时 perf top -p 2633 能直接看到函数级热点:如果大量时间在 [unknown]libc-2.x.so 里,可能是本地库死循环;如果集中在 jvm.dlllibjvm.so 的 GC 相关函数,就得检查堆大小或 GC 参数。注意:perf 需要 root 权限,且某些容器环境默认禁用 perf_event_paranoid,得先 echo -1 > /proc/sys/kernel/perf_event_paranoid

strace 和 pidstat 是补位工具,别当成主力

strace -p PID 看起来很直观,但它会严重拖慢目标进程(尤其是高频系统调用场景),还可能掩盖真实行为;pidstat -p PID 1 虽然轻量,但只给平均值,抓不住瞬时毛刺。它们适合两种情况:一是 top 显示某个进程 CPU 使用率忽高忽低,用 pidstat 确认是否周期性抖动;二是 top 里进程状态为 D(不可中断睡眠),用 strace 没反应,反而该立刻切去 iostat -x 1 查磁盘延迟。把它们当“辅助望远镜”,不是“主手术刀”。

真正卡住的地方往往不在第一层表象:比如 wa 高却误判为 CPU 问题,比如线程 ID 没转 16 进制导致堆栈对不上,比如在容器里跑 perf 却忘了调内核参数。排查顺序不是线性的,而是靠指标互验来回收窄——CPU 利用率、负载、iowait、上下文切换数,四个数字对上了,根因才不会跑偏。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
sort排序函数用法
sort排序函数用法

sort排序函数的用法:1、对列表进行排序,默认情况下,sort函数按升序排序,因此最终输出的结果是按从小到大的顺序排列的;2、对元组进行排序,默认情况下,sort函数按元素的大小进行排序,因此最终输出的结果是按从小到大的顺序排列的;3、对字典进行排序,由于字典是无序的,因此排序后的结果仍然是原来的字典,使用一个lambda表达式作为key参数的值,用于指定排序的依据。

391

2023.09.04

printf用法大全
printf用法大全

php中文网为大家提供printf用法大全,以及其他printf函数的相关文章、相关下载资源以及各种相关课程,供大家免费下载体验。

74

2023.06.20

fprintf和printf的区别
fprintf和printf的区别

fprintf和printf的区别在于输出的目标不同,printf输出到标准输出流,而fprintf输出到指定的文件流。根据需要选择合适的函数来进行输出操作。更多关于fprintf和printf的相关文章详情请看本专题下面的文章。php中文网欢迎大家前来学习。

286

2023.11.28

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

396

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

575

2023.08.10

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

396

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

575

2023.08.10

线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

503

2023.08.10

俄罗斯Yandex引擎入口
俄罗斯Yandex引擎入口

2026年俄罗斯Yandex搜索引擎最新入口汇总,涵盖免登录、多语言支持、无广告视频播放及本地化服务等核心功能。阅读专题下面的文章了解更多详细内容。

158

2026.01.28

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 8万人学习

Git 教程
Git 教程

共21课时 | 3.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号