0

0

Linux高负载如何排查_高频场景实战指导更易上手【技巧】

舞夢輝影

舞夢輝影

发布时间:2025-12-17 22:01:20

|

221人浏览过

|

来源于php中文网

原创

Linux高负载排查需先定性再定位:一看load与CPU核数关系判断是否真告警;二用top看wa和D状态定CPU或IO型瓶颈;三用top-jstack查Java热点线程;四查swap、inode、网络连接及slab泄漏等隐形负载源。

linux高负载如何排查_高频场景实战指导更易上手【技巧】

Linux高负载排查不是看一个数字就下结论,关键得拆开看:负载高是真忙,还是“假忙”——比如CPU空闲但load飙高,那八成是I/O卡住了。核心思路就一条:先定性(CPU型?IO型?内存型?),再定位(哪个进程/线程/设备在拖后腿),最后收口(日志、堆、资源配比都要留痕)。

一看负载值和CPU核心数的关系

执行 uptimecat /proc/loadavg,拿到三个数字(1/5/15分钟平均负载)。立刻用 nproc 查出当前CPU逻辑核数。如果 1分钟load > CPU核数 × 1.5,且持续2分钟以上,才算真正告警。比如8核机器load到14,就得动手;但load=9.2只是略高,先别急着杀进程——可能只是短时抖动。

  • load ≈ CPU核数:系统轻载,基本健康
  • load 是核数的2倍以上:大概率有瓶颈,需深入
  • load很高但%us + %sy总和长期低于30%:重点查I/O或不可中断睡眠(D状态进程)

二分法快速定性:CPU高 or IO高

运行 top,盯住右上角两行关键指标:
%Cpu(s) 行里的 us(用户态)、sy(内核态)、wa(I/O等待)
Tasks 行里的 D(不可中断睡眠)数量

  • 如果 wa > 20%D状态进程 > 5个:直接跳去查磁盘I/O(iostat -x 1 3 看%util和await)
  • 如果 us + sy > 80%wa :说明CPU真被吃满,用 top -o %CPU 找罪魁进程
  • 如果 us低、sy高、wa也高:可能是大量系统调用+磁盘争抢,常见于小文件随机读写或元数据操作频繁场景

三步锁定Java类应用的热点线程

很多高负载来自Java服务——CPU跑满但业务没流量,往往是死循环或GC风暴。按顺序做:

  • top -p [PID] 确认该Java进程CPU占比异常
  • top -Hp [PID] 找出占用最高的线程TID(十进制)
  • 转成十六进制:printf "%x\n" [TID],再用 jstack [PID] | grep -A30 [16进制值] 定位堆栈——重点关注 RUNNABLE 状态下反复调用同一方法的位置

注意:jstack输出前最好加 -l(显示锁信息)和 -e(显示额外线程信息),避免漏掉阻塞线索。

ContentBot
ContentBot

内容自动化AI写作工具

下载

四类常被忽略但高频的“隐形负载源”

有些负载不体现在top里,却实实在在拖垮系统:

  • 内存不足触发swap:看 free -havailable是否远低于total,同时 vmstat 1si/so 列持续非零
  • inode耗尽df -i 查使用率,100%会导致新建文件失败、日志写不进、容器起不来
  • 网络连接打满ss -s 看 total established 是否接近 net.core.somaxconn 设置值,或 TIME-WAIT 过多
  • 内核slab泄漏slabtop -o 排序看 cache 占用,如 dentry、inode_cache 持续上涨,可能是程序未正确关闭文件描述符

基本上就这些。不复杂但容易忽略——多数线上高负载问题,靠这四步就能在10分钟内圈出根因。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
printf用法大全
printf用法大全

php中文网为大家提供printf用法大全,以及其他printf函数的相关文章、相关下载资源以及各种相关课程,供大家免费下载体验。

75

2023.06.20

fprintf和printf的区别
fprintf和printf的区别

fprintf和printf的区别在于输出的目标不同,printf输出到标准输出流,而fprintf输出到指定的文件流。根据需要选择合适的函数来进行输出操作。更多关于fprintf和printf的相关文章详情请看本专题下面的文章。php中文网欢迎大家前来学习。

287

2023.11.28

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

399

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

577

2023.08.10

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

399

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

577

2023.08.10

线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

546

2023.08.10

磁盘配额是什么
磁盘配额是什么

磁盘配额是计算机中指定磁盘的储存限制,就是管理员可以为用户所能使用的磁盘空间进行配额限制,每一用户只能使用最大配额范围内的磁盘空间。php中文网为大家提供各种磁盘配额相关的内容,教程,供大家免费下载安装。

1436

2023.06.21

AO3官网入口与中文阅读设置 AO3网页版使用与访问
AO3官网入口与中文阅读设置 AO3网页版使用与访问

本专题围绕 Archive of Our Own(AO3)官网入口展开,系统整理 AO3 最新可用官网地址、网页版访问方式、正确打开链接的方法,并详细讲解 AO3 中文界面设置、阅读语言切换及基础使用流程,帮助用户稳定访问 AO3 官网,高效完成中文阅读与作品浏览。

29

2026.02.02

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 8.3万人学习

Git 教程
Git 教程

共21课时 | 3.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号