Linux 负载高但 CPU 空闲的原因

冰川箭仙

发布时间：2026-01-27 18:59:42

954人浏览过

来源于php中文网

原创

load average 高而 CPU 使用率低，本质是大量进程处于可运行（R）或不可中断睡眠（D）状态等待资源；常见原因包括 D 状态堆积、I/O 卡顿、内存不足换页、驱动缺陷等。

linux 负载高但 cpu 空闲的原因

为什么 `top` 显示 CPU 使用率低，但 `load average` 却很高

负载高而 CPU 空闲，本质是系统中有大量进程在「等待」而非「运行」。Linux 的 load average 统计的是 **1 分钟、5 分钟、15 分钟内处于可运行状态（R）或不可中断睡眠状态（D）的平均进程数**，不等于 CPU 正在执行的指令量。

常见诱因包括：

D 状态进程堆积（如磁盘 I/O 卡住、NFS 挂载无响应、内核锁争用）
大量进程在等待慢速设备（如机械硬盘随机读、坏块重试、远程存储超时）
内存严重不足导致频繁换页，pgpgin/pgpgout 激增，I/O 阻塞加剧
某些驱动或内核模块陷入不可中断等待（例如旧版 qla2xxx 或 USB 存储驱动 bug）

如何快速定位 D 状态进程和阻塞源头

先看哪些进程卡在 D 状态：

ps -eo pid,stat,comm,wchan --sort=-wchan | head -20

wchan 列显示进程正在等待的内核函数，比 STAT 更具指向性。重点关注：

io_schedule：通用 I/O 等待（可能是磁盘/网络存储）
__common_interrupt 或 nvme_irq：NVMe 设备响应异常
nfssvc、rpc_wait_bit_killable：NFS 客户端挂起
ext4_writepages、xfsaild：文件系统刷脏页卡住

再查整体 I/O 压力：

iostat -x 1

若 %util 接近 100% 且 await > 100ms，说明设备响应慢；若 %util 低但 avgqu-sz 很高，说明请求队列积压——这往往指向后端存储问题（如 RAID 卡电池失效、JBOD 故障盘、Ceph OSD 过载）。

`vmstat` 和 `/proc/buddyinfo` 揭示的隐藏线索

vmstat 1 中持续出现高 bi（块设备输入）和 si（swap in）值，说明内存压力正转化为 I/O 压力。此时检查：

free -h 是否 Available 远低于 Mem: 总量，且 SwapFree 快耗尽
cat /proc/buddyinfo 中高阶内存（如 order-10）为 0，表示大块连续内存无法分配，kmalloc 或 page_alloc 可能被阻塞
dmesg -T | tail -30 查是否有 Out of memory、page allocation failure 或 buffer I/O error

特别注意：某些云环境（如 AWS EBS gp2 卷）在突发 IOPS 耗尽后会限速至基线值，iostat 看不到错误，但 await 陡升、load average 暴涨——这是典型的「无声降级」。

排查 NFS、iSCSI 或容器存储时的特殊陷阱

NFS 客户端默认使用 hard,intr，服务端无响应时进程直接卡死在 D 状态，kill -9 无效。验证方式：

showmount -e <hostname></hostname> 是否超时？
rpcinfo -p <hostname></hostname> 是否返回 Program not registered？
挂载选项中是否遗漏 soft,timeo=10,retrans=3（仅限允许失败的场景）

容器环境需额外检查：

docker ps --format "{{.ID}}\t{{.Status}}" | grep "Up.*ago" 看容器是否实际卡住而非仅状态显示正常
ls -l /proc/<pid>/fd/</pid> 查某进程是否持有一个已断开的网络存储 fd（如 Ceph RBD 映射设备消失）
Kubernetes 中 kubectl describe pod 的 Events 是否有 FailedMount 或 ContainerCreating 卡住

真正棘手的情况往往不是 CPU 或磁盘本身坏，而是某个依赖组件（比如一个配置错误的 etcd 集群、一个未设超时的数据库连接池、一个卡在 getrandom(2) 的旧内核）让整个调用链停摆——这时候 load average 是唯一诚实的指标。

Linux进程五种状态转换原理及R与D状态性能影响分析

Linux告警风暴处理_告警收敛策略

Linux系统启动流程详解_从BIOS到systemd解析

Linux内存泄漏如何定位_内存增长趋势排查

Linux大文件读写优化_顺序IO策略

相关标签:

linux go docker 硬盘机械硬盘 usb 后端 ai ios kubernetes red format Error 堆 docker etcd 数据库 ceph kubernetes linux bug

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：systemd-coredump 如何设置保留完整 core 文件且压缩存储下一篇：Linux OOM 触发后的系统行为

作者最新文章

华为荣耀价格最低的一款手机荣耀最便宜机型价格解析

2026-03-11 09:37

微信电脑版文件保存在哪个文件夹微信电脑版文件默认存储路径

2026-03-11 11:40

Linux配置集中管理_配置统一方案

2026-03-11 11:50

Linux服务器频繁重启_硬件与系统排查

2026-03-11 12:11

Adobe怎么把一页拆分成两页 Adobe PDF页面拆分方法

2026-03-11 12:17

Linux系统内核参数查看_sysctl命令详解

2026-03-11 12:27

SQL报表指标口径变更_版本化设计

2026-03-11 12:34

Linux 反向代理性能优化_Nginx网络调优

2026-03-11 13:05

GitHub 网址打不开怎么解决？网络与 DNS 排查方法

2026-03-11 13:44

腾讯会议屏幕比例怎么调

2026-03-11 14:17

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

format在python中的用法

Python中的format是一种字符串格式化方法，用于将变量或值插入到字符串中的占位符位置。通过format方法，我们可以动态地构建字符串，使其包含不同值。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

888

2023.07.31

python中的format是什么意思

python中的format是一种字符串格式化方法，用于将变量或值插入到字符串中的占位符位置。通过format方法，我们可以动态地构建字符串，使其包含不同值。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

464

2024.06.27

scripterror怎么解决

scripterror的解决办法有检查语法、文件路径、检查网络连接、浏览器兼容性、使用try-catch语句、使用开发者工具进行调试、更新浏览器和JavaScript库或寻求专业帮助等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

492

2023.10.18

500error怎么解决

500error的解决办法有检查服务器日志、检查代码、检查服务器配置、更新软件版本、重新启动服务、调试代码和寻求帮助等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

382

2023.10.25

堆和栈的区别

堆和栈的区别：1、内存分配方式不同；2、大小不同；3、数据访问方式不同；4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容，供大家免费下载体验。

447

2023.07.18

堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

606

2023.08.10

k8s和docker区别

k8s和docker区别有抽象层次不同、管理范围不同、功能不同、应用程序生命周期管理不同、缩放能力不同、高可用性等等区别。本专题为大家提供k8s和docker区别相关的各种文章、以及下载和课程。

280

2023.07.24

docker进入容器的方法有哪些

docker进入容器的方法：1. Docker exec；2. Docker attach；3. Docker run --interactive --tty；4. Docker ps -a；5. 使用 Docker Compose。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

516

2024.04.08

TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开，深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析，帮助开发者构建类型安全、结构清晰、易维护的前端工程体系，提高团队协作效率与代码质量。

2026.03.13

热门下载

网站特效

网站源码

网站素材

前端模板

Linux 负载高但 CPU 空闲的原因

为什么 top 显示 CPU 使用率低，但 load average 却很高

如何快速定位 D 状态进程和阻塞源头

vmstat 和 /proc/buddyinfo 揭示的隐藏线索

排查 NFS、iSCSI 或容器存储时的特殊陷阱

为什么 `top` 显示 CPU 使用率低，但 `load average` 却很高

`vmstat` 和 `/proc/buddyinfo` 揭示的隐藏线索