0

0

dmesg 显示 "INFO: rcu detected stall" 的 CPU 卡死或中断风暴解决

舞夢輝影

舞夢輝影

发布时间:2026-01-20 12:07:07

|

791人浏览过

|

来源于php中文网

原创

“INFO: rcu detected stall”是Linux内核RCU子系统主动报告的严重调度异常信号,表明某CPU长时间未响应,常由驱动缺陷、硬件故障或内核配置不当引发,需结合dmesg、/proc/interrupts、/proc/softirqs等定位根因。

dmesg 显示 \

“INFO: rcu detected stall” 是 Linux 内核 RCU(Read-Copy-Update)子系统检测到 CPU 长时间未响应调度或无法完成 RCU 宽限期的警告,通常意味着某个 CPU 核心被长时间占用(比如死循环、高优先级中断持续抢占、内核锁竞争、硬件异常等),导致 RCU 机制超时。这不是单纯“CPU 卡死”的最终结果,而是内核主动发现并报告的**严重调度异常信号**,常伴随系统响应迟缓、软中断堆积、ksoftirqd 持续 100%、网络收发停滞、定时器不准等现象。

确认是否真为 RCU Stall(而非误报或瞬时抖动)

RCU stall 默认超时为 21 秒(CONFIG_RCU_CPU_STALL_TIMEOUT=21),但部分内核或配置可能更短。先排除瞬时干扰:

  • 检查 dmesg -T | grep -i "rcu.*stall" 是否重复出现(尤其在负载稳定后仍频繁触发);
  • 对比 /proc/sys/kernel/rcu_cpu_stall_timeout 值,确认当前阈值;
  • 观察 stall 信息末尾是否带 “detected by CPU X”,定位具体卡住的 CPU;
  • cat /proc/interrupts 查看该 CPU 上中断计数是否异常飙升(如某一 irq 几秒内增长数万次);
  • 运行 watch -n1 'cat /proc/softirqs' 看 HI/NET_RX/TIMER 等列是否持续猛增。

排查常见硬件与驱动诱因

多数真实 RCU stall 源于底层驱动或硬件问题,尤其是以下几类:

Frase
Frase

Frase是一款出色的长篇 AI 写作工具,快速创建seo优化的内容。

下载
  • 网卡驱动缺陷:特别是使用老旧或非主线驱动(如某些 Realtek、Intel 万兆旧版 ixgbe、某些 Broadcom BCM57xx)时,在高包率或特定丢包场景下可能陷入 softirq 死循环;
  • PCIe 设备异常:坏掉的 NVMe SSD、故障 GPU、劣质雷电扩展坞可能引发 AER 错误或持续 MSI 中断,阻塞 CPU;检查 dmesg | grep -i "aer\|pcie\|nvme\|error"
  • ACPI 或固件 bug:某些笔记本/服务器 BIOS 存在 SMI(System Management Interrupt)风暴,完全绕过 Linux 调度,导致 CPU 看似“消失”;可尝试加启动参数 acpi_enforce_resources=lax acpi_irq_balance=off 临时规避;
  • 内存 ECC 错误或不稳定:silent corruption 可能导致内核路径异常挂起,查看 /var/log/mcelogdmesg | grep -i "mce\|ecc\|memory"

软件与内核配置层面缓解与诊断

若暂无法更换硬件或驱动,可通过内核参数和运行时调优争取诊断窗口和稳定性:

  • 启动时添加 rcu_cpu_stall_timeout=60 延长检测窗口,避免误报掩盖真实问题;
  • 启用 RCU 调试:加 rcu_tracercu_nocb_poll(需 CONFIG_RCU_NOCB_CPU=y),再配合 cat /sys/kernel/debug/rcu/* 查看各 CPU 宽限期状态;
  • 禁用 NO_HZ_FULL(即 nohz_full= 不设或清空)——该模式对 RCU 敏感,容易在单核绑定场景触发 stall;
  • perf record -e irq:softirq_entry -a sleep 10 && perf script 抓取软中断热点,定位是哪个 softirq(NET_RX?SCHED?)长期霸占 CPU;
  • 检查是否启用了 CONFIG_PREEMPT_RT 补丁且配置不当——实时补丁对 RCU 要求更严,错误的线程优先级或锁嵌套极易引发 stall。

快速应急与长期规避建议

线上系统发生 stall 时,优先保服务、留线索:

  • 立即执行 echo w > /proc/sysrq-trigger(同步脏页)、echo t > /proc/sysrq-trigger(打印当前所有任务),获取关键现场;
  • 若系统尚可响应,运行 crash /usr/lib/debug/lib/modules/$(uname -r)/vmlinux /proc/kcore 分析内核内存(需提前装 debuginfo);
  • 临时规避:对已知问题设备,用 echo 0 > /sys/bus/pci/devices/XXXX:XX:XX.X/enable 热拔插禁用(谨慎操作);
  • 长期方案:升级至较新稳定内核(≥5.10+ 对 RCU stall 的诊断信息更全),使用主线驱动(如替换 r8169 为 r8168、用 mlx5_core 替代老旧 mlx4);
  • 生产环境避免将关键服务绑定到单个 CPU 并启用 nohz_full,RCU 在非对称负载下更易暴露缺陷。

相关专题

更多
scripterror怎么解决
scripterror怎么解决

scripterror的解决办法有检查语法、文件路径、检查网络连接、浏览器兼容性、使用try-catch语句、使用开发者工具进行调试、更新浏览器和JavaScript库或寻求专业帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

187

2023.10.18

500error怎么解决
500error怎么解决

500error的解决办法有检查服务器日志、检查代码、检查服务器配置、更新软件版本、重新启动服务、调试代码和寻求帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

288

2023.10.25

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

392

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

572

2023.08.10

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

392

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

572

2023.08.10

线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

481

2023.08.10

磁盘配额是什么
磁盘配额是什么

磁盘配额是计算机中指定磁盘的储存限制,就是管理员可以为用户所能使用的磁盘空间进行配额限制,每一用户只能使用最大配额范围内的磁盘空间。php中文网为大家提供各种磁盘配额相关的内容,教程,供大家免费下载安装。

1349

2023.06.21

Java JVM 原理与性能调优实战
Java JVM 原理与性能调优实战

本专题系统讲解 Java 虚拟机(JVM)的核心工作原理与性能调优方法,包括 JVM 内存结构、对象创建与回收流程、垃圾回收器(Serial、CMS、G1、ZGC)对比分析、常见内存泄漏与性能瓶颈排查,以及 JVM 参数调优与监控工具(jstat、jmap、jvisualvm)的实战使用。通过真实案例,帮助学习者掌握 Java 应用在生产环境中的性能分析与优化能力。

0

2026.01.20

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 7.5万人学习

Git 教程
Git 教程

共21课时 | 2.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号