LinuxCPU软中断过高_CPU软中断排查方法

冰川箭仙

发布时间：2026-03-05 09:51:12

282人浏览过

来源于php中文网

原创

linuxcpu软中断过高_cpu软中断排查方法

软中断（softirq）过高，典型表现是 top 中 %si 持续超过 10%～15%，而系统负载（load average）不高、用户态和内核态 CPU 使用率（%us/%sy）却明显偏低。这说明 CPU 时间正被内核后台中断处理大量占用，不是业务逻辑在跑，而是网络收包、定时器或调度任务在“卡住”CPU。

看 /proc/softirqs 定位主因类型

软中断种类多，但真正影响性能的通常只有三类：

NET_RX：网络数据包接收软中断。飙升说明网卡收包压力大，常见于高并发短连接、SYN Flood、UDP 风暴等场景
TIMER：内核定时器软中断。异常升高可能源于大量 hrtimer 或 RCU 回调堆积，比如某些驱动或模块频繁注册微秒级定时器
SCHED：调度器软中断。持续偏高往往指向进程调度过于频繁，如大量短生命周期线程、cgroup 频繁限频触发重调度

执行 cat /proc/softirqs，重点对比各 CPU 列中这三列数值。若某 CPU 的 NET_RX 值比其他核高出一个数量级（例如 500 万 vs 5 万），说明软中断严重不均衡，大概率是硬中断绑定单一 CPU 导致的“单核瓶颈”。

查硬中断分布与网卡队列配置

软中断不均，根源常在硬中断绑定和网卡多队列策略错配：

TicNote

出门问问推出的Agent AI智能硬件

下载

用 cat /proc/interrupts | grep eth0 查看各 CPU 上 eth0 相关硬中断次数，确认是否集中在 0 号核
运行 cat /sys/class/net/eth0/device/msi_irqs/* 确认网卡支持的 MSI-X 向量数（即硬件队列数），应与 CPU 核数匹配
检查 cat /proc/sys/net/core/rps_cpu_mask 是否为空：为空表示 RPS（Receive Packet Steering）关闭，软中断无法跨核分发，必须开启

RPS、RSS、XPS 配置不一致时，容易触发 soft lockup 日志（dmesg | grep watchdog），此时仅调参数无效，需统一规划队列映射关系。

调参要讲配合，不能只改 netdev_budget

net.core.netdev_budget 控制每次软中断上下文最多处理多少个包，默认 300。盲目调大（如设为 600）反而更卡：

它会让 net_rx_action 占用单次软中断时间过长，阻塞其他关键任务（如实时线程、调度器）
合理值参考：千兆网卡建议 60–120，万兆网卡 120–240
必须同步调整：net.core.netdev_max_backlog（建议 ≥5000），并确保 RPS 已启用，否则只是把丢包压力转成延迟压力

交叉验证是否真由软中断拖慢业务

仅看 %si 高不够，要确认它是否实际打断了业务线程：

运行 perf record -e 'syscalls:sys_enter_nanosleep,irq:softirq_entry' -C 0 -g -- sleep 10
再执行 perf script | grep -E '(net_rx|nanosleep)'
若大量 nanosleep 调用被 net_rx_action 中断打断，且堆栈显示在 __do_softirq 中单次耗时超 1ms，才可判定软中断是直接诱因

Linux多网卡路由异常_路由表分析与修复

Linux启动失败怎么排查_启动日志分析流程

Linux网络连接数过高_TCP连接分析方法

Linux 软件安装失败排查方法

Linux磁盘空间不足怎么办_磁盘空间应急处理流程

相关标签:

linux 栈堆 class 线程并发 udp linux

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Linux日志报错怎么看_常见日志错误解析下一篇：暂无

作者最新文章

Linux 磁盘读写性能测试方法

2026-03-03 15:27

Python日期时间怎么处理_datetime模块详解

2026-03-03 15:31

Python处理HTTP异常_网络错误处理思路

2026-03-03 16:17

Linux journalctl 日志查看与过滤技巧

2026-03-03 16:31

SQL字符串拼接_CONCAT函数使用详解

2026-03-03 16:31

Linux alias 提升运维效率的方法

2026-03-03 16:36

PHP 数组在大数据量场景下的性能瓶颈

2026-03-03 16:59

京东留错手机号不能签收怎么办？京东账号的手机号不用了怎么办

2026-03-03 17:08

京东小金库利息比余额宝高吗？京东小金库亏了20万可以退吗

2026-03-03 18:01

Python写入Excel文件_openpyxl实战

2026-03-03 18:04

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

堆和栈的区别

堆和栈的区别：1、内存分配方式不同；2、大小不同；3、数据访问方式不同；4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容，供大家免费下载体验。

433

2023.07.18

堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

600

2023.08.10

堆和栈的区别

433

2023.07.18

堆和栈区别

600

2023.08.10

class在c语言中的意思

在C语言中，"class" 是一个关键字，用于定义一个类。想了解更多class的相关内容，可以阅读本专题下面的文章。

768

2024.01.03

python中class的含义

本专题整合了python中class的相关内容，阅读专题下面的文章了解更多详细内容。

2025.12.06

线程和进程的区别

线程和进程的区别：线程是进程的一部分，用于实现并发和并行操作，而线程共享进程的资源，通信更方便快捷，切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

743

2023.08.10

tcp和udp的区别

TCP和UDP的区别，在连接性、可靠性、速度和效率、数据报大小以及适用场景等方面。本专题为大家提供tcp和udp的区别的相关的文章、下载、课程内容，供大家免费下载体验。

124

2023.07.25

PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开，重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景，深入分析性能瓶颈定位与优化思路，帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

2026.03.04

热门下载

网站特效

网站源码

网站素材

前端模板