Linux /proc/net/softnet_stat 的 softirq 统计与网络中断负载均衡

冷炫風刃

发布时间：2026-02-21 17:22:40

663人浏览过

来源于php中文网

原创

/proc/net/softnet_stat 每行第0列（从0开始）对应cpu的net_rx softirq触发次数，第1列是因backlog溢出导致的丢包数，二者共同反映软中断负载压力。

linux /proc/net/softnet_stat 的 softirq 统计与网络中断负载均衡

怎么看 `softnet_stat` 里哪一列对应 CPU 的 softirq 负载

直接看 /proc/net/softnet_stat 每行第 0 列（从 0 开始数）——它就是该 CPU 上 NET_RX softirq 的总执行次数。别被后面十几列迷惑，前两列才是关键：col 0 是收包软中断触发次数，col 1 是该 CPU 上因 backlog 溢出导致的丢包数（即 processed 不够快，队列满后丢弃的包）。

常见错误是拿第 2 列或第 9 列当“负载”，其实它们分别是「已处理但延迟过高的包数」和「被 ksoftirqd 接管的次数」，不能直接反映实时负载压力。

cat /proc/net/softnet_stat 输出每行对应一个 CPU，行号 = CPU 编号
用 awk '{print $1}' /proc/net/softnet_stat 可快速汇总所有 CPU 的触发总数
如果某 CPU 的 col 1 持续非零，说明它的 NET_RX 处理不过来，不是中断没分摊好，就是该核本身太忙

为什么绑定了 RPS/RFS 还是看到单个 CPU softirq 飙高

RPS（Receive Packet Steering）和 RFS（Receive Flow Steering）只负责把软中断上下文「推」到目标 CPU 的 input_pkt_queue，但最终是否真由那个 CPU 执行，取决于 ksoftirqd/CPU 的唤醒时机和调度延迟。换句话说：RPS 决定“往哪送”，不保证“立刻被谁处理”。

典型现象是：RPS 配置生效了，/proc/net/softnet_stat 里多个 CPU 的 col 0 都在涨，但其中某个 CPU 的 col 1（drop）持续上升，同时 top -H 看到 ksoftirqd/0 占用率远高于其它核。

MakeLogo AI

AI驱动的Logo生成器

下载

检查 /proc/sys/net/core/rps_sock_flow_entries 是否太小，导致 RFS 流表频繁淘汰，回退到默认 CPU
确认 /sys/class/net/eth0/queues/rx-0/rps_cpus 设置的是十六进制掩码，比如 ff 表示前 8 个 CPU 全开，写成 0xff 会失败且无提示
RPS 不影响硬件中断亲和性（IRQ affinity），如果硬中断全打在 CPU 0，即使 RPS 分发，CPU 0 的 ksoftirqd/0 仍要处理所有软中断初始化工作，容易成为瓶颈

`softnet_stat` 里 `col 9`（ksoftirqd 唤醒次数）突然暴涨意味着什么

col 9 是该 CPU 上 ksoftirqd 被显式唤醒的次数，不是 softirq 执行次数。它暴涨通常说明：softirq 处理函数（如 net_rx_action）在一次调用中没能清空本地 backlog，被迫让出 CPU 并唤醒 ksoftirqd 继续干——本质是单次 softirq 循环被 net.core.netdev_budget 限制中断了。

这不是异常，但结合 col 1（drop）一起看就有问题：如果 col 9 高 + col 1 也高，说明预算不够、处理太慢、或者网卡帧太碎（小包多），导致反复唤醒 ksoftirqd 还清不完。

调大 net.core.netdev_budget（默认 300）可减少唤醒次数，但可能延长单次 softirq 占用时间，影响调度响应
小包场景下，开启 GRO（ethtool -K eth0 gro on）比调 budget 更有效，能合并入站包，降低 softirq 调用频次
col 9 单独高而 col 1 为 0，大概率只是流量大+budget 保守，属正常现象

用 `perf` 抓 `net_rx_action` 样本时为什么看不到预期的 CPU 分布

因为 perf record -e irq:softirq_entry --filter "vec == 3"（3 是 NET_RX 向量）抓到的是「进入 softirq 处理」的点，而 RPS/RFS 的分发逻辑发生在更早的硬中断下半部（NAPI poll 前），此时 perf 还没开始跟踪。所以你看到的 CPU 分布，其实是 NAPI poll 实际运行的位置，不等于 RPS 目标 CPU。

更糟的是，如果启用了 CONFIG_SOFTIRQ_ON_OWN_STACK（5.10+ 内核默认），net_rx_action 可能在任意 CPU 的 softirq stack 上运行，跟初始分发 CPU 完全脱钩。

想验证 RPS 是否生效，别依赖 perf 跟函数，直接对比 /proc/net/softnet_stat 各 CPU 的 col 0 增速差异
用 watch -n1 'cat /proc/interrupts | grep eth0' 确认硬中断是否真的分散了；RPS 再好，硬中断全挤在 CPU 0，软中断负载还是难均衡
perf 抓 netif_receive_skb_core 或 __napi_poll 更贴近实际分发效果，但需内核调试符号支持

真实负载均衡的关键不在参数调多花哨，而在硬中断分布、budget 与包长的匹配、以及 col 1 是否为零——只要还有 drop，就说明当前路径存在不可绕过的瓶颈，调别的都只是缓释。

Linux skopeo copy / inspect / delete 的镜像仓库管理实践

Linux rpm 软件包管理技巧

Linux inode 与文件系统性能关系

Linux cgroups v2 在 systemd 与容器运行时的统一迁移路径

Linux LVM 管理与快照使用技巧

相关标签:

linux print Filter 循环 class linux 负载均衡

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Linux /etc vs /usr vs /var vs /opt 的目录用途边界与误用常见风险下一篇：Linux Descheduler 的 Pod 驱逐策略与低利用率节点优化

作者最新文章

微信电脑版文件已过期或被清理怎么恢复微信电脑版文件被清理恢复方法

2026-02-19 12:57

GitHub 仓库怎么上传文件？文件上传与提交方法讲解

2026-02-19 13:03

Python HSM（硬件安全模块）的 Python 接口

2026-02-19 13:34

天猫养车附近门店怎么找？附近天猫养车店地址

2026-02-19 13:36

edge网页版官网入口 Edge在线服务访问说明

2026-02-19 13:38

Python PyScript / Pyodide 的前端集成实践

2026-02-19 13:52

手机淘宝如何开店注册？手机淘宝如何开店注册店铺

2026-02-19 13:59

SQL 事务日志分析与优化实践

2026-02-19 14:21

Python 时区转换的常见 Bug 总结

2026-02-19 14:23

腾讯会议电脑版无法开启视频怎么办

2026-02-19 14:25

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

AI 图片处理图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

python中print函数的用法

python中print函数的语法是“print(value1, value2, ..., sep=' ', end=' ', file=sys.stdout, flush=False)”。本专题为大家提供print相关的文章、下载、课程内容，供大家免费下载体验。

192

2023.09.27

python print用法与作用

本专题整合了python print的用法、作用、函数功能相关内容，阅读专题下面的文章了解更多详细教程。

2026.02.03

class在c语言中的意思

在C语言中，"class" 是一个关键字，用于定义一个类。想了解更多class的相关内容，可以阅读本专题下面的文章。

686

2024.01.03

python中class的含义

本专题整合了python中class的相关内容，阅读专题下面的文章了解更多详细内容。

2025.12.06

磁盘配额是什么

磁盘配额是计算机中指定磁盘的储存限制，就是管理员可以为用户所能使用的磁盘空间进行配额限制，每一用户只能使用最大配额范围内的磁盘空间。php中文网为大家提供各种磁盘配额相关的内容，教程，供大家免费下载安装。

1520

2023.06.21

如何安装LINUX

本站专题提供如何安装LINUX的相关教程文章，还有相关的下载、课程，大家可以免费体验。

715

2023.06.29

linux find

find是linux命令，它将档案系统内符合 expression 的档案列出来。可以指要档案的名称、类别、时间、大小、权限等不同资讯的组合，只有完全相符的才会被列出来。find根据下列规则判断 path 和 expression，在命令列上第一个 - ( ) , ! 之前的部分为 path，之后的是 expression。还有指DOS 命令 find，Excel 函数 find等。本站专题提供linux find相关教程文章，还有相关

300

2023.06.30