0

0

irqbalance 不均衡导致单核 softirq 打满的网卡多队列调优

舞姬之光

舞姬之光

发布时间:2026-01-24 17:40:03

|

857人浏览过

|

来源于php中文网

原创

irqbalance默认POWERSAVING策略会将网卡中断聚合到少数CPU以省电,导致softirq集中打满单核;应停用irqbalance,按物理核和NUMA节点手动绑定各队列IRQ,并关闭RPS/RFS。

irqbalance 不均衡导致单核 softirq 打满的网卡多队列调优

为什么 irqbalance 默认策略会让网卡中断集中到单个 CPU?

irqbalance 默认使用 POWERSAVING 模式(尤其在低负载时),会主动将中断聚合到少数 CPU 上以降低功耗。网卡多队列(如 eth0-TxRx-0eth0-TxRx-7)的 IRQ 如果被合并调度到同一物理核,该核的 softirq(特别是 NET_RX)就会持续打满,而其他核空闲。

这不是 bug,是设计取舍——但对高吞吐、低延迟网络场景完全不适用。

  • 确认当前模式:irqbalance --debug --oneshot 2>&1 | grep "policy"
  • 查看各 IRQ 实际绑定:cat /proc/interrupts | grep eth0,观察列中数字是否集中在某几列
  • 检查 CPU topology:用 lscpu 确认物理核/超线程关系,避免把多个队列绑到同一物理核的两个逻辑 CPU 上

停用 irqbalance 改用手动 IRQ 绑定更可控

自动均衡器在 NUMA 多插槽、异构核心(如 Intel P/E 核)、或启用了 isolcpus 的场景下极易误判。直接关闭它,用 set_irq_affinity.sh(内核自带)或手动写 /proc/irq/*/smp_affinity_list 更可靠。

  • 停服务:systemctl stop irqbalance && systemctl disable irqbalance
  • 查网卡支持队列数:ethtool -l eth0 | grep "Current hardware settings"
  • 运行绑定脚本:/usr/lib/irqbalance/set_irq_affinity.sh eth0(注意:该脚本默认按物理核轮询,但需确认其行为是否匹配你的拓扑)
  • 若脚本不适用,手动绑定示例:echo 0-1,4-5 > /proc/irq/123/smp_affinity_list(其中 123 是对应队列 IRQ 号)

绑定时必须避开超线程同核干扰和 NUMA 跨节点访问

eth0-TxRx-0eth0-TxRx-1 都绑到 CPU0 和 CPU1(即同一物理核的两个逻辑 CPU),会导致 L1/L2 缓存争抢,softirq 处理延迟反而升高。同样,若网卡在 Node 0,却把中断绑到 Node 1 的 CPU,会触发跨 NUMA 访存,带宽下降明显。

通义灵码
通义灵码

阿里云出品的一款基于通义大模型的智能编码辅助工具,提供代码智能生成、研发智能问答能力

下载
  • lscpunumactl --hardware 明确每个 CPU 所属 Node 和 Core ID
  • 优先将每个队列绑定到不同物理核的第一个逻辑 CPU(如 CPU0、CPU2、CPU4…)
  • 确认网卡所在 NUMA nodelspci -vv -s $(ethtool -i eth0 | grep bus-info | awk '{print $2}') | grep NUMA
  • 绑定后验证:运行 watch -n1 'cat /proc/interrupts | grep eth0',观察各列计数是否均匀增长

softirq 打满还可能和 RPS/RFS 配置冲突

即使 IRQ 分散了,如果启用了 RPS(Receive Packet Steering)且配置不当,仍可能让所有软中断集中在某个 CPU 处理。RPS 是在 softirq 上层做二次分发,和底层 IRQ 绑定是两层机制,容易叠加错位。

  • 检查是否启用:cat /sys/class/net/eth0/queues/rx-0/rps_cpus,非全 0 表示启用
  • 高吞吐场景建议关闭 RPS:echo 0 > /sys/class/net/eth0/queues/rx-0/rps_cpus(全部 rx 队列都要关)
  • RFS(RPS 的流感知增强版)更要禁用,它依赖 net.core.rps_sock_flow_entries,易引发 hash 冲突和单核热点
  • 确认无残留:sysctl net.core.rps_sock_flow_entries 应为 0

真正起效的永远是 IRQ 到物理核的硬绑定;RPS/RFS 在现代多队列网卡上已非必需,反而增加不可控路径。

相关专题

更多
python中print函数的用法
python中print函数的用法

python中print函数的语法是“print(value1, value2, ..., sep=' ', end=' ', file=sys.stdout, flush=False)”。本专题为大家提供print相关的文章、下载、课程内容,供大家免费下载体验。

186

2023.09.27

class在c语言中的意思
class在c语言中的意思

在C语言中,"class" 是一个关键字,用于定义一个类。想了解更多class的相关内容,可以阅读本专题下面的文章。

468

2024.01.03

python中class的含义
python中class的含义

本专题整合了python中class的相关内容,阅读专题下面的文章了解更多详细内容。

13

2025.12.06

线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

482

2023.08.10

c++ 根号
c++ 根号

本专题整合了c++根号相关教程,阅读专题下面的文章了解更多详细内容。

25

2026.01.23

c++空格相关教程合集
c++空格相关教程合集

本专题整合了c++空格相关教程,阅读专题下面的文章了解更多详细内容。

29

2026.01.23

yy漫画官方登录入口地址合集
yy漫画官方登录入口地址合集

本专题整合了yy漫画入口相关合集,阅读专题下面的文章了解更多详细内容。

117

2026.01.23

漫蛙最新入口地址汇总2026
漫蛙最新入口地址汇总2026

本专题整合了漫蛙最新入口地址大全,阅读专题下面的文章了解更多详细内容。

170

2026.01.23

C++ 高级模板编程与元编程
C++ 高级模板编程与元编程

本专题深入讲解 C++ 中的高级模板编程与元编程技术,涵盖模板特化、SFINAE、模板递归、类型萃取、编译时常量与计算、C++17 的折叠表达式与变长模板参数等。通过多个实际示例,帮助开发者掌握 如何利用 C++ 模板机制编写高效、可扩展的通用代码,并提升代码的灵活性与性能。

16

2026.01.23

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
HTML5/CSS3/JavaScript/ES6入门课程
HTML5/CSS3/JavaScript/ES6入门课程

共102课时 | 6.8万人学习

前端基础到实战(HTML5+CSS3+ES6+NPM)
前端基础到实战(HTML5+CSS3+ES6+NPM)

共162课时 | 19万人学习

第二十二期_前端开发
第二十二期_前端开发

共119课时 | 12.5万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号