0

0

net_rx softirq 高导致单核打满的网卡多队列 + irqbalance 配置

舞夢輝影

舞夢輝影

发布时间:2026-01-19 18:11:26

|

920人浏览过

|

来源于php中文网

原创

net_rx softirq高导致单核CPU打满,本质是网络接收软中断未分散至多核:需验证网卡多队列启用状态、irqbalance运行及策略有效性、IRQ手动绑定合理性,并调优RX队列长度、GRO/LRO及softnet_stat参数。

net_rx softirq 高导致单核打满的网卡多队列 + irqbalance 配置

.net_rx softirq 高导致单核 CPU 打满,本质是网络接收软中断集中在某个 CPU 核上处理,而网卡多队列 + irqbalance 本应分摊负载,但配置不当或机制未生效时就会失效。

确认网卡是否真正启用了多队列

很多网卡默认只启用单个 RX 队列,即使硬件支持多队列,驱动没打开或固件限制也会退化为单队列。需逐层验证:

  • 查物理队列数:ethtool -l eth0(看 Current hardware settings 下的 RX 队列数,非 Supported max)
  • 查当前启用队列数:cat /sys/class/net/eth0/device/sriov_numvfs(仅 SR-IOV 场景)或更通用的:ls /sys/class/net/eth0/device/msi_irqs/(每个 IRQ 对应一个队列)
  • 查驱动是否启用多队列:grep "rx.*queue" /proc/interrupts | grep eth0,应看到多个形如 eth0-rx-0eth0-rx-1 的条目;若只有 eth0(无后缀),说明仍是单队列中断绑定

检查 irqbalance 是否运行且策略合理

irqbalance 不只是“开了就行”,它可能因配置、服务状态或内核参数被绕过:

  • 确认服务活跃:systemctl status irqbalance,且输出含 active (running)
  • 检查是否被禁用:查看 /proc/sys/kernel/irqbalance(值为 1 表示启用),或 cat /etc/default/irqbalance 中是否设了 ENABLED=0
  • 避免干扰策略:若使用 --banirq--hintpolicy=ignore 等参数,可能导致网卡 IRQ 被固定不动;建议用默认策略或显式指定:--hintpolicy=restrict
  • 观察实际分布:watch -n1 'grep eth0 /proc/interrupts',看各 RX 队列 IRQ 是否分散到不同 CPU;若长期只在 CPU0 触发,说明 irqbalance 没生效或被覆盖

手动绑定 IRQ 到 CPU(当 irqbalance 不可靠时)

某些场景(如实时性要求高、irqbalance 与内核版本兼容问题)推荐跳过 irqbalance,直接静态绑定:

百度MCP广场
百度MCP广场

探索海量可用的MCP Servers

下载
  • 查网卡各 RX 队列对应的 IRQ 号:grep eth0-rx /proc/interrupts | awk '{print $1}' | tr -d ':'
  • 将 IRQ 绑定到特定 CPU 掩码(如绑到 CPU1~CPU7):echo 00fe > /proc/irq/[IRQ_NUM]/smp_affinity_list(十六进制掩码,00fe = CPU1~7)
  • 注意:需确保目标 CPU 不承担其他高负载任务(如应用进程、ksoftirqd),否则仍会打满;可配合 taskset 将业务进程绑到其余核
  • 持久化:写入 systemd service 或网络脚本,在网卡 up 后执行(因 IRQ 号可能随重启变化,建议用 udev rule + shell 脚本动态识别)

补充调优:降低 net_rx softirq 压力本身

分流只是治标,还需减少单次软中断要处理的数据量:

  • 增大 RX 队列长度:ethtool -G eth0 rx 4096(防丢包,也缓解突发冲击)
  • 启用 GRO/LRO(谨慎):ethtool -K eth0 gro on,合并小包减少中断次数;但会增加延迟和 CPU 解包开销,高吞吐低延迟场景慎用
  • 检查是否被 NAPI polling 阻塞:若 cat /proc/net/softnet_stat 第二列(dropped)持续增长,说明 softirq 处理不过来,需调大 net.core.netdev_budget(默认300)或优化协议路径

相关专题

更多
python中print函数的用法
python中print函数的用法

python中print函数的语法是“print(value1, value2, ..., sep=' ', end=' ', file=sys.stdout, flush=False)”。本专题为大家提供print相关的文章、下载、课程内容,供大家免费下载体验。

185

2023.09.27

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

392

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

572

2023.08.10

class在c语言中的意思
class在c语言中的意思

在C语言中,"class" 是一个关键字,用于定义一个类。想了解更多class的相关内容,可以阅读本专题下面的文章。

465

2024.01.03

python中class的含义
python中class的含义

本专题整合了python中class的相关内容,阅读专题下面的文章了解更多详细内容。

13

2025.12.06

default gateway怎么配置
default gateway怎么配置

配置default gateway的步骤:1、了解网络环境;2、获取路由器IP地址;3、登录路由器管理界面;4、找到并配置WAN口设置;5、配置默认网关;6、保存设置并退出;7、检查网络连接是否正常。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

220

2023.12.07

xml格式相关教程
xml格式相关教程

本专题整合了xml格式相关教程汇总,阅读专题下面的文章了解更多详细内容。

0

2026.01.19

PHP WebSocket 实时通信开发
PHP WebSocket 实时通信开发

本专题系统讲解 PHP 在实时通信与长连接场景中的应用实践,涵盖 WebSocket 协议原理、服务端连接管理、消息推送机制、心跳检测、断线重连以及与前端的实时交互实现。通过聊天系统、实时通知等案例,帮助开发者掌握 使用 PHP 构建实时通信与推送服务的完整开发流程,适用于即时消息与高互动性应用场景。

11

2026.01.19

微信聊天记录删除恢复导出教程汇总
微信聊天记录删除恢复导出教程汇总

本专题整合了微信聊天记录相关教程大全,阅读专题下面的文章了解更多详细内容。

85

2026.01.18

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
国外Web开发全栈课程全集
国外Web开发全栈课程全集

共12课时 | 1.0万人学习

进程与SOCKET
进程与SOCKET

共6课时 | 0.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号