net_rx softirq 高导致单核打满的网卡多队列 + irqbalance 配置

舞夢輝影

发布时间：2026-01-19 18:11:26

940人浏览过

来源于php中文网

原创

net_rx softirq高导致单核CPU打满，本质是网络接收软中断未分散至多核：需验证网卡多队列启用状态、irqbalance运行及策略有效性、IRQ手动绑定合理性，并调优RX队列长度、GRO/LRO及softnet_stat参数。

net_rx softirq 高导致单核打满的网卡多队列 + irqbalance 配置

net_rx softirq 高导致单核 CPU 打满，本质是网络接收软中断集中在某个 CPU 核上处理，而网卡多队列 + irqbalance 本应分摊负载，但配置不当或机制未生效时就会失效。

确认网卡是否真正启用了多队列

很多网卡默认只启用单个 RX 队列，即使硬件支持多队列，驱动没打开或固件限制也会退化为单队列。需逐层验证：

查物理队列数：ethtool -l eth0（看 Current hardware settings 下的 RX 队列数，非 Supported max）
查当前启用队列数：cat /sys/class/net/eth0/device/sriov_numvfs（仅 SR-IOV 场景）或更通用的：ls /sys/class/net/eth0/device/msi_irqs/（每个 IRQ 对应一个队列）
查驱动是否启用多队列：grep "rx.*queue" /proc/interrupts | grep eth0，应看到多个形如 eth0-rx-0、eth0-rx-1 的条目；若只有 eth0（无后缀），说明仍是单队列中断绑定

检查 irqbalance 是否运行且策略合理

irqbalance 不只是“开了就行”，它可能因配置、服务状态或内核参数被绕过：

Bolt.new

Bolt.new是一个免费的AI全栈开发工具

下载

确认服务活跃：systemctl status irqbalance，且输出含 active (running)
检查是否被禁用：查看 /proc/sys/kernel/irqbalance（值为 1 表示启用），或 cat /etc/default/irqbalance 中是否设了 ENABLED=0
避免干扰策略：若使用 --banirq 或 --hintpolicy=ignore 等参数，可能导致网卡 IRQ 被固定不动；建议用默认策略或显式指定：--hintpolicy=restrict
观察实际分布：watch -n1 'grep eth0 /proc/interrupts'，看各 RX 队列 IRQ 是否分散到不同 CPU；若长期只在 CPU0 触发，说明 irqbalance 没生效或被覆盖

手动绑定 IRQ 到 CPU（当 irqbalance 不可靠时）

某些场景（如实时性要求高、irqbalance 与内核版本兼容问题）推荐跳过 irqbalance，直接静态绑定：

查网卡各 RX 队列对应的 IRQ 号：grep eth0-rx /proc/interrupts | awk '{print $1}' | tr -d ':'
将 IRQ 绑定到特定 CPU 掩码（如绑到 CPU1~CPU7）：echo 00fe > /proc/irq/[IRQ_NUM]/smp_affinity_list（十六进制掩码，00fe = CPU1~7）
注意：需确保目标 CPU 不承担其他高负载任务（如应用进程、ksoftirqd），否则仍会打满；可配合 taskset 将业务进程绑到其余核
持久化：写入 systemd service 或网络脚本，在网卡 up 后执行（因 IRQ 号可能随重启变化，建议用 udev rule + shell 脚本动态识别）

补充调优：降低 net_rx softirq 压力本身

分流只是治标，还需减少单次软中断要处理的数据量：

增大 RX 队列长度：ethtool -G eth0 rx 4096（防丢包，也缓解突发冲击）
启用 GRO/LRO（谨慎）：ethtool -K eth0 gro on，合并小包减少中断次数；但会增加延迟和 CPU 解包开销，高吞吐低延迟场景慎用
检查是否被 NAPI polling 阻塞：若 cat /proc/net/softnet_stat 第二列（dropped）持续增长，说明 softirq 处理不过来，需调大 net.core.netdev_budget（默认300）或优化协议栈路径

Linux进程异常退出_core文件分析

Linux CPU瓶颈定位工具_perf使用实践

Linux监控系统延迟_监控链路性能分析

Linux进程卡死不退出_进程假死排查技巧

Linux容器宿主机排错_容器与宿主机联动

相关标签:

栈 .net echo print restrict 栈 class default tr

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：K3s helm chart 安装失败 "failed to install CRD" 或版本冲突下一篇：mdadm RAID1 同步过程中掉电导致 superblock 不一致的修复步骤

作者最新文章

如何办理签证?办理签证最全流程

2026-03-11 11:26

SQL长事务优化_事务拆分与锁控制技巧

2026-03-11 11:28

Linux用户文件无法访问_权限继承问题分析

2026-03-11 13:31

Linux网络异常排查_route与ARP分析

2026-03-11 13:49

Linux日志审计如何实施_安全审计实践思路

2026-03-11 13:55

SQL视图性能问题_视图查询优化方法

2026-03-11 14:03

Adobe如何拆分PDF Adobe PDF页面拆分操作指南

2026-03-11 14:04

腾讯会议电脑如何投屏

2026-03-11 14:08

PHP PDO 安全机制面试考点

2026-03-11 14:35

Linux CPU任务优先级调整_nice优化策略

2026-03-11 14:49

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

python中print函数的用法

python中print函数的语法是“print(value1, value2, ..., sep=' ', end=' ', file=sys.stdout, flush=False)”。本专题为大家提供print相关的文章、下载、课程内容，供大家免费下载体验。

192

2023.09.27

python print用法与作用

本专题整合了python print的用法、作用、函数功能相关内容，阅读专题下面的文章了解更多详细教程。

2026.02.03

堆和栈的区别

堆和栈的区别：1、内存分配方式不同；2、大小不同；3、数据访问方式不同；4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容，供大家免费下载体验。

443

2023.07.18

堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

605

2023.08.10

class在c语言中的意思

在C语言中，"class" 是一个关键字，用于定义一个类。想了解更多class的相关内容，可以阅读本专题下面的文章。

870

2024.01.03

python中class的含义

本专题整合了python中class的相关内容，阅读专题下面的文章了解更多详细内容。

2025.12.06

default gateway怎么配置

配置default gateway的步骤：1、了解网络环境；2、获取路由器IP地址；3、登录路由器管理界面；4、找到并配置WAN口设置；5、配置默认网关；6、保存设置并退出；7、检查网络连接是否正常。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

236

2023.12.07

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

2026.03.11

Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开，系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示，帮助开发者构建稳定高效的 Go 并发任务处理系统，提高系统在高负载环境下的处理能力与稳定性。

2026.03.10

热门下载

网站特效

网站源码

网站素材

前端模板