0

0

Linux 网络通信从应用到网卡的完整流程

舞夢輝影

舞夢輝影

发布时间:2026-01-28 20:19:02

|

112人浏览过

|

来源于php中文网

原创

socket系统调用通过陷入内核态交由socket子系统处理,send/sendto/write触发协议栈下行;TCP走tcp_sendmsg()、UDP走udp_sendmsg(),经路由查找、ARP解析后生成sk_buff,经qdisc、驱动ndo_start_xmit提交至网卡DMA发送。

linux 网络通信从应用到网卡的完整流程

socket 系统调用如何触发内核协议处理

应用层调用 socket()bind()connect()sendto() 时,并不直接操作硬件,而是陷入内核态,由内核的 socket 子系统接管。关键点在于:这些调用本身不发包,只是准备数据结构和状态;真正触发网络栈下行的是 send() / sendto() / write() 这类写操作。

常见误区是认为 connect() 就发 SYN 包——其实它只是设置 socket 状态为 CONNECTING,真正发包发生在第一次 send()(阻塞模式)或内核在后续软中断中调度发送队列(非阻塞 + EPOLLOUT 场景)。

  • AF_INET + SOCK_STREAM 对应 TCP 协议栈入口,走 inet_stream_opstcp_sendmsg()
  • UDP 走 udp_sendmsg(),不建连接,路径更短,但依然要经过路由查找(ip_route_output_flow())和邻居子系统(ARP)
  • 若目标 IP 不在同一子网,且路由表未缓存下一跳 MAC,send() 可能被阻塞在 ARP 请求完成前(尤其在 SOCK_DGRAM 首次发包时)

IP 层怎么决定走哪个网卡和下一跳 MAC

内核通过 fib_lookup() 查路由表(FIB),结果不是“目标 IP”,而是 struct rtablestruct fib_result,其中包含:

  • oif:出接口索引,对应具体网卡(如 eth0 的 dev->ifindex
  • gateway:若非直连,此字段为下一跳路由器 IP
  • dst:最终封装用的目标 IP(可能与原始 send 目标不同,比如经策略路由或 NAT 后)

拿到出接口和下一跳 IP 后,进入邻居子系统(neighbour subsystem):如果目标是直连网段,查 arp_table 获取 MAC;如果是网关,则查该网关 IP 对应的 MAC。查不到就发 ARP 请求并临时挂起 sk_buff 在 skb->dst->neighbour->arp_queue 上,等响应回来再重发。

注意:ip route get 可验证实际选路结果,而 ip neigh show 能看到当前 ARP 缓存——很多“ping 通但应用连不上”的问题,根源是 ARP 表老化或被防火墙丢弃了请求。

sk_buff 如何从协议栈落到网卡驱动

数据包经 TCP/UDP/IP 封装后,变成一个 sk_buff 结构体,最终调用 dev_queue_xmit() 进入设备层。这里的关键跳转是:

百家CMS微商城
百家CMS微商城

百家CMS微商城从诞生开始,就坚持着简单实用的原则,基于目前最流行的WEB2.0的架构(php+mysql),拥有成熟、稳定的微电商技术解决方案。基于完整的会员等级制度,完善的微商城购物流程,订单管理、优惠券、搜索、购物车等功能。采用跨平台机制,可同时对接微信公众号平台和支付宝服务窗,兼容微博、手机QQ等平台;丰富的支付方式、支持微信支付、支付宝支付、货到付款、余额支付、网银支付等。并且拥有完整的

下载

dev_queue_xmit() → 检查 dev->flags & IFF_UP → 进入 qdisc(如 pfifo_fast)→ __qdisc_run()sch_direct_xmit()dev_hard_start_xmit() → 网卡驱动的 ndo_start_xmit 回调

  • 若启用了 GSO(Generic Segmentation Offload),TCP 分段可能延迟到驱动层(skb_is_gso() 为真),由网卡硬件完成分片,此时 sk_buff 携带的是大包 + gso_size
  • 若网卡不支持 TSO/GSO,内核在 tcp_tso_segment() 提前分片,生成多个小 sk_buff
  • dev->xmit_lock 是 per-CPU 锁,高并发下锁竞争可能成为瓶颈,可通过 ethtool -L eth0 combined N 调整队列数缓解

网卡驱动如何把数据交给物理介质

驱动的 ndo_start_xmit 实现因芯片而异,但通用流程是:将 sk_buff 数据地址和长度写入网卡 DMA 描述符环(descriptor ring),触发 tx_doorbell 告知硬件取包。此时 CPU 不等待发送完成,而是继续处理其他任务。

真正发出信号靠网卡硬件:它读取描述符,用 DMA 把数据搬进自己的 FIFO,按以太网帧格式(含 preamble、SFD、DA/SA、type、FCS)串行输出到 PHY 层,PHY 再转成电信号(RJ45)或光信号(SFP)。

容易忽略的点:

  • /proc/net/dev 中的 tx_dropped 不代表线缆没信号,可能是驱动 ring 满(tx_fifo_errors)、DMA 映射失败(tx_aborted_errors)或校验错误
  • ethtool -S eth0 可查看芯片级计数器,比如 tx_packets(驱动提交数) vs tx_unicast(PHY 实际发出单播帧数),差值过大说明链路层丢包
  • 启用 CONFIG_NET_RX_BUSY_POLL 或 XDP 程序时,部分路径会绕过传统 softirq,需确认是否影响你观察的统计点

整个流程里,最易被当成“黑盒”而掩盖真实瓶颈的,其实是邻居子系统和 qdisc 队列——它们不报错,但会让包在内存里滞留几十毫秒,且不会出现在 tcpdump 中。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
504 gateway timeout怎么解决
504 gateway timeout怎么解决

504 gateway timeout的解决办法:1、检查服务器负载;2、优化查询和代码;3、增加超时限制;4、检查代理服务器;5、检查网络连接;6、使用负载均衡;7、监控和日志;8、故障排除;9、增加缓存;10、分析请求。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

584

2023.11.27

default gateway怎么配置
default gateway怎么配置

配置default gateway的步骤:1、了解网络环境;2、获取路由器IP地址;3、登录路由器管理界面;4、找到并配置WAN口设置;5、配置默认网关;6、保存设置并退出;7、检查网络连接是否正常。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

223

2023.12.07

golang结构体相关大全
golang结构体相关大全

本专题整合了golang结构体相关大全,想了解更多内容,请阅读专题下面的文章。

220

2025.06.09

golang结构体方法
golang结构体方法

本专题整合了golang结构体相关内容,请阅读专题下面的文章了解更多。

192

2025.07.04

treenode的用法
treenode的用法

​在计算机编程领域,TreeNode是一种常见的数据结构,通常用于构建树形结构。在不同的编程语言中,TreeNode可能有不同的实现方式和用法,通常用于表示树的节点信息。更多关于treenode相关问题详情请看本专题下面的文章。php中文网欢迎大家前来学习。

538

2023.12.01

C++ 高效算法与数据结构
C++ 高效算法与数据结构

本专题讲解 C++ 中常用算法与数据结构的实现与优化,涵盖排序算法(快速排序、归并排序)、查找算法、图算法、动态规划、贪心算法等,并结合实际案例分析如何选择最优算法来提高程序效率。通过深入理解数据结构(链表、树、堆、哈希表等),帮助开发者提升 在复杂应用中的算法设计与性能优化能力。

17

2025.12.22

深入理解算法:高效算法与数据结构专题
深入理解算法:高效算法与数据结构专题

本专题专注于算法与数据结构的核心概念,适合想深入理解并提升编程能力的开发者。专题内容包括常见数据结构的实现与应用,如数组、链表、栈、队列、哈希表、树、图等;以及高效的排序算法、搜索算法、动态规划等经典算法。通过详细的讲解与复杂度分析,帮助开发者不仅能熟练运用这些基础知识,还能在实际编程中优化性能,提高代码的执行效率。本专题适合准备面试的开发者,也适合希望提高算法思维的编程爱好者。

26

2026.01.06

硬盘接口类型介绍
硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍:1、IDE接口是一种并行接口,主要用于连接硬盘和光驱等设备,它主要有两种类型:ATA和ATAPI,IDE接口已经逐渐被SATA接口;2、SATA接口是一种串行接口,相较于IDE接口,它具有更高的传输速度、更低的功耗和更小的体积;3、SCSI接口等等。

1106

2023.10.19

俄罗斯Yandex引擎入口
俄罗斯Yandex引擎入口

2026年俄罗斯Yandex搜索引擎最新入口汇总,涵盖免登录、多语言支持、无广告视频播放及本地化服务等核心功能。阅读专题下面的文章了解更多详细内容。

158

2026.01.28

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 8万人学习

Git 教程
Git 教程

共21课时 | 3.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号