0

0

Linux BSP实战课(网络篇):数据包的发送过程

絕刀狂花

絕刀狂花

发布时间:2025-07-22 11:18:02

|

407人浏览过

|

来源于php中文网

原创

本文将以一个udp包的接收过程为例,详细介绍在linux系统中,数据包如何从应用程序逐步传输到网卡并最终发送出去。

socket层Linux BSP实战课(网络篇):数据包的发送过程socket(...):创建一个socket结构体,并初始化相应的操作函数。由于我们定义的是UDP的socket,因此其中包含与UDP相关的函数。sendto(sock, ...):应用层程序(Application)调用该函数开始发送数据包,该函数会调用后续的inet_sendmsg。inet_sendmsg:该函数主要检查当前socket是否已绑定源端口,若未绑定,则调用inet_autobind分配一个端口,然后调用UDP层的函数。inet_autobind:该函数会调用socket上绑定的get_port函数获取一个可用的端口。由于该socket是UDP的socket,因此get_port函数会调用到UDP代码中的相应函数。

UDP层Linux BSP实战课(网络篇):数据包的发送过程udp_sendmsg:udp模块发送数据包的入口函数,该函数较长。在该函数中,首先调用ip_route_output_flow获取路由信息(主要包括源IP和网卡),然后调用ip_make_skb构造skb结构体,最后将网卡的信息与该skb关联。ip_route_output_flow:该函数根据路由表和目的IP,找到数据包应从哪个设备发送。如果该socket未绑定源IP,该函数还会根据路由表找到一个最合适的源IP。如果该socket已绑定源IP,但根据路由表,从该源IP对应的网卡无法到达目的地址,则该包会被丢弃,导致数据发送失败,sendto函数将返回错误。该函数最后将找到的设备和源IP塞进flowi4结构体并返回给udp_sendmsg。ip_make_skb:该函数的功能是构造skb包,构造好的skb包中已分配IP包头,并初始化了部分信息(IP包头的源IP在这里被设置)。同时,该函数会调用ip_append_data,如果需要分片,会在ip_append_data函数中进行分片,同时还会在该函数中检查socket的send buffer是否已用完,若用完,则返回ENOBUFS。udp_send_skb(skb, fl4) 主要是往skb中填充UDP的包头,同时处理checksum,然后调用IP层的相应函数。

IP层Linux BSP实战课(网络篇):数据包的发送过程ip_send_skb:IP模块发送数据包的入口函数,该函数只是简单地调用后面的函数ip_local_out_sk:设置IP报文头的长度和checksum,然后调用netfilter的钩子NF_INET_LOCAL_OUT。NF_INET_LOCAL_OUT:netfilter的钩子,可以通过iptables配置如何处理该数据包。如果该数据包未被丢弃,则继续往下走。dst_output_sk:该函数根据skb中的信息,调用相应的output函数。在我们UDP IPv4这种情况下,会调用ip_output。ip_output:将上面udp_sendmsg得到的网卡信息写入skb,然后调用NF_INET_POST_ROUTING的钩子。NF_INET_POST_ROUTING:在这里,用户可能配置了SNAT,从而导致该skb的路由信息发生变化。ip_finish_output:这里会判断经过上一步后,路由信息是否发生变化。如果发生变化,需要重新调用dst_output_sk(重新调用这个函数时,可能不会再走到ip_output,而是走到被netfilter指定的output函数,这里可能是xfrm4_transport_output),否则继续往下走。ip_finish_output2:根据目的IP到路由表中找到下一跳(nexthop)的地址,然后调用__ipv4_neigh_lookup_noref去arp表中找下一跳的neigh信息,若未找到,会调用neigh_create构造一个空的neigh结构体。dst_neigh_output:在该函数中,如果上一步ip_finish_output2未得到neigh信息,将会走到函数neigh_resolve_output中,否则直接调用neigh_hh_output。在该函数中,会将neigh信息中的mac地址填到skb中,然后调用dev_queue_xmit发送数据包。neigh_resolve_output:该函数中会发送arp请求,得到下一跳的mac地址,然后将mac地址填到skb中并调用dev_queue_xmit。

讯飞智作-虚拟主播
讯飞智作-虚拟主播

讯飞智作是一款集AI配音、虚拟人视频生成、PPT生成视频、虚拟人定制等多功能的AI音视频生产平台。已广泛应用于媒体、教育、短视频等领域。

下载

netdevice子系统Linux BSP实战课(网络篇):数据包的发送过程dev_queue_xmit:netdevice子系统的入口函数,在该函数中,会先获取设备对应的qdisc,如果没有(如loopback或IP tunnels),就直接调用dev_hard_start_xmit,否则数据包将经过Traffic Control模块进行处理。Traffic Control:这里主要进行一些过滤和优先级处理。如果队列满了,数据包会被丢弃,详情请参考文档。这步完成后也会走到dev_hard_start_xmit。dev_hard_start_xmit:该函数中,首先是拷贝一份skb给“packet taps”,tcpdump就是从这里得到数据的,然后调用ndo_start_xmit。如果dev_hard_start_xmit返回错误(大部分情况可能是NETDEV_TX_BUSY),调用它的函数会将skb放到一个地方,然后抛出软中断NET_TX_SOFTIRQ,交给软中断处理程序net_tx_action稍后重试(如果是loopback或IP tunnels,失败后不会有重试的逻辑)。ndo_start_xmit:这是一个函数指针,会指向具体驱动发送数据的函数。

Device Driver ndo_start_xmit会绑定到具体网卡驱动的相应函数,到这一步之后,就归网卡驱动管了。不同的网卡驱动有不同的处理方式,这里不做详细介绍,其大概流程如下:

将skb放入网卡自己的发送队列 通知网卡发送数据包 网卡发送完成后发送中断给CPU 收到中断后进行skb的清理工作 在网卡驱动发送数据包过程中,会有一些地方需要和netdevice子系统打交道,比如网卡的队列满了,需要告诉上层不要再发了,等队列有空闲的时候,再通知上层接着发数据。

其它 SO_SNDBUF:从上面的流程中可以看出,对于UDP来说,没有一个对应的send buffer存在,SO_SNDBUF只是一个限制,当这个socket分配的skb占用的内存超过这个值时,会返回ENOBUFS。因此,只要不出现ENOBUFS错误,把这个值调大没有意义。从sendto函数的帮助文件中看到这样一句话:(Normally, this does not occur in Linux. Packets are just silently dropped when a device queue overflows.)。这里的device queue应该指的是Traffic Control中的queue,说明在Linux中,默认的SO_SNDBUF值已经足够queue使用。疑问的地方是,queue的长度和个数是可以配置的,如果配置太大的话,按道理应该有可能会出现ENOBUFS的情况。 txqueuelen:很多地方都说这是控制qdisc中queue长度的配置,但似乎只是部分类型的qdisc使用了该配置,如Linux默认的pfifo_fast。 hardware RX:一般网卡都有一个自己的ring queue,这个queue的大小可以通过ethtool来配置。当驱动收到发送请求时,一般是放到这个queue中,然后通知网卡发送数据。当这个queue满的时候,会给上层调用返回NETDEV_TX_BUSY。 packet taps(AF_PACKET):当第一次发送数据包和重试发送数据包时,都会经过这里。

相关专题

更多
golang结构体相关大全
golang结构体相关大全

本专题整合了golang结构体相关大全,想了解更多内容,请阅读专题下面的文章。

197

2025.06.09

golang结构体方法
golang结构体方法

本专题整合了golang结构体相关内容,请阅读专题下面的文章了解更多。

189

2025.07.04

tcp和udp的区别
tcp和udp的区别

TCP和UDP的区别,在连接性、可靠性、速度和效率、数据报大小以及适用场景等方面。本专题为大家提供tcp和udp的区别的相关的文章、下载、课程内容,供大家免费下载体验。

119

2023.07.25

udp是什么协议
udp是什么协议

UDP是OSI参考模型中一种无连接的传输层协议。本专题为大家带来udp是什么协议的相关文章,免费提供给大家。

286

2023.08.08

tcp和udp有什么区别
tcp和udp有什么区别

tcp和udp的区别有:1、udp是无连接的,tcp是面向连接的;2、udp是不可靠传输,tcp是可靠传输;3、udp是面向报文传输,tcp是面向字节流传输。想了解更多tcp相关的内容,可阅读本专题下面的相关文章。

380

2024.11.14

磁盘配额是什么
磁盘配额是什么

磁盘配额是计算机中指定磁盘的储存限制,就是管理员可以为用户所能使用的磁盘空间进行配额限制,每一用户只能使用最大配额范围内的磁盘空间。php中文网为大家提供各种磁盘配额相关的内容,教程,供大家免费下载安装。

1349

2023.06.21

如何安装LINUX
如何安装LINUX

本站专题提供如何安装LINUX的相关教程文章,还有相关的下载、课程,大家可以免费体验。

704

2023.06.29

linux find
linux find

find是linux命令,它将档案系统内符合 expression 的档案列出来。可以指要档案的名称、类别、时间、大小、权限等不同资讯的组合,只有完全相符的才会被列出来。find根据下列规则判断 path 和 expression,在命令列上第一个 - ( ) , ! 之前的部分为 path,之后的是 expression。还有指DOS 命令 find,Excel 函数 find等。本站专题提供linux find相关教程文章,还有相关

294

2023.06.30

Java JVM 原理与性能调优实战
Java JVM 原理与性能调优实战

本专题系统讲解 Java 虚拟机(JVM)的核心工作原理与性能调优方法,包括 JVM 内存结构、对象创建与回收流程、垃圾回收器(Serial、CMS、G1、ZGC)对比分析、常见内存泄漏与性能瓶颈排查,以及 JVM 参数调优与监控工具(jstat、jmap、jvisualvm)的实战使用。通过真实案例,帮助学习者掌握 Java 应用在生产环境中的性能分析与优化能力。

13

2026.01.20

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 7.5万人学习

Git 教程
Git 教程

共21课时 | 2.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号