0

0

Linux 服务器出现随机丢包但 ping 延迟正常怎么用 perf 定位

舞夢輝影

舞夢輝影

发布时间:2026-01-19 17:51:08

|

273人浏览过

|

来源于php中文网

原创

丢包通常源于内核协议栈或驱动异常(如校验失败、缓冲区溢出、软中断延迟),可用perf定位函数级问题;先用tcpdump确认丢包位置,再通过perf trace和record分析ICMP生命周期及高开销路径,结合/proc/net/snmp指标验证根因。

linux 服务器出现随机丢包但 ping 延迟正常怎么用 perf 定位

这种情况往往不是网络层丢包,而是内核协议或驱动在处理特定数据包时出错(比如校验失败、缓冲区溢出、软中断不及时),perf 可以帮你定位到具体函数甚至指令级的异常行为。

确认丢包发生在本机协议栈

先排除物理链路和中间设备干扰:用 tcpdump -i eth0 'icmp and icmp[icmptype] == icmp-echo' 抓包,对比发送端发出的 echo request 和本机收到的是否一致。如果发了 100 个但 tcpdump 只捕获到 92 个,说明丢包发生在网卡驱动或更前(如硬件过滤);如果 tcpdump 捕获齐全但应用层没收到 reply,则问题在 IP 层或 ICMP 处理路径(如 netfilter、路由查找、socket 接收队列溢出)。

用 perf trace 监控 ICMP 相关系统调用和内核事件

运行以下命令持续观察 ICMP 包的生命周期:

perf trace -e 'syscalls:sys_enter_sendto,syscalls:sys_exit_sendto,syscalls:sys_enter_recvfrom,syscalls:sys_exit_recvfrom,napi:napi_poll,net:netif_receive_skb,net:net_dev_queue,icmp:icmp_rcv' -a sleep 30

重点关注:
icmp_rcv 是否被频繁触发但无对应 sendto 返回(说明进来了但没回包)
napi_poll 耗时是否突增或调用次数骤减(软中断处理瓶颈)
netif_receive_skb 有输入但 icmp_rcv 缺失(可能被 iptables DROP 或校验失败静默丢弃)

用 perf record 捕获高开销函数(重点看软中断和内存路径)

在复现丢包期间运行:

百度MCP广场
百度MCP广场

探索海量可用的MCP Servers

下载
perf record -e 'irq:softirq_entry,irq:softirq_exit,kmem:kmalloc,kmem:kfree,skb:consume_skb,icmp:icmp_rcv' -g --call-graph dwarf -a sleep 60

然后分析:

perf report -g --no-children | grep -A5 -B5 "icmp_rcv\|napi\|softirq"

常见线索:
icmp_rcv 下游调用 ip_local_deliver_finish__inet_lookup 耗时长 → 可能 conntrack 表爆炸或哈希冲突
consume_skb 出现在 napi_poll 中但频率远低于 netif_receive_skb → SKB 未被及时消费,接收队列堆积
kmalloc 失败或慢速路径频繁触发 → 内存碎片或 slab 不足(尤其 skbuff_head_cache

结合 /proc/net/snmp 和 /proc/net/netstat 验证假设

丢包前后执行:

netstat -s -p icmp | grep -E "(In|Out)Cmp" && cat /proc/net/snmp | grep -A1 "Icmp\|Ip"

关键指标:
IcmpInErrors 上升 → 校验失败、长度错误等硬性丢包
IcmpInDestUnreachs 异常增多 → 路由或本地端口不可达(可能因 socket 队列满)
UdpInCsumErrorsTcpInCsumErrors 同步上升 → 网卡 offload 设置错误(如 ethtool -K eth0 rx off tx off 关闭校验卸载后对比)

相关专题

更多
堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

392

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

572

2023.08.10

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

392

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

572

2023.08.10

磁盘配额是什么
磁盘配额是什么

磁盘配额是计算机中指定磁盘的储存限制,就是管理员可以为用户所能使用的磁盘空间进行配额限制,每一用户只能使用最大配额范围内的磁盘空间。php中文网为大家提供各种磁盘配额相关的内容,教程,供大家免费下载安装。

1349

2023.06.21

如何安装LINUX
如何安装LINUX

本站专题提供如何安装LINUX的相关教程文章,还有相关的下载、课程,大家可以免费体验。

703

2023.06.29

linux find
linux find

find是linux命令,它将档案系统内符合 expression 的档案列出来。可以指要档案的名称、类别、时间、大小、权限等不同资讯的组合,只有完全相符的才会被列出来。find根据下列规则判断 path 和 expression,在命令列上第一个 - ( ) , ! 之前的部分为 path,之后的是 expression。还有指DOS 命令 find,Excel 函数 find等。本站专题提供linux find相关教程文章,还有相关

294

2023.06.30

linux修改文件名
linux修改文件名

本专题为大家提供linux修改文件名相关的文章,这些文章可以帮助用户快速轻松地完成文件名的修改工作,大家可以免费体验。

776

2023.07.05

PHP WebSocket 实时通信开发
PHP WebSocket 实时通信开发

本专题系统讲解 PHP 在实时通信与长连接场景中的应用实践,涵盖 WebSocket 协议原理、服务端连接管理、消息推送机制、心跳检测、断线重连以及与前端的实时交互实现。通过聊天系统、实时通知等案例,帮助开发者掌握 使用 PHP 构建实时通信与推送服务的完整开发流程,适用于即时消息与高互动性应用场景。

11

2026.01.19

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 7.4万人学习

Git 教程
Git 教程

共21课时 | 2.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号