0

0

Linux如何监控内核性能?_Linuxperf工具分析与应用

星夢妙者

星夢妙者

发布时间:2025-08-05 08:41:01

|

843人浏览过

|

来源于php中文网

原创

linux内核性能监控的核心工具是perf。1. perf提供了硬件、软件及内核事件的多维度监控,能精准定位性能瓶颈;2. 它包含perf stat用于高层性能概览,perf record记录性能事件生成数据文件,perf report解析并展示详细性能信息;3. perf top提供实时性能视图,可结合-c参数观察特定cpu核心状态;4. perf支持跟踪系统调用、上下文切换等具体事件,还可通过动态探针(kprobes/uprobes)监控任意函数或指令;5. 通过perf script配合flamegraph生成火焰图,实现性能数据可视化,直观呈现热点函数及其调用链;6. 高级功能如perf annotate可映射性能数据至源码或汇编级别,perf probe则可用于调试无预定义埋点的场景。这些功能共同构成了全面、深入的性能分析体系。

Linux如何监控内核性能?_Linuxperf工具分析与应用

Linux内核性能监控的核心工具无疑是

perf
。它提供了一个深入操作系统内核的窗口,让我们能够观察到硬件、软件以及内核事件的细微之处,从而定位性能瓶颈。这不仅仅是一个命令,更是一种理解系统运行状态的哲学。

Linux如何监控内核性能?_Linuxperf工具分析与应用

解决方案

要监控Linux内核性能,首先想到的就是使用

perf
工具集。它通常随内核源码或发行版软件包提供,是Linux系统性能分析的瑞士军刀。

最基础的用法,你可以通过

perf stat
来获得一个高层级的性能概览,比如CPU周期、指令数、缓存命中率等。这就像是给系统做个体检,快速了解哪些指标可能不健康。

Linux如何监控内核性能?_Linuxperf工具分析与应用
perf stat -a sleep 5

这条命令会统计整个系统在5秒内的性能事件。

-a
表示系统范围,
sleep 5
只是为了提供一个运行时间窗口。

如果需要更细致的分析,比如想知道某个特定程序或系统在运行期间,哪些函数占用了大量CPU时间,或者导致了频繁的缓存失效,那么

perf record
就派上用场了。它会记录下选定的性能事件,生成一个
perf.data
文件。

Linux如何监控内核性能?_Linuxperf工具分析与应用
perf record -F 99 -g -- ls

这里

-F 99
表示每秒采样99次(一个非整数可以避免与系统调度器对齐),
-g
则会记录调用栈信息,这对于生成火焰图至关重要。
-- ls
表示对
ls
命令的执行进行采样。

记录完数据后,使用

perf report
来解析
perf.data
文件,以交互式界面展示性能数据。

perf report

此外,

perf top
可以提供一个类似
top
命令的实时性能视图,显示当前哪些函数或进程正在消耗最多的CPU资源。

perf top

这些只是

perf
的冰山一角,但它们构成了我们深入内核性能分析的基础。

perf
工具到底能看些什么?深入了解其监控维度

perf
的强大之处在于它能从多个维度捕获性能事件,这远不止CPU利用率那么简单。在我看来,它更像是一个多光谱的扫描仪,能穿透表象,揭示系统深层的工作机制。

首先是硬件性能计数器事件(Hardware Performance Counters, HPCs)。这些事件直接由CPU硬件提供,比如CPU周期(

cpu-cycles
)、指令数(
instructions
)、缓存引用(
cache-references
)、缓存未命中(
cache-misses
)、分支预测失误(
branch-misses
)等等。通过这些,你能知道你的程序是CPU密集型还是内存密集型,是否存在大量的缓存失效导致性能下降。很多时候,我们以为代码逻辑慢,结果发现是内存访问模式不佳,导致CPU一直在等待数据。

其次是软件事件(Software Events)。这些事件由内核提供,反映了内核层面的活动,比如上下文切换(

context-switches
)、页面错误(
page-faults
)、CPU迁移(
cpu-migrations
)等。如果你的程序上下文切换非常频繁,那可能意味着它在等待I/O或者被调度器频繁切换,而不是在做有效计算。

再来是内核跟踪点(Kernel Tracepoints)。这是内核中预定义的埋点,用于跟踪特定的内核行为,例如系统调用(

syscalls
)、进程调度(
sched
)、文件I/O(
block
)等。比如,你可以用
perf
来跟踪所有
open
系统调用的发生,看看哪些文件被频繁打开,或者哪个进程导致了大量的磁盘I/O。这对于理解应用程序与内核的交互模式非常有帮助。

最后,还有动态探针(Kprobes/Uprobes)。这是

perf
最灵活也最强大的功能之一。你可以通过
perf probe
在内核函数或用户空间程序的任意指令地址设置动态探针,监控特定的变量值或函数调用。这就像是外科医生在手术中精确地放置传感器,只为了观察最关键的指标。比如,我想知道某个内核网络函数在什么情况下被调用,传入了什么参数,就可以用Kprobe来做。

这些不同维度的事件结合起来,就构成了一个完整的性能画像。它不只是告诉你“慢”,而是告诉你“为什么慢”,慢在CPU等待数据,还是慢在频繁的上下文切换,亦或是慢在大量的系统调用。

掌握
perf
命令:从入门到实践的常用操作与案例

掌握

perf
命令,就像是学会了驾驶一辆高性能跑车,你得知道每个档位和踏板的作用。这里分享一些我个人觉得在日常工作中非常实用的
perf
操作和一些案例。

最常用的,也是我每次遇到性能问题会先跑的,是针对整个系统的

perf stat

perf stat -a -r 5 sleep 10

-r 5
表示重复运行5次,取平均值。这样可以减少单次运行的偶然性。输出会包含CPU周期、指令数、分支预测失误率、缓存命中率等,这些数据能快速帮你判断系统是CPU瓶颈、内存瓶颈还是I/O瓶颈。如果
instructions per cycle (IPC)
很低,那可能意味着CPU在等待数据或分支预测失误很多。

接下来是针对特定进程的采样。比如,你有一个服务进程ID是12345,想看它在忙什么:

AI发型设计
AI发型设计

虚拟发型试穿工具和发型模拟器

下载
perf record -F 99 -g -p 12345 sleep 30

-p 12345
指定进程ID。记录30秒后,用
perf report
查看。在
perf report
的交互界面里,你可以按
a
键切换到按注释(annotate)模式,查看具体函数的热点代码,甚至能看到汇编指令级别哪个地方耗时最多,这对于优化热点代码非常有帮助。

如果你想实时观察某个CPU核上的情况,

perf top
可以加上
-C
参数:

perf top -C 0

这会显示CPU 0上当前最活跃的函数。当你在排查某个CPU核负载异常高的问题时,这个命令就很有用了。

有时候,你可能想知道在某个特定的系统调用上花费了多少时间。比如,

read
系统调用:

perf record -e 'syscalls:sys_enter_read' -a sleep 5

这会记录所有

read
系统调用的进入事件。当然,你也可以记录
syscalls:sys_exit_read
来计算其执行时间。这种细粒度的事件跟踪,能让你精确地定位到是哪个系统调用成为了瓶颈。

再举个例子,我曾经遇到一个网络服务,在高峰期性能急剧下降。我怀疑是连接接受或处理的问题。于是我用了

perf
来跟踪
accept
系统调用:

perf record -e 'syscalls:sys_enter_accept4' -a sleep 10
perf report

通过

perf report
,我发现
accept4
的调用频率非常高,而且每次调用后的处理函数调用栈也很深。结合代码分析,最终发现是连接池管理不当,导致频繁地创建和销毁连接,而非复用,从而引发了性能问题。

这些操作的组合,能够让你从宏观到微观,逐步缩小问题范围,最终找到真正的性能瓶颈。

perf
数据可视化与高级分析:让性能瓶颈无所遁形

单纯的文本报告,有时候让人看得眼花缭乱,尤其是在调用栈很深的时候。所以,将

perf
数据可视化,是让性能瓶颈无所遁形的关键一步。我个人最喜欢,也觉得最有用的,就是火焰图(Flame Graph)

火焰图是一种非常直观的性能分析可视化工具。它将采样到的调用栈信息,以图形化的方式展现出来,每个矩形代表一个函数,宽度表示该函数在总采样中的占比,堆叠的矩形则表示调用关系。

要生成火焰图,你需要先用

perf record
记录带调用栈的数据,然后结合Brendan Gregg的
FlameGraph
工具集。

  1. 记录数据(确保带-g参数)

    perf record -F 99 -g -a sleep 60

    -a
    表示系统全局采样,
    sleep 60
    是采样时长。

  2. 生成

    perf script
    输出
    perf script
    会将
    perf.data
    文件中的二进制数据转换为可读的文本格式,包含调用栈信息。

    perf script > out.perf
  3. 使用

    FlameGraph
    工具集生成火焰图 这通常需要
    stackcollapse-perf.pl
    flamegraph.pl
    这两个Perl脚本。

    # 下载FlameGraph工具集,例如到 /opt/FlameGraph
    # git clone https://github.com/brendangregg/FlameGraph.git /opt/FlameGraph
    
    cat out.perf | /opt/FlameGraph/stackcollapse-perf.pl | /opt/FlameGraph/flamegraph.pl > kernel_performance.svg

    生成的

    kernel_performance.svg
    是一个SVG图像文件,可以用浏览器打开。在火焰图中,越宽的矩形表示该函数或其子函数消耗的CPU时间越多。你可以点击矩形来放大,深入查看某个调用路径。

火焰图的强大之处在于,它能让你一眼看出哪些函数是“热点”,以及这些热点函数是在哪个调用链上被频繁调用的。它能清晰地展示出CPU时间的消耗分布,帮助你快速定位到那些真正拖慢系统性能的代码路径。

除了火焰图,

perf
本身也提供了一些高级分析功能。例如,
perf annotate
可以在
perf report
中按
a
键进入,它能把性能数据映射回源代码或汇编代码,显示每行代码的性能贡献。这对于深入理解特定函数内部的性能瓶颈非常有用。

# 在 perf report 界面中,选中一个函数后按 'a' 键

再比如,

perf probe
允许你动态地在内核函数或用户空间程序中设置探针,这对于调试和分析那些没有预定义跟踪点的场景非常有用。

# 探测内核函数 tcp_sendmsg 的入口,并打印其参数
perf probe tcp_sendmsg
perf record -e probe:tcp_sendmsg -a sleep 10
perf script

高级分析不仅仅是工具的使用,更是一种思维方式。它要求你不仅仅看到数据,更要理解数据背后的系统行为。一个函数在火焰图上很宽,并不一定意味着它本身写得不好,可能只是因为它被一个非常频繁的循环调用了,或者它在等待某个资源。所以,结合代码逻辑、系统架构和

perf
数据进行综合判断,才是解决问题的关键。这就像是侦探破案,每个线索都很重要,但最终的真相需要所有线索的串联和推理。

相关专题

更多
堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

390

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

572

2023.08.10

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

390

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

572

2023.08.10

传感器故障解决方法
传感器故障解决方法

传感器故障排除指南:识别故障症状(如误读或错误代码)。检查电源和连接(确保连接牢固,无损坏)。校准传感器(遵循制造商说明)。诊断内部故障(目视检查、信号测试、环境影响评估)。更换传感器(选择相同规格,遵循安装说明)。验证修复(检查信号准确性,监测异常行为)。

468

2024.06.04

磁盘配额是什么
磁盘配额是什么

磁盘配额是计算机中指定磁盘的储存限制,就是管理员可以为用户所能使用的磁盘空间进行配额限制,每一用户只能使用最大配额范围内的磁盘空间。php中文网为大家提供各种磁盘配额相关的内容,教程,供大家免费下载安装。

1349

2023.06.21

如何安装LINUX
如何安装LINUX

本站专题提供如何安装LINUX的相关教程文章,还有相关的下载、课程,大家可以免费体验。

702

2023.06.29

linux find
linux find

find是linux命令,它将档案系统内符合 expression 的档案列出来。可以指要档案的名称、类别、时间、大小、权限等不同资讯的组合,只有完全相符的才会被列出来。find根据下列规则判断 path 和 expression,在命令列上第一个 - ( ) , ! 之前的部分为 path,之后的是 expression。还有指DOS 命令 find,Excel 函数 find等。本站专题提供linux find相关教程文章,还有相关

294

2023.06.30

高德地图升级方法汇总
高德地图升级方法汇总

本专题整合了高德地图升级相关教程,阅读专题下面的文章了解更多详细内容。

43

2026.01.16

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 7.3万人学习

Git 教程
Git 教程

共21课时 | 2.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号