perf是Linux下C++性能分析利器,基于perf_events采样,无需修改代码即可定位热点函数与CPU瓶颈;需编译时加-g生成调试信息,用perf stat看整体指标,perf record/report分析函数级耗时,perf top实时监控,配合火焰图可直观展示调用栈。

C++ 程序性能分析中,perf 是 Linux 下非常强大的性能剖析工具,它基于内核的性能事件子系统(perf_events),无需修改代码即可对程序进行采样和统计,帮助定位热点函数、CPU 占用、缓存命中率等问题。
一、perf 工具简介与安装
perf 是 Linux 自带的性能分析工具,通常随 kernel-devel 或 linux-tools 包提供。
在 Ubuntu/Debian 上安装:
sudo apt install linux-tools-common linux-tools-generic在 CentOS/RHEL 上:
立即学习“C++免费学习笔记(深入)”;
sudo yum install perf验证是否可用:
perf --version二、编译 C++ 程序时的准备
为了获得有意义的函数名和行号信息,编译时需加入调试符号:
说明:
- -g:生成调试信息,perf 才能映射到具体函数和源码行
- -O2:保持优化级别接近生产环境,避免因关闭优化导致性能失真
三、常用 perf 命令与使用方法
1. perf stat:查看整体性能统计
perf stat ./myapp输出包括:
- CPU 周期数(cycles)
- 指令执行数(instructions)
- IPC(每周期指令数)
- 缓存命中/缺失
- 上下文切换、页面错误等
2. perf record + perf report:函数级热点分析
perf record -g ./myapp运行完成后生成 perf.data 文件,再用:
perf report查看采样结果,-g 表示记录调用栈,可展开函数调用关系。
在 perf report 界面中,可看到各函数占用 CPU 的百分比,定位耗时最多的函数。3. perf top:实时监控正在运行的程序
perf top -p $(pgrep myapp)类似 top 命令,但显示的是当前进程的函数级 CPU 占用,适合长时间运行服务的动态分析。
四、实际使用技巧与注意事项
符号解析问题
如果 perf report 显示的是地址而非函数名,检查是否:- 编译时加了 -g
- 没有 strip 过二进制文件
- perf 版本与内核匹配
权限问题
某些系统需要调整 perf 权限:sudo sh -c 'echo 1 > /proc/sys/kernel/perf_event_paranoid'值设为 -1 可开启更多功能,1 或 2 更安全。
过滤特定线程或 CPU
perf record -t指定采样频率
perf record -F 997 ./myappF 越高采样越密集,但开销也越大,997 是常用值。
基本上就这些。perf 结合火焰图(如使用 FlameGraph 工具)还能可视化调用栈,进一步提升分析效率。掌握这些方法后,C++ 性能瓶颈排查会更加高效直接。











