0

0

c++如何使用Perf工具分析Linux程序性能_c++火焰图制作与解读【性能】

下次还敢

下次还敢

发布时间:2025-12-08 01:49:08

|

268人浏览过

|

来源于php中文网

原创

perf分析C++性能需确保符号完整与采样真实:编译加-g -fno-omit-frame-pointer,避免strip;用perf record -g -F 99 --call-graph dwarf采集,配合FlameGraph生成火焰图,重点关注顶部宽块、峡谷状突变及模板名冗余问题。

c++如何使用perf工具分析linux程序性能_c++火焰图制作与解读【性能】

在 Linux 下用 perf 分析 C++ 程序性能,核心是采集运行时的 CPU 采样、调用和函数热点,再通过火焰图直观定位瓶颈。关键不在“会不会用 perf”,而在于“采样是否真实反映问题场景”以及“符号是否完整可读”——尤其 C++ 的模板、内联、优化会严重干扰结果。

一、确保 perf 能正确识别 C++ 符号

默认编译的 Release 版本常因 -O2/-O3 和 strip 导致 perf 显示 [unknown] 或地址而非函数名。必须:

  • 编译时加 -g -fno-omit-frame-pointer(后者对调用栈回溯至关重要)
  • 避免 strip 二进制;若必须发布 stripped 版,保留 .debug 文件并用 perf buildid-cache -v 关联
  • 确认系统有 debuginfo 包(如 debuginfo-install glibcxx),否则 STL 函数名也看不到

二、perf record 常用命令组合

不要只跑 perf record -g ./a.out。根据目标选合适事件:

  • 查 CPU 瓶颈: perf record -g -F 99 --call-graph dwarf ./a.out(-F 99 表示每秒采样 99 次,平衡精度与开销;dwarf 比 fp 更准,尤其有内联或尾调用时)
  • 查 cache miss: perf record -e cycles,instructions,cache-references,cache-misses -g ./a.out
  • 查锁竞争: perf record -e sched:sched_stat_sleep,sched:sched_switch -g ./a.out
  • 只分析某段时间:启动后按 Ctrl+Z 暂停 perf,用 perf script 看实时数据,确认 workload 已进入稳态再继续录制

三、生成火焰图(Flame Graph)

perf script 输出的是栈样本文本,需用 FlameGraph 工具转成 SVG:

万兴爱画
万兴爱画

万兴爱画AI绘画生成工具

下载

立即学习C++免费学习笔记(深入)”;

  • 先安装:git clone https://github.com/brendangregg/FlameGraph
  • 导出折叠栈:perf script | ./FlameGraph/stackcollapse-perf.pl > out.folded
  • 生成图:./FlameGraph/flamegraph.pl out.folded > flame.svg
  • 注意:C++ 模板实例化名极长(如 std::vector >::push_back),可用 --minwidth 0.5 参数避免被压缩掉,或预处理折叠相似模板名

四、看懂火焰图的关键细节

火焰图不是“越高越好”或“越宽越差”,而是看:

  • 顶部宽但不高的块:说明该函数自身耗时多(如密集计算、未优化算法)
  • 底部窄、中间突然变宽的“峡谷”:典型 I/O 或锁等待(比如 write() 卡住,上面所有调用都堆在那)
  • 多个平行高柱,名字高度相似但参数不同:可能是模板过度实例化或虚函数频繁分派,考虑用 final 或策略模式收敛
  • 右上角出现大量 [unknown]__libc_start_main:说明符号缺失或 frame pointer 被优化掉,回退检查编译选项

基本上就这些。perf 不复杂,但容易忽略调试信息和采样上下文。真正卡住的往往不是“怎么画图”,而是“为什么图里看不到我想看的函数”。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

483

2023.08.02

int占多少字节
int占多少字节

int占4个字节,意味着一个int变量可以存储范围在-2,147,483,648到2,147,483,647之间的整数值,在某些情况下也可能是2个字节或8个字节,int是一种常用的数据类型,用于表示整数,需要根据具体情况选择合适的数据类型,以确保程序的正确性和性能。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

544

2024.08.29

c++怎么把double转成int
c++怎么把double转成int

本专题整合了 c++ double相关教程,阅读专题下面的文章了解更多详细内容。

113

2025.08.29

C++中int的含义
C++中int的含义

本专题整合了C++中int相关内容,阅读专题下面的文章了解更多详细内容。

200

2025.08.29

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

397

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

575

2023.08.10

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

397

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

575

2023.08.10

C++ 设计模式与软件架构
C++ 设计模式与软件架构

本专题深入讲解 C++ 中的常见设计模式与架构优化,包括单例模式、工厂模式、观察者模式、策略模式、命令模式等,结合实际案例展示如何在 C++ 项目中应用这些模式提升代码可维护性与扩展性。通过案例分析,帮助开发者掌握 如何运用设计模式构建高质量的软件架构,提升系统的灵活性与可扩展性。

14

2026.01.30

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 8.1万人学习

Git 教程
Git 教程

共21课时 | 3.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号