0

0

如何使用PerfEvents在Linux上分析c++ CPU性能瓶颈? (火焰图生成)

冰火之心

冰火之心

发布时间:2026-01-22 12:59:02

|

273人浏览过

|

来源于php中文网

原创

perf record 分析 c++ 程序需编译时加 -g -fno-omit-frame-pointer,用 --demangle 解析符号,经 perf script → stackcollapse-perf.pl → flamegraph.pl 生成火焰图,并注意 inline、jit 和符号路径问题。

如何使用perfevents在linux上分析c++ cpu性能瓶颈? (火焰图生成)

perf record 采集 C++ 程序的 CPU 时间分布

直接用 perf record -g -p <pid></pid>perf record -g -- ./my_program 即可捕获调用,但关键在编译和符号支持。C++ 程序若未保留调试信息或内联过度,火焰图会显示大量 [unknown] 或扁平化函数名。

  • 编译时必须加 -g -fno-omit-frame-pointer(Clang/GCC 均需),否则 -g 不足以支撑 -g 栈回溯
  • 禁用 -O2 以上优化可能更易读,但生产环境建议用 -O2 -g -fno-omit-frame-pointer 平衡真实性和可分析性
  • 若程序启动快、退出快,用 perf record -g -e cpu-clock --duration 5 -- ./my_program 更可靠

解决 perf script 输出中 C++ 符号被截断或 mangling 的问题

perf script 默认输出的是 mangling 后的符号(如 _Z10computeSumi),火焰图工具(如 FlameGraph)无法识别,需 demangle。但不能简单 pipe 给 c++filt —— 它会破坏 perf 脚本格式。

  • 正确做法:用 perf script -F comm,pid,tid,cpu,time,period,ip,sym,dso,trace -F +sym --demangle(Linux 5.14+ 支持 --demangle
  • 旧内核可用 perf script | awk '{ $NF = system("c++filt " $NF " 2>/dev/null || echo " $NF); print }',但性能差、易出错
  • 若仍见大量 [unknown],检查是否加载了 .so 且未带 -g;用 readelf -S ./libxxx.so | grep debug 验证调试段存在

生成火焰图:从 perf.data 到 SVG

核心链路是 perf scriptstackcollapse-perf.plflamegraph.pl,三步缺一不可,且顺序和参数敏感。

A1.art
A1.art

一个创新的AI艺术应用平台,旨在简化和普及艺术创作

下载
  • 确保已安装 FlameGraph 工具集,并将 stackcollapse-perf.plflamegraph.pl 加入 $PATH
  • 标准命令流:
    perf script -F comm,pid,tid,cpu,time,period,ip,sym,dso,trace --demangle | ./stackcollapse-perf.pl | ./flamegraph.pl > profile.svg
  • 若 C++ 模板实例过多导致火焰图过宽,加 --minwidth=0.5 过滤微小帧(单位毫秒),或用 --colors c++ 启用 C++ 专用配色
  • 注意:不要用 perf script -F sym 简写——它默认不输出 IP 和调用关系,stackcollapse-perf.pl 会报错

常见卡点:符号路径缺失与 JIT/inline 冲突

即使有 -gperf 仍可能找不到符号,尤其当程序运行在非标准路径、或使用了 LD_LIBRARY_PATH 加载动态库时。

立即学习C++免费学习笔记(深入)”;

  • perf buildid-list -i perf.data 查看所有模块 build-id,再用 perf buildid-cache -v --add ./my_program 手动注入符号路径
  • C++ inline 函数在火焰图中默认折叠进调用者,想展开需加编译选项 -fno-inline-functions-called-once -fno-inline-small-functions(仅调试期)
  • 若程序含 JIT 代码(如某些 Python/C++ 混合场景),需额外启用 perf record -k 1 并配合 perf inject --jit,否则 JIT 函数全为 [jitted]

火焰图不是万能放大镜——它反映的是采样时刻的 CPU 时间占比,对锁竞争、IO 等非 CPU 瓶颈不敏感;而 C++ 的 RAII、临时对象、move 语义等行为,在火焰图里往往藏在构造/析构函数中,容易被忽略。

相关文章

数码产品性能查询
数码产品性能查询

该软件包括了市面上所有手机CPU,手机跑分情况,电脑CPU,电脑产品信息等等,方便需要大家查阅数码产品最新情况,了解产品特性,能够进行对比选择最具性价比的商品。

下载

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
python中print函数的用法
python中print函数的用法

python中print函数的语法是“print(value1, value2, ..., sep=' ', end=' ', file=sys.stdout, flush=False)”。本专题为大家提供print相关的文章、下载、课程内容,供大家免费下载体验。

192

2023.09.27

python print用法与作用
python print用法与作用

本专题整合了python print的用法、作用、函数功能相关内容,阅读专题下面的文章了解更多详细教程。

18

2026.02.03

c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

254

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

1089

2024.03.01

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

443

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

605

2023.08.10

磁盘配额是什么
磁盘配额是什么

磁盘配额是计算机中指定磁盘的储存限制,就是管理员可以为用户所能使用的磁盘空间进行配额限制,每一用户只能使用最大配额范围内的磁盘空间。php中文网为大家提供各种磁盘配额相关的内容,教程,供大家免费下载安装。

1564

2023.06.21

如何安装LINUX
如何安装LINUX

本站专题提供如何安装LINUX的相关教程文章,还有相关的下载、课程,大家可以免费体验。

716

2023.06.29

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

3

2026.03.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 10.5万人学习

Git 教程
Git 教程

共21课时 | 4.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号