0

0

如何使用Perf工具分析c++程序的性能瓶颈【Linux性能分析】

冰火之心

冰火之心

发布时间:2025-12-19 15:46:02

|

164人浏览过

|

来源于php中文网

原创

c++kquote>Perf 是 Linux 下精准定位 C++ 程序 CPU 瓶颈、缓存失效及分支预测失败的核心工具;需带调试符号编译,用 perf record -g 采样后通过 perf report -g --no-children 查看 Self 占比高的函数,并结合 cache-misses/cache-references > 5% 等指标识别缓存问题。

如何使用perf工具分析c++程序的性能瓶颈【linux性能分析】

Perf 是 Linux 下最强大的性能分析工具之一,能直接对接内核事件,精准定位 C++ 程序的 CPU 热点、函数调用开销、缓存失效、分支预测失败等底层瓶颈。关键不是“跑 perf record”,而是选对事件、过滤干扰、结合符号信息读懂输出。

快速定位 CPU 瓶颈函数(最常用场景)

先确认程序已编译带调试符号(-g),且未过度优化(-O2 可接受,避免 -O3 内联过度导致函数名丢失)。运行:

perf record -g -p $(pidof your_program) sleep 10

或对单次运行采样:

perf record -g ./your_program arg1 arg2

然后生成火焰图或直接查看调用

立即学习C++免费学习笔记(深入)”;

perf report -g --no-children

重点关注 Self 列占比高的函数——这是该函数自身耗时(不含子调用),通常就是瓶颈源头。若某函数 Self 很低但 Children 很高,说明它只是“中转站”,真正耗时在它调用的下层函数里。

识别缓存与内存访问问题

C++ 性能常卡在 L1/L2 缓存未命中或内存带宽上。用以下命令捕获关键硬件事件:

eMart 网店系统
eMart 网店系统

功能列表:底层程序与前台页面分离的效果,对页面的修改无需改动任何程序代码。完善的标签系统,支持自定义标签,公用标签,快捷标签,动态标签,静态标签等等,支持标签内的vbs语法,原则上运用这些标签可以制作出任何想要的页面效果。兼容原来的栏目系统,可以很方便的插入一个栏目或者一个栏目组到页面的任何位置。底层模版解析程序具有非常高的效率,稳定性和容错性,即使模版中有错误的标签也不会影响页面的显示。所有的标

下载
  • perf record -e cycles,instructions,cache-references,cache-misses,mem-loads,mem-stores -g ./your_program
  • perf stat -e cycles,instructions,cache-misses,LLC-load-misses,branch-misses ./your_program

关注几个比值:cache-misses / cache-references > 5% 表示缓存局部性差;LLC-load-misses 高 说明频繁跨核访问或数据分散;instructions / cycles (如低于 0.8)意味着 CPU 常因等待内存而停顿。

分析锁竞争与调度延迟(多线程 C++ 程序)

若程序有明显线程阻塞或吞吐不升反降,检查:

  • perf record -e sched:sched_switch,sched:sched_stat_sleep,sched:sched_stat_blocked -g ./your_program
  • perf script | grep -E "(sleep|blocked)" | head -20

再配合 perf report -F comm,dso,symbol 查看哪些线程在哪段代码里长时间睡眠或被阻塞。常见原因包括:std::mutex 争抢、condition_variable 等待、IO 阻塞、或 std::this_thread::sleep_for 误用。

精简报告并聚焦 C++ 符号(避免汇编干扰)

默认 perf 可能显示大量汇编或模板实例(如 std::_Function_handler<...>),用这些方式提纯:

  • --demangle 自动还原 C++ 函数名(需安装 libstdc++-devel)
  • --no-children 关闭调用树折叠,避免模板膨胀掩盖主干逻辑
  • 过滤掉系统库:添加 -F +sym 并在 report 中输入 / 搜索你的命名空间(如 myapp::
  • 生成火焰图更直观:perf script | FlameGraph/stackcollapse-perf.pl | FlameGraph/flamegraph.pl > perf.svg

不复杂但容易忽略。

相关文章

数码产品性能查询
数码产品性能查询

该软件包括了市面上所有手机CPU,手机跑分情况,电脑CPU,电脑产品信息等等,方便需要大家查阅数码产品最新情况,了解产品特性,能够进行对比选择最具性价比的商品。

下载

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

相关专题

更多
堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

390

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

572

2023.08.10

磁盘配额是什么
磁盘配额是什么

磁盘配额是计算机中指定磁盘的储存限制,就是管理员可以为用户所能使用的磁盘空间进行配额限制,每一用户只能使用最大配额范围内的磁盘空间。php中文网为大家提供各种磁盘配额相关的内容,教程,供大家免费下载安装。

1349

2023.06.21

如何安装LINUX
如何安装LINUX

本站专题提供如何安装LINUX的相关教程文章,还有相关的下载、课程,大家可以免费体验。

701

2023.06.29

linux find
linux find

find是linux命令,它将档案系统内符合 expression 的档案列出来。可以指要档案的名称、类别、时间、大小、权限等不同资讯的组合,只有完全相符的才会被列出来。find根据下列规则判断 path 和 expression,在命令列上第一个 - ( ) , ! 之前的部分为 path,之后的是 expression。还有指DOS 命令 find,Excel 函数 find等。本站专题提供linux find相关教程文章,还有相关

294

2023.06.30

linux修改文件名
linux修改文件名

本专题为大家提供linux修改文件名相关的文章,这些文章可以帮助用户快速轻松地完成文件名的修改工作,大家可以免费体验。

776

2023.07.05

linux系统安装教程
linux系统安装教程

linux系统是一种可以免费使用,自由传播,多用户、多任务、多线程、多CPU的操作系统。本专题提供linux系统安装教程相关的文章,大家可以免费体验。

572

2023.07.06

linux查看文件夹大小
linux查看文件夹大小

Linux是一种自由和开放源码的类Unix操作系统,存在着许多不同的Linux版本,但它们都使用了Linux内核。Linux可安装在各种计算机硬件设备中,比如手机、平板电脑、路由器、视频游戏控制台、台式计算机、大型机和超级计算机。linux怎么查看文件夹大小呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

545

2023.07.20

高德地图升级方法汇总
高德地图升级方法汇总

本专题整合了高德地图升级相关教程,阅读专题下面的文章了解更多详细内容。

40

2026.01.16

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

相关下载

更多

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 7.3万人学习

Git 教程
Git 教程

共21课时 | 2.7万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号