0

0

c++如何进行分支预测优化_c++ [[likely]], [[unlikely]]与代码布局【性能】

裘德小鎮的故事

裘德小鎮的故事

发布时间:2025-12-20 16:49:12

|

551人浏览过

|

来源于php中文网

原创

C++20的[[likely]]和[[unlikely]]属性通过提示编译器优化代码布局与跳转指令,减少分支预测失败开销:前者将高概率路径前置以提升局部性,后者将低概率路径移至冷区以避免缓存污染。

c++如何进行分支预测优化_c++ [[likely]], [[unlikely]]与代码布局【性能】

在 C++ 中,分支预测优化的核心是**减少 CPU 分支预测失败带来的流水线冲刷开销**。现代 CPU 依赖预测器猜测 if/else、循环条件等跳转方向,预测错误会导致数个周期的性能损失。C++20 引入的 [[likely]][[unlikely]] 属性,就是让程序员显式告诉编译器“这条路径大概率会执行”或“大概率不会执行”,从而影响代码布局(如热代码前置)和底层汇编指令选择(如使用带预测提示的跳转指令)。

[[likely]] 与 [[unlikely]] 的作用机制

这两个属性本身不改变逻辑,只作为编译器优化提示:

  • [[likely]] 建议编译器将该语句块(如 if 分支体、case 分支、goto 目标等)生成在更靠近当前指令流的位置,降低取指延迟;部分架构(如 x86-64)可能生成 jcc 指令的“强预测”编码形式。
  • [[unlikely]] 则相反:编译器倾向于把该分支体放到远离主路径的内存区域(如函数末尾或单独 section),避免污染指令缓存热点,并可能选用更节省主路径空间的跳转序列。
  • 它们只对直接修饰的语句有效,不能修饰整个 if 或 else 子句——需放在分支体首行(即左大括号后)或独立语句前。

正确用法示例与常见误用

✅ 正确写法(C++20 起支持):

if (ptr != nullptr) {
    [[likely]] {  // ✅ 修饰复合语句(C++20 允许)
        process(*ptr);
    }
} else {
    [[unlikely]] {  // ✅ 否则分支大概率不走
        fallback();
    }
}

✅ 更常见的写法(修饰单条语句或空语句后接代码):

立即学习C++免费学习笔记(深入)”;

Glimmer Ai
Glimmer Ai

基于GPT-3和DALL·E2的PPT制作工具

下载
if (size > 1024) {
    [[likely]] ;
    heavy_processing(data, size);
} else {
    [[unlikely]] ;
    light_path(data, size);
}

❌ 错误写法:

  • [[likely]] if (x > 0) { ... } —— 属性不能修饰 if 语句本身,语法错误。
  • if (x > 0) [[likely]] { ... } —— 属性位置错,应紧贴语句块开头,不是跟在 if 后面。
  • 滥用在无明显概率倾向的分支上(如用户输入校验结果),反而干扰编译器基于 profile 数据的自动优化。

配合代码布局提升效果

编译器利用 [[likely]]/[[unlikely]] 调整代码布局时,本质是让高频路径指令在内存中连续存放、局部性更好。你可以主动辅助:

  • 把高频执行的函数内联(inline__attribute__((always_inline))),再在其关键分支加 [[likely]],确保热路径真正紧凑。
  • 避免在 hot path 中调用未内联的小辅助函数——即使加了 [[likely]],跳转开销仍存在;不如把逻辑展开或用 constexpr 判断提前折叠。
  • 在性能关键循环中,优先用 [[likely]] 标注主循环体,[[unlikely]] 标注 break/continue 条件或异常处理(如边界检查失败)。

实际效果与验证建议

效果取决于编译器(GCC 12+/Clang 14+ 支持较完善)、目标架构(x86/arm64 效果明显,RISC-V 部分后端尚未完全支持)和运行时分支行为是否真符合标注。

  • -O2 -march=native 编译,开启 -fprofile-generate + 运行 + -fprofile-use 可获得更优的自动分支优化;[[likely]] 是对 profile-guided optimization(PGO)的补充,不是替代。
  • 通过 objdump -d 查看汇编,确认热路径是否被前置、跳转指令是否带 hint(如 x86 的 jne .Lhot 而非跳向远处的 .Lcold)。
  • 微基准测试(如 google/benchmark)对比加/不加属性的 CPI、分支误预测率(perf stat -e branches,branch-misses)可量化收益——通常在 1%~5% 吞吐提升,极端热点分支可达 10%+。

基本上就这些。属性只是提示,不是魔法;真正有效的分支优化,永远建立在理解数据分布、测量瓶颈、结合 PGO 和合理算法设计的基础上。

相关文章

数码产品性能查询
数码产品性能查询

该软件包括了市面上所有手机CPU,手机跑分情况,电脑CPU,电脑产品信息等等,方便需要大家查阅数码产品最新情况,了解产品特性,能够进行对比选择最具性价比的商品。

下载

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
if什么意思
if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词,用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章,供大家免费阅读。

847

2023.08.22

java中break的作用
java中break的作用

本专题整合了java中break的用法教程,阅读专题下面的文章了解更多详细内容。

120

2025.10.15

java break和continue
java break和continue

本专题整合了java break和continue的区别相关内容,阅读专题下面的文章了解更多详细内容。

261

2025.10.24

java break和continue
java break和continue

本专题整合了java break和continue的区别相关内容,阅读专题下面的文章了解更多详细内容。

261

2025.10.24

go语言goto的用法
go语言goto的用法

本专题整合了go语言goto的用法,阅读专题下面的文章了解更多详细内容。

138

2025.09.05

页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

497

2023.08.14

Python异步编程与Asyncio高并发应用实践
Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开,深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例,帮助开发者掌握 Python 在高并发场景中的高效开发方法,并提升系统资源利用率与整体运行性能。

37

2026.03.12

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

136

2026.03.11

Go高并发任务调度与Goroutine池化实践
Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开,系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示,帮助开发者构建稳定高效的 Go 并发任务处理系统,提高系统在高负载环境下的处理能力与稳定性。

47

2026.03.10

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Go 教程
Go 教程

共32课时 | 6.2万人学习

Go语言实战之 GraphQL
Go语言实战之 GraphQL

共10课时 | 0.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号