0

0

c++中的Duff's device是什么_c++循环展开优化技巧【性能】

裘德小鎮的故事

裘德小鎮的故事

发布时间:2025-12-21 11:23:34

|

965人浏览过

|

来源于php中文网

原创

Duff's device 是一种通过 switch 与 do-while 结合实现手动循环展开的 C/C++ 技巧,由 Tom Duff 于 1983 年提出,用于减少分支开销以高效复制内存;其核心是利用 case 贯穿和模运算跳转到展开体指定位置,再由 do-while 控制主循环次数,总执行次数精确为 count;虽在早期可显著提升性能,但现代编译器自动优化使其优势减弱,且降低可读性与可维护性,实际开发中更推荐使用标准库函数或依赖编译器自动展开。

c++中的duff\'s device是什么_c++循环展开优化技巧【性能】

Duff's device 是 C/C++ 中一种利用 switchdo-while 穿插跳转实现**手动循环展开(loop unrolling)** 的经典技巧,由 Tom Duff 在 1983 年提出,初衷是高效复制内存块(如向寄存器写入多个字节),在缺乏编译器自动展开支持的年代显著减少分支开销。

核心原理:用 switch 跳进 do-while 循环体

它绕过传统 for/while 的每次迭代判断,把循环次数模 N 的余数作为 switch 入口,直接跳到展开体的某个位置开始执行,再靠 do-while 自动“滚”完剩余迭代。最常见的是 8 路展开:

void duffs_device(char* to, char* from, int count) {
    int n = (count + 7) / 8;
    switch (count % 8) {
        case 0: do { *to++ = *from++;
        case 7:      *to++ = *from++;
        case 6:      *to++ = *from++;
        case 5:      *to++ = *from++;
        case 4:      *to++ = *from++;
        case 3:      *to++ = *from++;
        case 2:      *to++ = *from++;
        case 1:      *to++ = *from++;
                } while (--n > 0);
    }
}

关键点:

  • case 标签不带 break,靠“贯穿(fall-through)”自然衔接下一条赋值
  • switch 只执行一次,决定起始位置;do-while 控制主循环次数
  • 总执行次数仍精确为 count,无重复或遗漏

为什么能提升性能?

在早期 CPU 和弱优化编译器下,它减少了:

立即学习C++免费学习笔记(深入)”;

TapNow
TapNow

新一代AI视觉创作引擎

下载
  • 循环条件判断次数(从 count 次降到约 count/8 次)
  • 分支预测失败开销(连续执行无跳转的赋值序列)
  • 指令流水线停顿(更多独立指令可并行发射)

但现代 x86/x64 处理器+O2/O3 优化后,编译器通常能自动识别简单循环并做等效展开,Duff's device 的优势已大幅减弱,甚至可能因破坏控制流而干扰优化器。

实际使用要注意什么?

它不是“银弹”,需谨慎评估:

  • 仅适用于简单、固定模式的循环(如内存拷贝、清零、逐字节处理)
  • 代码可读性差,维护成本高,易出错(比如漏写 case 或错算模数)
  • 某些编译器或平台可能对跨 case 的变量作用域或优化有特殊限制
  • 若循环体含函数调用、条件分支或复杂表达式,展开反而降低效率

替代方案更推荐

今天更实用的做法是:

  • 写清晰的普通循环,信任现代编译器(GCC/Clang/MSVC 都支持 -funroll-loops 或自动启发式展开)
  • std::copymemcpy标准库函数,它们内部已针对各平台深度优化
  • 必要时用 intrinsics(如 SSE/AVX)做向量化,比手工展开收益更大
  • 性能瓶颈处先 profiling,确认循环真是热点,再针对性优化

基本上就这些 —— Duff's device 是编程史上的巧妙 hack,理解它有助于体会底层优化逻辑,但日常开发中,优先让编译器干活,比手写奇技淫巧更可靠、更可持续。

相关专题

更多
switch语句用法
switch语句用法

switch语句用法:1、Switch语句只能用于整数类型,枚举类型和String类型,不能用于浮点数类型和布尔类型;2、每个case语句后面必须跟着一个break语句,以防止执行其他case的代码块,没有break语句,将会继续执行下一个case的代码块;3、可以在一个case语句中匹配多个值,使用逗号分隔;4、Switch语句中的default代码块是可选的等等。

530

2023.09.21

Java switch的用法
Java switch的用法

Java中的switch语句用于根据不同的条件执行不同的代码块。想了解更多switch的相关内容,可以阅读本专题下面的文章。

411

2024.03.13

counta和count的区别
counta和count的区别

Count函数用于计算指定范围内数字的个数,而CountA函数用于计算指定范围内非空单元格的个数。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

197

2023.11.20

while的用法
while的用法

while的用法是“while 条件: 代码块”,条件是一个表达式,当条件为真时,执行代码块,然后再次判断条件是否为真,如果为真则继续执行代码块,直到条件为假为止。本专题为大家提供while相关的文章、下载、课程内容,供大家免费下载体验。

88

2023.09.25

java中break的作用
java中break的作用

本专题整合了java中break的用法教程,阅读专题下面的文章了解更多详细内容。

118

2025.10.15

java break和continue
java break和continue

本专题整合了java break和continue的区别相关内容,阅读专题下面的文章了解更多详细内容。

255

2025.10.24

C++ 单元测试与代码质量保障
C++ 单元测试与代码质量保障

本专题系统讲解 C++ 在单元测试与代码质量保障方面的实战方法,包括测试驱动开发理念、Google Test/Google Mock 的使用、测试用例设计、边界条件验证、持续集成中的自动化测试流程,以及常见代码质量问题的发现与修复。通过工程化示例,帮助开发者建立 可测试、可维护、高质量的 C++ 项目体系。

6

2026.01.16

java数据库连接教程大全
java数据库连接教程大全

本专题整合了java数据库连接相关教程,阅读专题下面的文章了解更多详细内容。

28

2026.01.15

Java音频处理教程汇总
Java音频处理教程汇总

本专题整合了java音频处理教程大全,阅读专题下面的文章了解更多详细内容。

12

2026.01.15

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
C# 教程
C# 教程

共94课时 | 6.8万人学习

C 教程
C 教程

共75课时 | 4万人学习

C++教程
C++教程

共115课时 | 12.4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号