0

0

C++如何实现毫秒精度的跨平台计时器?(性能基准测试)

裘德小鎮的故事

裘德小鎮的故事

发布时间:2026-03-07 15:08:04

|

267人浏览过

|

来源于php中文网

原创

std::chrono::high_resolution_clock是最稳妥的选择,它在主流平台映射到系统最高精度时钟源,g++/clang/msvc均支持且不依赖第三方库;但需注意windows旧版可能退化为毫秒级,应运行时检查period确认精度。

c++如何实现毫秒精度的跨平台计时器?(性能基准测试)

std::chrono::high_resolution_clock 是最稳妥的选择

它在主流平台(Linux/macOS/Windows)上基本都映射到系统最高精度时钟源,g++/clang/MSVC 都支持,且不依赖第三方库。别去手动调 clock_gettime(CLOCK_MONOTONIC, ...)QueryPerformanceCounter——跨平台封装成本高,还容易漏掉初始化失败分支。

常见错误是误以为 std::chrono::steady_clock 一定比 high_resolution_clock 更“稳”:其实两者在大多数实现中底层相同,但 steady_clock 保证单调性,high_resolution_clock 保证精度;性能测试需要的是后者返回的 tick 周期更小,实测通常为 1ns 级(Linux x86_64 下常为 1ns,Windows 上取决于硬件,但一般 ≤15.6ns)。

  • 直接用 time_point 相减即可得 duration,无需手动除法或换算
  • 避免用 system_clock:它可能受 NTP 调整影响,基准测试中会导致时间倒流或跳变
  • 构造 time_point 时不要用默认构造(如 auto t = high_resolution_clock::time_point{}),应调用 now()

测量单次函数耗时必须规避编译器优化和缓存干扰

只跑一次 high_resolution_clock::now() 前后取差,结果不可信——函数可能被内联、指令重排,或 CPU 还没真正执行完就返回了。尤其对微秒级以下操作,误差常达几十纳秒。

典型错误现象:duration_cast<nanoseconds>(end - start).count()</nanoseconds> 返回 0,不是因为快,而是因为没真正执行,或者被优化掉了。

立即学习C++免费学习笔记(深入)”;

Reecho睿声
Reecho睿声

Reecho AI:超拟真语音合成与瞬时语音克隆平台

下载
  • 把待测函数体用 volatile 变量或 asm volatile("" ::: "memory") 强制防止优化(GCC/Clang)
  • Windows MSVC 用 _ReadWriteBarrier()__builtin_trap() 类似效果
  • 至少重复运行数百次取最小值(而非平均值),排除调度抖动和 TLB miss 干扰
  • std::atomic_thread_fence(std::memory_order_seq_cst) 防止指令乱序影响起点/终点捕获

duration_cast 的截断行为容易导致精度丢失

毫秒级显示不等于毫秒级精度。比如你用 duration_cast<milliseconds></milliseconds> 把一个 999ns 的 duration 转成 milliseconds,结果是 0——这不是计时不准,是显式向下截断。

性能基准中若只看毫秒值,可能把 0.9ms 和 0.1ms 都显示为 0ms,完全掩盖差异。

  • 真要毫秒精度显示,先转成 nanoseconds,再除以 1'000'000.0 得 double 毫秒值
  • 或用 duration_cast<microseconds></microseconds> + 小数点后一位,兼顾可读与分辨率
  • 注意 auto d = end - start; 后,d.count() 返回的是底层 tick 数,类型取决于时钟实现,别假设一定是 nanoseconds

Windows 上 high_resolution_clock 可能退化为毫秒级

旧版 MSVC(如 VS2015)或某些 Windows 版本下,high_resolution_clock::period::den 可能是 1000,即最低分辨率为 1ms。这不是 bug,是 Windows API 层限制(如 GetTickCount64 回退路径)。

运行时可通过检查 high_resolution_clock::period::num / high_resolution_clock::period::den 判断实际精度:若大于 1μs,就得警惕。

  • 编译时加 /D _HAS_AUTO_PTR_ETC=1(新标准库)有助于启用 QueryPerformanceCounter
  • 实测建议在目标机器上打印 decltype(high_resolution_clock::now())::period::den 确认
  • 若发现精度不足,可 fallback 到 std::chrono::steady_clock(它在 Win10+ 通常也是 QPC-backed)

精度不等于稳定性,高分辨率时钟本身也可能有微秒级抖动;真正影响基准结果的,往往是内存访问模式、CPU 频率缩放、以及是否绑核——这些比选哪个 clock 更关键。

相关文章

数码产品性能查询
数码产品性能查询

该软件包括了市面上所有手机CPU,手机跑分情况,电脑CPU,电脑产品信息等等,方便需要大家查阅数码产品最新情况,了解产品特性,能够进行对比选择最具性价比的商品。

下载

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
counta和count的区别
counta和count的区别

Count函数用于计算指定范围内数字的个数,而CountA函数用于计算指定范围内非空单元格的个数。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

203

2023.11.20

c++怎么把double转成int
c++怎么把double转成int

本专题整合了 c++ double相关教程,阅读专题下面的文章了解更多详细内容。

294

2025.08.29

C++中int、float和double的区别
C++中int、float和double的区别

本专题整合了c++中int和double的区别,阅读专题下面的文章了解更多详细内容。

105

2025.10.23

c++中volatile关键字的作用
c++中volatile关键字的作用

本专题整合了c++中volatile关键字的相关内容,阅读专题下面的文章了解更多详细内容。

75

2025.10.23

windows查看端口占用情况
windows查看端口占用情况

Windows端口可以认为是计算机与外界通讯交流的出入口。逻辑意义上的端口一般是指TCP/IP协议中的端口,端口号的范围从0到65535,比如用于浏览网页服务的80端口,用于FTP服务的21端口等等。怎么查看windows端口占用情况呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

1431

2023.07.26

查看端口占用情况windows
查看端口占用情况windows

端口占用是指与端口关联的软件占用端口而使得其他应用程序无法使用这些端口,端口占用问题是计算机系统编程领域的一个常见问题,端口占用的根本原因可能是操作系统的一些错误,服务器也可能会出现端口占用问题。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

1163

2023.07.27

windows照片无法显示
windows照片无法显示

当我们尝试打开一张图片时,可能会出现一个错误提示,提示说"Windows照片查看器无法显示此图片,因为计算机上的可用内存不足",本专题为大家提供windows照片无法显示相关的文章,帮助大家解决该问题。

833

2023.08.01

windows查看端口被占用的情况
windows查看端口被占用的情况

windows查看端口被占用的情况的方法:1、使用Windows自带的资源监视器;2、使用命令提示符查看端口信息;3、使用任务管理器查看占用端口的进程。本专题为大家提供windows查看端口被占用的情况的相关的文章、下载、课程内容,供大家免费下载体验。

461

2023.08.02

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

23

2026.03.06

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
C# 教程
C# 教程

共94课时 | 10.8万人学习

C 教程
C 教程

共75课时 | 5.2万人学习

C++教程
C++教程

共115课时 | 20.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号