首页 > 后端开发 > C++ > 正文

c++中的写时复制(Copy-on-Write)技术_c++ COW字符串与智能指针实现【性能优化】

穿越時空
发布: 2025-12-14 21:34:03
原创
506人浏览过
COW是一种延迟复制策略,多个对象共享数据直至写操作时才复制;C++11禁用std::string的COW因线程安全与标准冲突,现代改用SSO+深拷贝;shared_ptr体现指针级COW,对象级需cow_ptr封装;手写COW字符串因线程不友好、标准不符、调试困难等不再推荐。

c++中的写时复制(copy-on-write)技术_c++ cow字符串与智能指针实现【性能优化】

写时复制(Copy-on-Write,简称 COW)是一种经典的延迟复制优化策略:多个对象共享同一份底层数据,直到其中某个对象尝试修改时,才真正复制一份独立副本。它在 C++ 中曾广泛用于 std::string(C++98/03 时期)和自定义容器,以减少不必要的内存分配与拷贝开销。但需注意——C++11 标准明确禁止了 std::string 的 COW 实现,因其与多线程安全、迭代器失效、引用透明性等产生严重冲突;现代标准库普遍采用短字符串优化(SSO)+ 深拷贝策略。

COW 字符串的典型实现逻辑

一个手动实现的 COW string 需管理“引用计数 + 共享缓冲区”,核心在于:构造、拷贝不复制数据,赋值/修改前检查引用计数并按需分离。

  • 共享结构体:通常封装为带引用计数(atomic 或非 atomic,取决于线程模型)和字符数组的结构,如 struct string_data { size_t ref_count; char data[]; };
  • 拷贝构造/赋值:仅递增引用计数,指针指向同一块内存;不触发 new/memcpy
  • 写操作拦截:如 operator[] 非 const 版本、append()replace() 等,先调用 unshare() —— 若 ref_count > 1,则 new 新缓冲区、memcpy 原内容、递减旧计数、切换指针
  • 析构与释放:ref_count 减至 0 时 delete[] 缓冲区

COW 在智能指针中的自然体现

事实上,std::shared_ptr 就是 COW 思想的标准化、线程安全实现——但它复制的是“指针控制块”(含引用计数),而非所指对象本身。对象本身仍被共享,修改仍影响所有持有者。

  • 若你希望“对象级 COW”,即多个 shared_ptr<t></t> 共享一份 T,但某次修改时自动克隆 T 的副本,需额外封装:例如定义 cow_ptr<t></t>,内部持有一个 shared_ptr<t></t>,并在写访问前调用 make_unique<t>(*ptr)</t> 复制对象
  • 常见模式:T& cow_ptr::operator*() { if (ptr.use_count() > 1) ptr = std::make_shared<t>(*ptr); return *ptr; }</t>
  • 注意:该方案适用于读多写少、T 可拷贝且拷贝成本可控的场景;频繁写入会抵消 COW 收益

为什么现代 C++ 不再推荐手写 COW 字符串?

不是技术不可行,而是代价常被低估:

Pinokio
Pinokio

Pinokio是一款开源的AI浏览器,可以安装运行各种AI模型和应用

Pinokio 232
查看详情 Pinokio

立即学习C++免费学习笔记(深入)”;

  • 线程不友好:引用计数需原子操作(影响性能),且即使计数安全,data 内容读写仍需额外同步——否则出现 A 读、B 写、COW 分离中段,导致未定义行为
  • 不符合标准要求:C++11 要求 std::string::data() 返回可写指针,且允许通过 &s[0] 获取连续内存地址;COW 实现中,若未 unshare 就返回 data 指针,外部直接写入将破坏其他副本
  • 调试与可预测性差:复制开销从“恒定时间”变为“均摊但不可预测”,尤其在容器 resize、函数传参等隐式拷贝场景下,性能毛刺明显
  • SSO 更高效:多数短字符串(如标识符、错误码)根本无需堆分配;小对象拷贝比原子计数+条件分支更快

替代建议:轻量、安全、现代

真有共享只读+按需独占需求,优先考虑组合现有工具

  • 读多写少 → 用 std::shared_ptr<const std::string></const> 共享只读视图;写时构造新 string 并替换 shared_ptr
  • 需要原地修改隔离 → 用 std::optional<:string></:string> 或自定义 handle 类,显式调用 clone_if_shared()
  • 高性能文本处理 → 考虑 absl::string_view + 显式 owned storage,或成熟库如 folly::fbstring(已弃用 COW,专注 SSO 和大字符串优化)
  • 自定义 COW 容器仅限封闭场景(如单线程配置缓存),务必用 std::atomic_size_t 管理计数,并禁用 data() 直接写入接口

基本上就这些。COW 是理解资源管理演进的好切口,但落地时要尊重标准约束与真实负载特征——省一次拷贝,不该以牺牲正确性与可维护性为代价。

以上就是c++++中的写时复制(Copy-on-Write)技术_c++ COW字符串与智能指针实现【性能优化】的详细内容,更多请关注php中文网其它相关文章!

数码产品性能查询
数码产品性能查询

该软件包括了市面上所有手机CPU,手机跑分情况,电脑CPU,电脑产品信息等等,方便需要大家查阅数码产品最新情况,了解产品特性,能够进行对比选择最具性价比的商品。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号