COW是一种延迟复制策略,多个对象共享数据直至写操作时才复制;C++11禁用std::string的COW因线程安全与标准冲突,现代改用SSO+深拷贝;shared_ptr体现指针级COW,对象级需cow_ptr封装;手写COW字符串因线程不友好、标准不符、调试困难等不再推荐。

写时复制(Copy-on-Write,简称 COW)是一种经典的延迟复制优化策略:多个对象共享同一份底层数据,直到其中某个对象尝试修改时,才真正复制一份独立副本。它在 C++ 中曾广泛用于 std::string(C++98/03 时期)和自定义容器,以减少不必要的内存分配与拷贝开销。但需注意——C++11 标准明确禁止了 std::string 的 COW 实现,因其与多线程安全、迭代器失效、引用透明性等产生严重冲突;现代标准库普遍采用短字符串优化(SSO)+ 深拷贝策略。
一个手动实现的 COW string 需管理“引用计数 + 共享缓冲区”,核心在于:构造、拷贝不复制数据,赋值/修改前检查引用计数并按需分离。
struct string_data { size_t ref_count; char data[]; };
operator[] 非 const 版本、append()、replace() 等,先调用 unshare() —— 若 ref_count > 1,则 new 新缓冲区、memcpy 原内容、递减旧计数、切换指针事实上,std::shared_ptr 就是 COW 思想的标准化、线程安全实现——但它复制的是“指针控制块”(含引用计数),而非所指对象本身。对象本身仍被共享,修改仍影响所有持有者。
shared_ptr<t></t> 共享一份 T,但某次修改时自动克隆 T 的副本,需额外封装:例如定义 cow_ptr<t></t>,内部持有一个 shared_ptr<t></t>,并在写访问前调用 make_unique<t>(*ptr)</t> 复制对象T& cow_ptr::operator*() { if (ptr.use_count() > 1) ptr = std::make_shared<t>(*ptr); return *ptr; }</t>
不是技术不可行,而是代价常被低估:
立即学习“C++免费学习笔记(深入)”;
std::string::data() 返回可写指针,且允许通过 &s[0] 获取连续内存地址;COW 实现中,若未 unshare 就返回 data 指针,外部直接写入将破坏其他副本真有共享只读+按需独占需求,优先考虑组合现有工具:
std::shared_ptr<const std::string></const> 共享只读视图;写时构造新 string 并替换 shared_ptrstd::optional<:string></:string> 或自定义 handle 类,显式调用 clone_if_shared()
absl::string_view + 显式 owned storage,或成熟库如 folly::fbstring(已弃用 COW,专注 SSO 和大字符串优化)std::atomic_size_t 管理计数,并禁用 data() 直接写入接口基本上就这些。COW 是理解资源管理演进的好切口,但落地时要尊重标准约束与真实负载特征——省一次拷贝,不该以牺牲正确性与可维护性为代价。
以上就是c++++中的写时复制(Copy-on-Write)技术_c++ COW字符串与智能指针实现【性能优化】的详细内容,更多请关注php中文网其它相关文章!
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号