
COW(Copy-on-Write,写时复制) 是一种优化内存使用和提升性能的延迟复制策略,在 C++ 标准库(尤其是早期 std::string 和某些容器实现)中曾被广泛采用。它的核心思想是:多个对象可以共享同一块底层数据,直到其中某个对象尝试修改数据时,才真正复制一份独立副本——“只在真正需要写的时候才复制”。
为什么需要 COW?
频繁拷贝大块数据(比如长字符串、大 vector)会带来明显开销:分配内存、逐字节复制、释放旧内存。COW 通过推迟甚至避免复制,显著降低构造、赋值、传参等操作的平均成本,尤其适合读多写少的场景(如配置解析、日志拼接、函数间只读传递)。
COW 在 C++ 中的实际表现
注意:COW 不是 C++ 标准强制要求的机制,而是特定实现(如 GCC 4.x 的 libstdc++)的历史优化手段。自 C++11 起,标准明确禁止了 std::string 的 COW 实现,主要原因包括:
- 多线程不安全:共享数据 + 写前检测 + 复制,需加锁,反而拖慢常见单线程路径;
- 迭代器/指针失效难保证:data() 返回的指针可能因另一处写操作而突然失效;
- 不符合 C++11 对 string 弱异常安全与复杂度保证的要求(如 data() 必须稳定,size() O(1));
- 实际性能收益有限:现代小字符串优化(SSO)已能覆盖多数短字符串场景,且 memcpy 很快,而 COW 的分支判断、原子计数、锁开销反而成为瓶颈。
如何手动实现一个简易 COW string?
理解原理可帮助你设计自有容器或调试遗留代码。关键组件包括:
立即学习“C++免费学习笔记(深入)”;
-
引用计数器:通常用 atomic
存于堆内存头部,确保多线程下增减安全; - 共享数据块:char* 指向实际字符数组,构造/拷贝时不复制,仅递增计数;
- 写操作检查:assign、operator[]、append 等修改接口先判断 ref_count > 1,若是,则 new 内存、memcpy、再递减原计数;
- 析构安全:ref_count 减为 0 时才 delete 底层内存。
示例片段(简化):
class cow_string {
struct rep {
atomic_uint count;
size_t size;
char data[];
};
rep* ptr_;
void copy_on_write() {
if (ptr_->count.load(memory_order_acquire) > 1) {
rep* new_ptr = new rep{1, ptr_->size};
memcpy(new_ptr->data, ptr_->data, ptr_->size);
ptr_->count.fetch_sub(1, memory_order_acq_rel);
ptr_ = new_ptr;
}
}
};
COW 的性能真相:别盲目迷信
在现代 C++(C++11 及以后)中,COW 已基本退出主流标准库实现。实测表明:
- 单线程下,SSO(如 15 字符内直接存栈)比 COW 更快——无堆分配、无原子操作、无分支预测失败;
- 多线程下,COW 的原子计数+锁(若加锁)或 ABA 问题(若无锁)反而导致严重争用;
- 真实业务中,“多次读 + 一次写”的模式不如想象中普遍;更常见的是短生命周期字符串或一写多读但不共享底层缓冲;
- 编译器和硬件对 memcpy 优化极好,而 COW 增加的间接访问(多一层指针、计数器跳转)常抵消复制节省。
如果你真有高性能共享只读数据需求,更推荐显式使用 std::shared_ptr<:vector>> 或 std::string_view(C++17),它们语义清晰、线程安全、零成本抽象。











