php数组基于hashtable实现,内存由refcount与cow管理;hashtable存zval指针,键经哈希映射,内存离散;扩容翻倍但不自动缩容;cow实现写时复制;循环引用依赖gc回收。

PHP 数组不是传统意义上的连续内存块,而是一个基于哈希表(HashTable)实现的复合数据结构,其内存占用和生命周期由 Zend 引擎的引用计数(refcount)与写时复制(Copy-on-Write, COW)机制共同管理。
数组底层:HashTable 与 zval 的协作
每个 PHP 数组在内核中对应一个 HashTable 结构,它不直接存储值,而是保存一组 zval 指针。zval 是 PHP 变量的统一容器,包含类型、值、refcount 和 is_ref 标志。数组键(无论整型或字符串)经哈希计算后映射到 HashTable 的 bucket 数组索引位置,支持 O(1) 平均查找效率,但实际内存布局是离散的——键值对分散在堆上,而非连续分配。
例如:`$arr = [0 => 'a', 'name' => 'Tom'];` 会创建一个 HashTable,其中两个 bucket 分别指向两个独立分配的 zval;字符串值 `'a'` 和 `'Tom'` 还各自持有自己的内存块(含长度和引用计数)。
内存分配:按需扩容与碎片化特点
HashTable 初始化时默认容量为 8 个 bucket,当元素数量超过当前容量时触发扩容(通常是翻倍),旧 bucket 数组被释放,新数组重新哈希填充。这种策略减少频繁重哈希开销,但也带来两点影响:
立即学习“PHP免费学习笔记(深入)”;
Difeye是一款超轻量级PHP框架,主要特点有: Difeye是一款超轻量级PHP框架,主要特点有: ◆数据库连接做自动主从读写分离配置,适合单机和分布式站点部署; ◆支持Smarty模板机制,可灵活配置第三方缓存组件; ◆完全分离页面和动作,仿C#页面加载自动执行Page_Load入口函数; ◆支持mysql,mongodb等第三方数据库模块,支持读写分离,分布式部署; ◆增加后台管理开发示例
- 空数组仍占用约 144 字节(64 位系统,含 HashTable 头部 + 初始 bucket 数组)
- 删除大量元素后容量不会自动收缩,可能长期持有未使用的内存空间
- 大量小数组(如循环中新建)易导致堆内存碎片,尤其在长时间运行的 CLI 或 FPM 场景中
引用计数与写时复制(COW)如何节省内存
当执行 `$b = $a;`(其中 $a 是数组),PHP 不立即复制整个 HashTable 和所有 zval,而是将 $a 和 $b 的 zval.refcount 加 1,并共享同一份底层结构。只有在某一方尝试修改(如 `$b[] = 'new';` 或 `$b['key'] = 'val';`)时,Zend 引擎才触发 COW:为被修改变量分配新的 HashTable 和受影响的 zval 副本,其余未变部分继续共享。
这意味着:
- 只读遍历多个变量指向同一数组不会增加内存消耗
- 函数传参(默认值传递)也走 COW,避免无谓拷贝
- 显式克隆(`$c = clone $a;`)或强制分离(`$a = $a;`)会提前触发复制
释放时机:循环引用与 GC 的作用边界
普通数组变量在超出作用域或被 unset 后,其 zval.refcount 减 1;当 refcount 降为 0,zval 和关联的 HashTable 被立即释放。但若存在循环引用(如数组中包含自身引用:`$arr[0] = &$arr;`),refcount 始终 ≥1,无法自动回收。
此时依赖 PHP 的周期性垃圾回收器(GC),它通过根缓冲区(root buffer)标记潜在循环结构,并用深度优先遍历检测不可达 zval。注意:
- GC 默认开启,但仅在根缓冲区满(默认 10000 个节点)或显式调用 `gc_collect_cycles()` 时触发
- GC 本身有性能开销,频繁小循环引用建议手动 break 引用(如 `unset($arr[0]);`)
- 对象属性中的数组循环引用同样适用该机制










