array_walk_recursive仅遍历嵌套数组的标量叶子节点,跳过数组、对象、null等非标量值,不保留键名和层级信息,适用于纯标量值的规整多维数组。

用 array_walk_recursive 处理标准嵌套数组
这个函数只遍历「叶子节点」,跳过所有非标量值(比如数组本身、对象、资源),适合结构相对规整的多维数组。它不保留键名,只收集值,所以如果你需要原始键路径或想区分空数组/空字符串,它就无能为力。
常见错误是误以为它能处理 null、false 或对象属性——其实它会直接跳过对象,遇到 null 也会忽略(除非你手动补一层判断)。
- 仅适用于纯数组 + 标量值组合,不含对象、资源、闭包
- 无法获取原键名或嵌套层级信息
- 若数组中混有
array()和null,两者都会被跳过,但语义完全不同
示例:
$arr = ['a' => 1, 'b' => [2, 'c' => [3]]];
$flat = [];
array_walk_recursive($arr, function($v) use (&$flat) { $flat[] = $v; });
// 结果:[1, 2, 3]
手写递归函数时必须处理的三个边界
通用降维不能只靠 foreach 套 foreach,真实业务里常遇到空数组、数字键与字符串键混用、深层嵌套含 0 或 false 值等情况。这时候必须显式判断类型和存在性。
立即学习“PHP免费学习笔记(深入)”;
- 用
is_array($item)而不是!is_scalar($item)—— 因为NULL、FALSE、0都是标量,但你通常不想丢掉它们 - 对空数组
[]要决定策略:当值保留(如'')、跳过、还是标记为null?不同业务需求不同 - 避免无限递归:检查是否已进入过当前引用(尤其在 PHP 7.4+ 引用赋值后易出现)
示例关键判断:
if (is_array($item) && !empty($item)) {
// 继续递归
} elseif ($item === null || $item === false || $item === 0 || $item === '') {
// 显式推入,不跳过
$result[] = $item;
}
面对异构结构(对象/JSON/混合键)先做预标准化
PHP 里所谓“异构”,往往指数组里夹着 stdClass 对象、JsonSerializable 实现类,或从 JSON 解析来的带数字键的混合体。直接递归会崩——对象不会被 foreach 遍历出属性,除非你调用 (array) 强转或反射。
- 对对象统一用
(array)$obj转换,但注意:私有/受保护属性会带前缀(如"\0*\0prop"),需用get_object_vars()更安全 - JSON 字符串要先
json_decode($str, true),否则留着字符串只会被当普通值塞进结果 - 数字键和字符串键混用时,
array_merge会重排索引,改用$result = [...$result, ...$sub](PHP 7.4+)可保持顺序
典型踩坑:json_decode('{"0":"a","1":"b"}', true) 返回的是关联数组,不是索引数组,array_values() 才能还原顺序。
性能敏感场景下避免全量拷贝和重复序列化
如果数组超大(比如 >50k 元素)或嵌套极深(>20 层),每次递归都新建数组或反复调用 json_encode/json_decode 会明显拖慢。这时应优先用引用传递 + 迭代栈模拟递归,而非函数调用栈。
- 用
array_key_exists()替代isset()判断键是否存在——后者对null值返回 false,容易漏数据 - 避免在循环内调用
count(),提前存变量;更推荐用empty()判断是否可遍历 - 不要为了“通用”而把所有东西都转成 JSON 再解析一遍——那只是把问题外包给 C 层,没解决根本逻辑
真正难的从来不是“怎么扁平化”,而是“哪些值该保留原语义、哪些该降级、哪些该丢弃”。比如 0 是有效计数还是空占位?[] 表示缺失还是明确的空集合?这些必须由业务定,代码只是执行者。











