array_merge丢数据是因为它只合并一级键、不递归展开子数组,尤其混用数字键和字符串键时会将整个子数组作为值塞入结果。

为什么 array_merge 在多维转一维时会丢数据?
因为 array_merge 只合并一级键,遇到子数组直接覆盖或追加(取决于键类型),根本不会递归展开。尤其当二维数组里混用数字键和字符串键时,array_merge 会把整个子数组当做一个值塞进结果,看起来像“丢了”,其实是没处理。
实操建议:
立即学习“PHP免费学习笔记(深入)”;
- 别用
array_merge(...$arr)直接解包多维数组——它只对「一维数组组成的数组」有效 - 数字索引的二维数组(如
[[1,2], [3,4]])可用array_merge(...$arr),但一旦含关联子数组(如[['a'=>1], ['b'=>2]]),结果就是[0=>['a'=>1], 1=>['b'=>2]],没变平 - 真正要递归摊平,必须自己写或用
iterator_to_array+RecursiveIteratorIterator
用 RecursiveIteratorIterator 跨编码安全摊平数组
PHP 原生迭代器天然支持 UTF-8、GBK、ISO-8859-1 等编码下的字符串值,只要数组本身是合法 PHP 字符串(即没被 mb_convert_encoding 错误截断),摊平过程不碰编码,不会引入乱码。
实操建议:
立即学习“PHP免费学习笔记(深入)”;
- 确保原始数组已用
mb_internal_encoding('UTF-8')统一内部编码,避免RecursiveArrayIterator在某些 PHP 版本下对非 UTF-8 字符串长度判断出错 - 用
RecursiveIteratorIterator::LEAVES_ONLY模式,跳过中间层级,只取叶子节点值 - 示例代码片段:
$it = new RecursiveIteratorIterator(
new RecursiveArrayIterator($arr),
RecursiveIteratorIterator::LEAVES_ONLY
);
$result = [];
foreach ($it as $v) {
$result[] = $v;
}
手动递归函数如何避免中文键名塌缩?
如果用 foreach + 递归函数摊平,常见错误是直接 $flat[] = $value,导致中文键名(如 ['姓名'=>'张三'])的键被丢弃,只剩值。更糟的是,若子数组键为中文且含特殊符号(如空格、破折号),部分旧版 PHP 的 is_array() 判断可能不稳定。
实操建议:
立即学习“PHP免费学习笔记(深入)”;
- 递归函数中区分
is_array($item)和!is_array($item),前者继续递归,后者才推入结果 - 不要依赖键名做逻辑分支,中文键不影响摊平逻辑,但若需保留原始键路径,得额外维护一个
$path参数 - 避免在递归中用
array_values()强制重排,它会把关联键全清掉,且对含中文键的数组无额外风险,但纯属多余操作
GBK 编码数组传给 json_encode 前必须先转 UTF-8
摊平只是第一步;如果最终要 json_encode 输出,而原始数组含 GBK 字符串,json_encode 会直接返回 false 或空字符串——它只认 UTF-8。
实操建议:
立即学习“PHP免费学习笔记(深入)”;
- 摊平后统一转码:用
mb_convert_encoding($flat, 'UTF-8', 'GBK'),注意第三个参数必须准确,不能填auto(可能误判) - 检查是否真有 GBK 内容:用
mb_detect_encoding($str, ['GBK', 'UTF-8'], true),但仅作调试,生产环境应明确源头编码 - 如果摊平后数组元素含混合编码(比如部分 UTF-8、部分 GBK),
mb_convert_encoding会把非目标编码字节当作无效字符替换为?,务必提前清洗
跨编码摊平真正的难点不在“怎么扁”,而在“扁完怎么不出乱码”——摊平动作本身不改编码,但后续序列化、输出、入库环节极易踩坑。










