array_unique()去重最直接但需注意键名不重排、默认松散比较、不支持二维数组、需手动重置索引及大数组性能差等问题。

用 array_unique() 去重最直接,但要注意键名和类型
array_unique() 是 PHP 内置函数,专为去重设计。它会保留第一个出现的值,删除后续重复项,但**不重排键名**——数字键保持原样,字符串键也不变。
常见误区是以为返回数组键从 0 开始连续,实际不是:
$arr = [1, 2, 2, 3, '2'];
var_dump(array_unique($arr));
// 输出:
// array(4) {
// [0]=> int(1)
// [1]=> int(2)
// [3]=> int(3)
// [4]=> string(1) "2"
// }
注意:'2' 和 2 在默认模式下被视为不同(松散比较),所以都保留。若需严格区分类型,得加参数。
- 默认行为按「松散比较」:
0 == '0'、1 == true都成立 - 传入
SORT_REGULAR仍为松散;想严格比类型,必须用SORT_STRING或SORT_NUMERIC,但它们只影响排序逻辑,不改变比较方式 - 真正控制比较逻辑的是第三个参数(PHP 7.2+):
array_unique($arr, SORT_FLAG_CASE | SORT_STRING)仅对字符串有效;类型敏感去重仍需手动处理
二维数组不能直接用 array_unique()
该函数只识别「值是否完全相同」,而数组(尤其是多维)无法被直接哈希,所以对二维数组会报 Notice: Array to string conversion,且所有子数组被转成字符串 "Array",结果只剩一个元素。
立即学习“PHP免费学习笔记(深入)”;
正确做法是序列化后去重,再反序列化:
$arr = [
['id' => 1, 'name' => 'a'],
['id' => 2, 'name' => 'b'],
['id' => 1, 'name' => 'a']
];
$serialized = array_map('serialize', $arr);
$unique_serialized = array_unique($serialized);
$result = array_map('unserialize', $unique_serialized);
注意:unserialize() 有安全风险,仅限可信数据;若含对象或资源,会失败。更稳妥的方式是用 json_encode() 替代(要求数据可 JSON 化)。
去重后想重置数字键,得手动 array_values()
很多场景(比如遍历、JSON 输出、前端渲染)需要连续数字索引。但 array_unique() 不提供此功能,必须额外调用:
$arr = [5, 1, 1, 3]; $unique = array_unique($arr); $reindexed = array_values($unique); // [5, 1, 3]
漏掉这步是高频疏忽,尤其在配合 foreach 或 for ($i=0; $i
-
array_values()只影响数字键,不影响关联键 - 如果原数组混用数字键和字符串键,
array_values()会丢弃所有字符串键,只保留值并重编号
性能敏感场景慎用 array_unique() 处理大数组
该函数时间复杂度接近 O(n²),内部用类似嵌套循环的方式比对(尤其 PHP 7.4 之前)。对 10 万以上元素的数组,可能明显卡顿。
替代方案是用 array_flip() + array_flip() 组合(仅适用于「值可作为键」的场景,即值必须是字符串或整数,且不为 null / 数组 / 对象):
$arr = [1, 2, 2, 3]; $flipped = array_flip($arr); // [1=>0, 2=>1, 3=>3] $result = array_flip($flipped); // [0=>1, 1=>2, 3=>3] → 键乱序,但值唯一
这个组合更快(O(n)),但丢失原始顺序,且无法处理非标量值。真要保序又快,得自己用 foreach + isset() 缓存判断。
类型混合、结构复杂、数量巨大——这三个条件只要占一个,就别无脑依赖 array_unique()。











