array_unique()最快去重但丢失键名,需用SORT_REGULAR保持类型安全;保留键名须手动遍历+isset();多维数组需序列化或按字段去重;排序前须先重索引或用uasort。

用 array_unique() 最快去重,但要注意键名丢失
array_unique() 是 PHP 原生最直接的去重函数,它会保留第一个出现的值,后续重复项被剔除。但它默认按字符串比较(即会强制类型转换),且**不保留原始键名**——重复值被删后,数组会自动重索引为数字键(除非你传入 SORT_REGULAR 并配合 array_values() 显式重排)。
常见误用:
- 直接对关联数组调用后还指望用原 'name'、'id' 键访问 → 实际只剩数字键
- 处理含 0、false、'' 的混合类型数组时,因默认字符串比较导致 0 == '' 被判重复
正确做法示例:
$arr = ['a' => 1, 'b' => '1', 'c' => 0, 'd' => '']; var_dump(array_unique($arr, SORT_REGULAR)); // 严格类型比较,保留键名 // 输出:['a'=>1, 'c'=>0, 'd'=>'']
需要保留原始键名?手动遍历 + in_array() 或 isset() 判断
当必须维持键名结构(比如配置项、表单字段映射),又不能接受 array_unique() 的键重排行为时,就得自己控制逻辑。此时优先用 isset() 配合临时标记数组,比 in_array() 性能高得多(尤其大数据量)。
- 用
$seen = []记录已出现的值,每次检查!isset($seen[$value]) - 若值可能为非标量(如数组、对象),需改用
serialize($value)作键,但注意性能损耗 - 若原数组键是字符串且需保留,直接赋值
$result[$key] = $value即可
示例(保留键名的整数去重):
立即学习“PHP免费学习笔记(深入)”;
$arr = ['x' => 5, 'y' => 3, 'z' => 5, 'w' => 3];
$result = [];
$seen = [];
foreach ($arr as $k => $v) {
if (!isset($seen[$v])) {
$seen[$v] = true;
$result[$k] = $v;
}
}多维数组去重不能直接用 array_unique(),得先序列化或自定义比较
array_unique() 对多维数组无效,它只比较一维元素(即子数组本身),而子数组在比较时会被转成字符串 "Array",结果所有子数组都“相同”,只剩第一个。
两种可靠解法:
- 用
array_map('serialize', $arr)转成字符串数组,再array_unique(),最后array_map('unserialize', ...)—— 简单但有安全风险(反序列化不可信数据) - 手写循环 +
array_diff_assoc()或逐字段比较(推荐用于结构明确的二维数组,如数据库记录)
轻量安全示例(按指定字段去重,如 id):
$arr = [['id'=>1,'name'=>'A'], ['id'=>2,'name'=>'B'], ['id'=>1,'name'=>'C']];
$ids = [];
$result = [];
foreach ($arr as $item) {
if (!in_array($item['id'], $ids)) {
$ids[] = $item['id'];
$result[] = $item;
}
}去重后还要排序?别链式调用 array_unique() + sort(),小心键名错乱
如果去重后还需升序/降序,很多人写成 sort(array_unique($arr)),这会导致两个问题:一是 sort() 返回布尔值而非数组;二是即使修正为 $uniq = array_unique($arr); sort($uniq),也会把关联键全转成数字键,且顺序打乱。
正确组合方式取决于需求:
- 只要值有序、不care键名:先
array_values(array_unique($arr)),再sort()或rsort() - 要保持键名+按值排序:用
uasort($arr, function($a,$b){ return $a $b; }),但得先去重(否则重复项还在) - 数值数组且要自然排序:直接
array_unique($arr)后用natcasesort()
关键点:PHP 数组函数链式调用极易隐性丢失键名,每一步都要确认返回值结构是否符合预期。











