array_unique()仅适用于一维数值/字符串数组,默认SORT_STRING可能导致类型误判,应加SORT_REGULAR;二维数组、多字段、浮点数或JSON数据需手动标准化后按键去重。

PHP 数组去重前先确认重复类型
直接用 array_unique() 不一定得到你想要的结果——它默认只对「值」做严格比较,且会保留第一个出现的键名,但对多维数组、关联字段重复、或含浮点/字符串混排的数据完全无效。比如你从数据库查出的用户订单列表,id 相同但其他字段有微小差异(如时间戳精度不同),array_unique() 根本识别不了。
一维数值/字符串数组直接用 array_unique()
这是最安全的场景,无需额外处理:
$data = [1, 2, 2, 3, '3', 4]; $result = array_unique($data, SORT_REGULAR); // 推荐加 SORT_REGULAR 避免类型转换导致误判 // 输出:[1, 2, 3, '3', 4] —— 注意 '3' 和 3 被视为不同
-
SORT_STRING(默认)会把数字转成字符串比,可能导致0和'0'被当成重复 -
SORT_REGULAR按原类型比较,更符合直觉 - 去重后键名保留原始顺序,但不连续;如需重索引,套一层
array_values()
二维数组按指定字段去重得手写逻辑
array_unique() 对二维数组无效,必须提取关键字段做映射判断。常见于统计图表数据源中「按日期汇总」或「按用户ID去重」:
$orders = [
['user_id' => 101, 'date' => '2024-05-01', 'amount' => 99.9],
['user_id' => 102, 'date' => '2024-05-01', 'amount' => 120.0],
['user_id' => 101, 'date' => '2024-05-02', 'amount' => 88.5],
];
$seen = [];
$unique = [];
foreach ($orders as $item) {
$key = $item['user_id']; // 按 user_id 去重
if (!isset($seen[$key])) {
$seen[$key] = true;
$unique[] = $item;
}
}
- 不要用
serialize($item)当键——性能差,且浮点数精度可能引发哈希不一致 - 若需按多个字段组合去重(如
user_id + date),用$key = $item['user_id'] . '|' . $item['date'] - 数据库层能去重就别在 PHP 做,加
GROUP BY或DISTINCT更可靠
JSON 数据或 API 返回值重复常因嵌套结构漏判
前端传来的图表数据可能是 JSON 字符串,json_decode() 后变成数组,但字段名大小写不一致(如 userId vs user_id)、空格、或多余引号都会让去重失效:
立即学习“PHP免费学习笔记(深入)”;
- 先统一字段命名:
array_map()+str_replace()或用array_change_key_case() - 清理空白:
trim()所有字符串值,尤其来自表单提交的标签类字段 - 检查浮点数:用
round($val, 2)统一小数位再比较,避免0.1 + 0.2 !== 0.3导致误判 - 别忽略
null和空字符串,它们在==下相等,但在===下不等——去重逻辑里要明确是否视为空重复
array_unique(),不如先盯住数据进来那一刻:解码后立刻做字段校验和标准化。











