distinct必须写在select后字段前,作用于整行而非单字段,不能用于where;去重需配合group by或窗口函数实现业务逻辑,无索引时性能差。

SELECT DISTINCT 要写在字段前面,不是 WHERE 后面
很多人一看到“去重”,下意识把 DISTINCT 当成过滤条件加在 WHERE 里,结果报错或无效。它其实是 SELECT 的修饰符,必须紧贴在字段列表前,且只对整行结果生效。
-
DISTINCT作用于整个SELECT返回的列组合,不是单个字段(哪怕你只写一个字段,也是按那一列的值去重整行) - 如果查
id, name, email,DISTINCT去的是这三列值完全相同的记录,不是只看name - 不能和
ORDER BY中未出现在SELECT列表里的字段混用(MySQL 5.7+ 严格模式会报错)
正确写法:
SELECT DISTINCT name FROM users;错误写法:
SELECT name FROM users WHERE DISTINCT name; —— 这语法直接不合法。
想按某字段去重但保留其他字段?DISTINCT 不够用
DISTINCT 只能返回“去重后的原始行”,没法指定“取每组中 id 最大的那条”。比如用户表有重复 email,你想留最新注册的那条,SELECT DISTINCT email, created_at 会随机挑一条,不可控。
- 常见错误:以为
DISTINCT email, MAX(id)能解决问题 —— 这会报错,因为没GROUP BY - 真实需求该用
GROUP BY email配合聚合函数,例如:SELECT email, MAX(id) AS latest_id FROM users GROUP BY email;
- 如果还要带出完整记录(比如
name、created_at),得用子查询或窗口函数(MySQL 8.0+)
PHP 中拼 SQL 时,别让变量污染 DISTINCT 逻辑
用 PHP 拼接 SQL 时,容易因变量为空或含空格,导致 DISTINCT 后面多出空格或换行,虽然 MySQL 通常容忍,但某些 PDO 驱动或旧版本可能报语法错误。
立即学习“PHP免费学习笔记(深入)”;
- 检查
$fields变量是否含前后空格:trim($fields)再拼进SELECT DISTINCT $fields - 避免动态拼
DISTINCT开关:不要写"SELECT " . ($need_distinct ? "DISTINCT " : "") . "name",容易漏空格,改用逻辑分支更清晰 - 如果字段名来自用户输入(如排序字段),务必白名单校验,
DISTINCT不是 SQL 注入的防护层
性能差?别怪 DISTINCT,先看有没有索引
DISTINCT 本身不慢,慢是因为它常触发临时表 + 文件排序(Using temporary; Using filesort)。尤其在没索引的字段上执行 SELECT DISTINCT long_text_column FROM huge_table,I/O 直接拉满。
- EXPLAIN 看执行计划,重点盯
Extra列有没有Using temporary - 对常用去重字段建联合索引,比如常做
SELECT DISTINCT status, category FROM orders,就建INDEX(status, category) - 大数据量下,
GROUP BY和DISTINCT底层优化差不多,别迷信某个写法更快
真正卡住的地方,往往不是语法怎么写,而是没意识到去重字段根本没索引,或者误以为 DISTINCT 能替代业务层 dedup 逻辑。











