SQL分组统计核心是GROUP BY,需确保SELECT中非聚合字段均出现在GROUP BY中;WHERE用于分组前过滤,HAVING用于分组后过滤;多字段分组按组合键处理,不可用SELECT *与GROUP BY混用。

SQL分组统计的核心是 GROUP BY,它把数据按一个或多个字段归类,再对每组应用聚合函数(如 COUNT、SUM、AVG 等)。用对了事半功倍,用错了直接报错或结果失真。
GROUP BY 必须包含所有非聚合字段
SELECT 后面如果出现未被聚合函数包裹的列,它必须出现在 GROUP BY 子句中,否则多数数据库(如 MySQL 严格模式、PostgreSQL、SQL Server)会报错。
- ✅ 正确写法:SELECT dept, COUNT(*) FROM emp GROUP BY dept;
- ❌ 错误写法:SELECT dept, name, COUNT(*) FROM emp GROUP BY dept;(name 既没聚合也没分组)
- ? 提示:MySQL 低版本可能“容忍”这种写法,但返回结果不可靠——name 取的是每组中某一行的值,不是随机就是默认首行,极易误导分析。
WHERE 和 HAVING 别混用:过滤时机不同
WHERE 在分组前过滤行,HAVING 在分组后过滤组。想筛“销售额超10万的部门”,得用 HAVING;想筛“只看2023年以后入职的员工”,就得用 WHERE。
- ✅ 先筛人再分组:SELECT dept, AVG(salary) FROM emp WHERE hire_date > '2023-01-01' GROUP BY dept;
- ✅ 分组后再筛组:SELECT dept, COUNT(*) FROM emp GROUP BY dept HAVING COUNT(*) > 5;
- ❌ 常见错误:SELECT dept, COUNT(*) FROM emp WHERE COUNT(*) > 5 GROUP BY dept;(WHERE 不能用聚合结果)
多字段分组注意顺序与组合逻辑
GROUP BY a, b 表示“先按 a 分大组,再在每个 a 组内按 b 分小组”,等价于按 (a,b) 这个组合键分组。结果行数 ≤ 唯一 (a,b) 对的数量。
- ? 示例:统计各城市、各性别的用户数:SELECT city, gender, COUNT(*) FROM users GROUP BY city, gender;
- ? 小技巧:想同时看“城市总计”和“城市+性别明细”,可用 GROUPING SETS(高阶用法),或 UNION ALL 拼两个 GROUP BY 结果。
- ⚠️ 注意 NULL:NULL 被视为一个独立分组值,多字段中任一为 NULL 都会影响分组结果,必要时用 COALESCE 处理。
避免 SELECT * 与 GROUP BY 混搭
GROUP BY 的目标是降维汇总,而 SELECT * 要求返回原始所有列,二者语义冲突。数据库不允许,也不该允许。
- ❌ 错误尝试:SELECT *, COUNT(*) FROM orders GROUP BY customer_id;
- ✅ 正确思路:明确你要什么维度(如 customer_id)和什么指标(如订单数、总金额),再写字段:SELECT customer_id, COUNT(*) cnt, SUM(amount) total FROM orders GROUP BY customer_id;
- ? 如果真需要关联原始明细,分两步走:先 GROUP BY 得到聚合结果,再 JOIN 原表或用窗口函数(如 COUNT(*) OVER (PARTITION BY customer_id))补信息。










