SQL分组统计核心是GROUP BY搭配聚合函数,关键在于明确分组维度、统计指标和过滤时机:WHERE筛行、GROUP BY分组、HAVING筛聚合结果。

SQL分组统计核心是 GROUP BY 搭配聚合函数(如 COUNT、SUM、AVG 等),但真正难的是“想清楚要按什么分、统计什么、怎么过滤结果”。下面用一个真实业务场景,带你一步步拆解逻辑,强化复杂查询思维。
明确业务目标:先想清楚“要算什么”
假设你手上有销售订单表 orders:
- order_id(订单ID)
- customer_id(客户ID)
- product_name(商品名)
- amount(订单金额)
- order_date(下单日期)
老板问:“上个月每个客户的总消费额是多少?只看消费超500元的客户。”
这里的关键动作有三步:
→ 按客户分组(GROUP BY customer_id)
→ 算每人总金额(SUM(amount))
→ 过滤分组后结果(HAVING SUM(amount) > 500,不是 WHERE!)
写对 GROUP BY 和 HAVING 的位置关系
常见错误是把过滤条件写在 WHERE 里,比如想筛“上个月”,却忘了 WHERE 在分组前执行,会漏掉部分数据逻辑。正确写法:
SELECT customer_id, SUM(amount) AS total_spent FROM orders WHERE order_date >= '2024-04-01' AND order_date < '2024-05-01' GROUP BY customer_id HAVING SUM(amount) > 500;
注意:
→ WHERE 筛原始行(比如时间范围、状态=已完成)
→ GROUP BY 分组
→ HAVING 筛分组后的聚合结果
→ SELECT 中所有非聚合字段必须出现在 GROUP BY 中(否则报错或结果不可靠)
进阶:多维度分组 + 衍生指标
再加一层需求:“按客户+商品类别统计销量和平均单价,并标记‘高价值客户’(该客户总消费 ≥ 2000)。”
这时需要:
→ 关联商品分类表(假设叫 products)
→ 先分组统计基础指标
→ 再用窗口函数或子查询打标签
简化版(不关联表,用 product_name 粗略分大类):
SELECT
customer_id,
CASE
WHEN product_name LIKE '%手机%' THEN '数码'
WHEN product_name LIKE '%书%' THEN '图书'
ELSE '其他'
END AS category,
COUNT(*) AS order_count,
AVG(amount) AS avg_order_amount
FROM orders
WHERE order_date >= '2024-04-01'
GROUP BY
customer_id,
CASE
WHEN product_name LIKE '%手机%' THEN '数码'
WHEN product_name LIKE '%书%' THEN '图书'
ELSE '其他'
END;
重点:
→ 多字段 GROUP BY 用逗号分隔
→ CASE 表达式也可用于分组,但需确保逻辑一致、无歧义
→ 若需“客户总消费”作为额外列,可用窗口函数:SUM(amount) OVER (PARTITION BY customer_id)
避坑提醒:GROUP BY 常见失控行为
- SELECT 里写了 product_name 却没放 GROUP BY 中 → 报错(MySQL 5.7+ 严格模式)或返回随机值
- 用 WHERE 过滤聚合结果(如 WHERE SUM(amount)>500)→ 语法错误,必须用 HAVING
- 忘记处理 NULL:COUNT(*) 统计所有行,COUNT(column) 忽略 NULL;分组时 NULL 会被单独归为一组
- 日期截取不统一:用 YEAR(order_date)、MONTH(order_date) 分组,不如用 DATE_FORMAT(order_date, '%Y-%m') 更可控
基本上就这些。分组统计不复杂,但容易忽略“执行顺序”和“语义边界”。多练几个带业务含义的真实问题,思维自然就稳了。










