跨表汇总统计需先JOIN连接多表,再GROUP BY分组,最后用SUM/COUNT/AVG等聚合函数计算;关键在厘清主表、关联逻辑、数据质量及避免笛卡尔积。

跨表汇总统计的核心是先用 JOIN 连接多张表,再用 GROUP BY 分组,最后用 聚合函数(如 SUM、COUNT、AVG)计算指标。关键不是堆叠表,而是理清业务关系——哪张是主表?关联字段是否唯一?空值要不要排除?
明确主表和关联逻辑
比如统计「每个部门的员工数和平均薪资」,部门表(dept)是主表,员工表(emp)是明细表,通过 dept_id 关联。如果部门没有员工,用 LEFT JOIN 保留部门记录;若只看有员工的部门,用 INNER JOIN 更高效。
- 确认主键/外键:dept.dept_id 是主键,emp.dept_id 是外键
- 检查数据质量:emp.dept_id 是否存在 NULL?会影响 COUNT 结果
- 避免笛卡尔积:确保 ON 条件写对,不漏加 JOIN 条件
写法模板:从简单到带条件
基础写法(部门人数+平均薪资):
SELECT d.dept_name, COUNT(e.emp_id) AS emp_count, ROUND(AVG(e.salary), 2) AS avg_salary FROM dept d LEFT JOIN emp e ON d.dept_id = e.dept_id GROUP BY d.dept_id, d.dept_name;
进阶加条件(只统计在职员工,且部门平均薪资 > 8000):
- WHERE 过滤行(在分组前):加
e.status = 'onboard' - HAVING 过滤组(在分组后):加
HAVING AVG(e.salary) > 8000 - 注意:WHERE 不能用聚合结果,HAVING 不能用非分组字段(除非是聚合函数)
三张表以上怎么处理?分步连、别名清
例如:部门 → 员工 → 订单,要统计「各部门订单总金额」。不要一次性 JOIN 三张表硬套,建议:
- 先明确路径:dept → emp(1:N),emp → order(1:N),所以 dept → order 是 1:N 关系
- 给每张表起简短别名(d/e/o),ON 条件写清楚(e.dept_id = d.dept_id,o.emp_id = e.emp_id)
- 若某环节可能为空(如员工没下单),用 LEFT JOIN 并配合 COALESCE 处理 NULL
- 必要时用子查询或 CTE 拆解逻辑,提升可读性,比如先算每人订单总额,再按部门聚合
性能和易错点提醒
实际跑得慢或结果不对,大概率卡在这几个地方:
- 忘了 GROUP BY 非聚合字段(MySQL 5.7+ 严格模式会报错)
- JOIN 多张大表没加索引:确保关联字段(如 dept_id、emp_id)都有索引
- COUNT(*) 和 COUNT(字段) 区别:后者跳过 NULL,前者统计所有行
- 日期范围写错位置:时间过滤尽量放 WHERE,别放 HAVING,否则先聚合再过滤,浪费资源









