SQL GROUPING SETS 与 ROLLUP/CUBE 的多维汇总效率对比

舞夢輝影

发布时间：2026-02-17 16:37:31

881人浏览过

来源于php中文网

原创

grouping sets 不一定比 rollup 快，性能取决于执行计划而非语法；postgresql 和 sql server 通常生成相同计划，oracle 12c+ 在统计信息缺失时可能更慢；mysql 8.0 不支持 grouping sets，rollup 为伪实现。

sql grouping sets 与 rollup/cube 的多维汇总效率对比

GROUPING SETS 比 ROLLUP 快吗？看执行计划，不是看写法

快不快，取决于数据库实际生成的执行计划，而不是你写了 GROUPING SETS 还是 ROLLUP。PostgreSQL 和 SQL Server 通常会对等价的 ROLLUP(a,b) 和 GROUPING SETS((a,b),(a),()) 生成完全一样的计划；但 Oracle 12c+ 在某些统计信息缺失时，可能对 GROUPING SETS 多做一次哈希重分区，反而慢 10%～20%。

实操建议：

先用 EXPLAIN (ANALYZE, BUFFERS)（PostgreSQL）或 SET STATISTICS XML ON（SQL Server）比对真实执行路径，别信语法“看起来更直接”
如果字段顺序敏感（比如 a 高基数、b 低基数），显式写 GROUPING SETS((a,b),(a),()) 可能比 ROLLUP(a,b) 更容易触发索引跳扫（尤其在 PostgreSQL 中配合 INDEX ON t(a,b)）
CUBE(a,b) 等价于 GROUPING SETS((a,b),(a),(b),())，但多数引擎会把 CUBE 当作独立算子优化——Oracle 会尝试位图转换，而 DuckDB 目前仍拆成多个 UNION ALL，性能差距可达 3×

GROUPING SETS 的 NULL 值陷阱：不是数据为空，是分组标记

很多人看到结果里某列出现 NULL，就以为原始数据丢了，其实那是 GROUPING() 函数的标记机制在起作用——NULL 表示该维度被“折叠”，不是原始值为 NULL。

常见错误现象：

用 WHERE col IS NULL 过滤汇总行，误删真实数据中的 NULL 记录
没加 GROUPING() 判断，直接在应用层把所有 NULL 当“总计行”处理，导致明细和汇总混在一起
在 ORDER BY 里只排字段，不按 GROUPING(col) 分层，导致小计行插在明细中间

正确做法是显式识别：例如 SELECT a, b, SUM(x), GROUPING(a) AS ga, GROUPING(b) AS gb FROM t GROUP BY GROUPING SETS((a,b),(a),())，再用 ga=1 AND gb=1 定位全汇总行。

Synthesys

Synthesys是一家领先的AI虚拟媒体平台，用户只需点击几下鼠标就可以制作专业的AI画外音和AI视频

下载

ROLLUP/CUBE 在 MySQL 8.0+ 是伪实现，GROUPING SETS 不支持

MySQL 8.0 虽然加了 ROLLUP 语法，但它底层是改写成多个 UNION ALL + 单层 GROUP BY，没有真正的多维聚合算子。这意味着：

每组 GROUP BY 都要全表扫描一遍，4 维 ROLLUP 就是 2⁴ = 16 次扫描（实际优化后略少，但仍是 O(2ⁿ)）
CUBE 在 MySQL 中根本不可用，会报错 ERROR 1235 (42000): This version of MySQL doesn't yet support 'CUBE'
想用 GROUPING SETS？不行。MySQL 至今（8.0.33）仍不支持该语法，必须手写 UNION ALL 或换引擎（如 ClickHouse、DuckDB）

如果你在 MySQL 里硬要模拟 GROUPING SETS((a),(b),())，最稳的写法是：(SELECT a, NULL AS b, SUM(x) FROM t GROUP BY a) UNION ALL (SELECT NULL, b, SUM(x) FROM t GROUP BY b) UNION ALL (SELECT NULL, NULL, SUM(x) FROM t)，注意加括号和字段对齐。

大数据量下，预聚合比任何 GROUPING 方式都管用

当单表超千万行、维度超 3 个时，无论 GROUPING SETS 还是 ROLLUP，都会面临内存溢出或临时磁盘爆满。这时候语法差异已经不重要了，关键是你有没有提前建好物化聚合表。

实操建议：

用定时任务（如 pg_cron）每天凌晨跑：INSERT INTO agg_daily_a_b SELECT a, b, COUNT(*), SUM(revenue) FROM fact_sales WHERE dt = CURRENT_DATE - INTERVAL '1 day' GROUP BY a, b
对高频查询的组合（如 (region, product_category)），单独建索引：CREATE INDEX idx_agg_region_cat ON agg_daily_a_b(region, product_category)
避免在大宽表上直接跑 GROUPING SETS——即使引擎支持，也大概率触发 HashAgg: Rehashing due to memory limit（PostgreSQL）或 Warning: Hash aggregate spilled to disk（SQL Server）

真正卡住性能的，从来不是语法选错，而是忘了数据规模已经超出单次聚合的合理边界。

相关标签:

sql mysql NULL count select xml Error union this oracle postgresql 数据库 clickhouse

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：SQL BEFORE INSERT 触发器的业务校验与性能开销分析下一篇：暂无

作者最新文章

GitHub 怎么配置 SSH？GitHub SSH Key 配置完整教程

2026-02-16 12:24

Python etcd3 的 Python 异步客户端

2026-02-16 12:25

Windows蓝屏错误怎么解决 Windows蓝屏错误排查与修复

2026-02-16 12:34

Python 幂等性设计的常见模式

2026-02-16 12:53

腾讯会议电脑怎么进入会议

2026-02-16 12:54

SQL 主键自增序列 vs UUID 主键的插入性能与索引碎片对比

2026-02-16 13:16

Windows杀毒方法内置防护与第三方安全软件思路

2026-02-16 13:40

Linux shell 管道组合优化技巧

2026-02-16 13:42

Python 抽象基类（ABC）与协议（Protocols）：接口设计的边界

2026-02-16 13:51

Python f-string 的自描述表达式增强

2026-02-16 14:02

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

AI 图片处理图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

965

2023.10.12