UNION ALL 后如何去除重复记录的正确写法

舞姬之光

发布时间：2026-01-29 14:19:02

934人浏览过

来源于php中文网

原创

UNION ALL 本身不支持去重，需用嵌套查询包裹后加 DISTINCT 或 GROUP BY 实现；后者更可控，尤其处理 NULL、大文本或 JSON 字段时，且须为子查询显式指定别名。

union all 后如何去除重复记录的正确写法

UNION ALL 本身不支持去重，必须用嵌套查询包裹

UNION ALL 的设计目标就是“不检查重复、直接拼接”，它比 UNION 快正是因为跳过了去重逻辑。所以想在 UNION ALL 后去重，不能靠修改 UNION ALL 本身，而要把整个 UNION ALL 结果作为子查询，再用 DISTINCT 或 GROUP BY 处理。

常见错误是试图写成：SELECT * FROM A UNION ALL SELECT * FROM B DISTINCT —— 这语法非法，DISTINCT 不能放在 UNION ALL 后面。

正确结构是：SELECT DISTINCT * FROM (SELECT ... UNION ALL SELECT ...) AS t
如果字段多或含大文本（如 TEXT、JSON），DISTINCT 可能报错（MySQL 8.0+ 对不可排序类型有限制），此时改用 GROUP BY 显式列出所有字段更稳妥
注意别名 AS t 在大多数数据库中是强制要求的（如 MySQL、PostgreSQL），否则会提示 “every derived table must have its own alias”

用 GROUP BY 替代 DISTINCT 更可控，尤其涉及 NULL 或排序敏感字段时

当结果集中有 NULL 值、或某些字段语义上“相同但字面不同”（比如大小写不敏感的字符串、带空格的数值），DISTINCT 可能无法按业务预期去重。GROUP BY 允许你指定聚合逻辑，也更容易加 ORDER BY 或过滤条件。

示例（PostgreSQL/MySQL）：SELECT col1, col2 FROM (SELECT col1, col2 FROM A UNION ALL SELECT col1, col2 FROM B) AS t GROUP BY col1, col2
如果字段含 JSON 或 ARRAY（如 PostgreSQL），DISTINCT 会直接报错，GROUP BY 同样不支持，此时需先用函数标准化（如 jsonb_normalize 或 TRIM + LOWER）再分组
GROUP BY 在部分数据库（如 SQL Server）中对 TEXT/NTEXT 字段有限制，需转为 VARCHAR(MAX) 再操作

性能差异明显：UNION ALL + DISTINCT 几乎等于 UNION，但更难优化

表面上看，(SELECT ... UNION ALL SELECT ...) DISTINCT 和 SELECT ... UNION SELECT ... 效果一样，但执行计划往往不同。优化器通常无法把外层 DISTINCT 下推到 UNION ALL 子句中，导致全量结果先拼出来再扫一遍去重 —— 数据量大时内存和临时表压力远高于原生 UNION。

Hitems

HITEMS是一个AI驱动的创意设计平台，支持一键生成产品

下载

查执行计划时重点关注 Using temporary; Using filesort 是否出现在外层查询
如果两个子查询各自已排好序且字段可比较（如都是按 id ASC），可用 MERGE 类算法去重，但目前仅 SQLite 原生支持，其他数据库需手动实现归并逻辑
真正的大数据场景（千万级以上），应优先考虑在应用层合并，或用物化视图/中间表预处理，避免每次查询都做全量去重

跨数据库兼容写法要注意 NULL 处理和字段别名规则

不同数据库对 NULL 在 GROUP BY / DISTINCT 中的行为一致，但子查询别名、字段引用方式有差异。比如 SQL Server 要求所有字段在 GROUP BY 中显式出现，而 MySQL 5.7+ 开启 ONLY_FULL_GROUP_BY 后也强制如此；PostgreSQL 则严格要求 SELECT 中非聚合字段必须出现在 GROUP BY 中。

安全写法：始终给子查询加别名，且 GROUP BY 列表与 SELECT 字段一一对应（哪怕字段名相同）
避免写 SELECT * FROM (...) AS t GROUP BY * —— 所有主流数据库都不支持 GROUP BY *
如果字段来自不同子查询且同名（如都叫 id），务必在 UNION ALL 中统一别名，否则外层 GROUP BY 会报歧义

实际去重逻辑是否成立，取决于你定义“重复”的粒度——是整行完全相同，还是某几个关键字段相同。这点常被忽略，但直接影响该用 DISTINCT 还是 GROUP BY，以及是否需要提前清洗字段。

如何监控 MySQL Threads_connected 接近 max_connections 的告警

如何用 COALESCE / IFNULL / ISNULL 优雅处理 NULL 值

UPDATE FROM / UPDATE JOIN 在不同数据库的写法对比

SQL 如何用 PIVOT / UNPIVOT 实现行列转换（跨数据库）

SQL 如何高效查询 JSON 数组中包含某个值的记录

相关标签:

mysql js json 大数据 sql mysql json Array NULL select 字符串 union using table 算法 sqlite postgresql 数据库

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：SHOW ENGINE INNODB STATUS 中死锁日志的解读方法下一篇：暂无

作者最新文章

腾讯ai元宝发红包怎么弄腾讯元宝现金红包活动规则

2026-01-29 10:37

yield from 在生成器中遇到 GeneratorExit 的清理顺序

2026-01-29 11:15

clawdbot网站官网入口 clawdbot在线网页版使用

2026-01-29 11:20

摺机市场迎来大变动？HONOR 或以全新宽屏摺摺手机取代 Magic Vs 系列!

2026-01-29 11:21

高德淘金年入几十万是怎么做到的高德淘金怎么赚钱

2026-01-29 11:38

Clawdbot官网入口 Clawdbot AI官方网站

2026-01-29 11:40

高德淘金币100金币是多少钱高德淘金100个金币多少钱

2026-01-29 11:40

采用台积电N2P工艺制程！曝高通第六代骁龙8至尊版有双版本

2026-01-29 12:10

小米云服务关闭查找设备怎么办？小米设置小米账号云服务关闭查找设备开关需密码确认步骤

2026-01-29 12:59

subprocess 如何在 timeout 后杀死整个进程树（Windows/Linux）

2026-01-29 13:26

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

727

2023.10.12