0

0

SQL DISTINCT 去重查询优化实战

冷漠man

冷漠man

发布时间:2026-02-25 20:19:32

|

443人浏览过

|

来源于php中文网

原创

sql distinct 去重查询优化实战

DISTINCT 是 SQL 中最常用也最容易被误用的关键词之一。它看似简单——去重,但实际执行时可能引发全表扫描、临时表膨胀、排序开销剧增等问题,尤其在大数据量、多字段、高并发场景下,性能骤降很常见。优化 DISTINCT 的核心不是“怎么写”,而是“为什么需要去重”以及“能否换种方式避免去重”。

先问一句:真的需要 DISTINCT 吗?

很多 DISTINCT 是“防御性写法”:怕 JOIN 多对一导致重复,就无脑加 DISTINCT。这往往掩盖了真正的数据模型或关联逻辑问题。

  • 检查 JOIN 条件是否准确——比如用 LEFT JOIN 关联用户表和订单表,却没加 ON u.id = o.user_id AND o.status = 'paid',导致一个用户多笔有效订单被重复计数,再用 DISTINCT 掩盖,结果是查得慢、结果还可能错(比如漏掉某条本该保留的记录)
  • 确认业务语义——要的是“有多少个不同城市”,还是“每个城市的最新一条记录”?前者用 DISTINCT city 合理;后者用 DISTINCT city 就会丢失时间、ID 等关键信息,应该改用窗口函数或 GROUP BY + 聚合
  • 用 EXPLAIN 查看执行计划:如果出现 Using temporary; Using filesort,说明 MySQL 正在内存/磁盘建临时表排序去重,这是性能红灯

能替代 DISTINCT 的更高效写法

多数时候,DISTINCT 可被语义等价但执行更轻量的方式替代:

Bardeen AI
Bardeen AI

使用AI自动执行人工任务

下载
  • 用 EXISTS 替代 IN + DISTINCT:例如“查所有有订单的用户”写成 SELECT DISTINCT u.id, u.name FROM users u JOIN orders o ON u.id = o.user_id,可改为 SELECT u.id, u.name FROM users u WHERE EXISTS (SELECT 1 FROM orders o WHERE o.user_id = u.id) ——避免生成中间笛卡尔积,通常快 2–5 倍
  • 用 GROUP BY 替代多字段 DISTINCT:当 SELECT 字段全是索引覆盖列时,MySQL 5.7+ 对 GROUP BY 有优化(松散索引扫描),比 DISTINCT 更快;且便于后续扩展聚合逻辑(如加 COUNT(*))
  • 用 ROW_NUMBER() 或 LATERAL(PostgreSQL / MySQL 8.0+)取每组首行:比如“每个部门薪资最高的员工”,不要写 SELECT DISTINCT dept, MAX(salary) ... GROUP BY dept 再二次关联,而应直接用窗口函数定位唯一行

必须用 DISTINCT 时的实操优化点

如果绕不开,就从执行路径上压榨效率:

  • 确保 SELECT 的字段尽量少,且优先选有索引的列:DISTINCT 的去重键越短、越有序,哈希/排序越快。避免 SELECT DISTINCT * 或包含 TEXT/BLOB 字段
  • 在 WHERE 中尽早过滤,再 DISTINCT:把时间范围、状态条件写在前面,而不是先 DISTINCT 全量再 WHERE,否则去重成本翻倍
  • 为 DISTINCT 字段建联合索引(注意顺序):例如 SELECT DISTINCT category, status FROM products,适合建索引 INDEX(category, status);若常带 WHERE category = ?,则把 category 放前更高效
  • 大表分页 DISTINCT 场景慎用 LIMIT + OFFSET:SELECT DISTINCT x FROM t ORDER BY x LIMIT 10 OFFSET 10000,可能需扫描上万行才凑够 10 个不重复值。改用游标分页(WHERE x > last_seen_value LIMIT 10)更稳

不同数据库的小差异要注意

DISTINCT 行为和优化能力因引擎而异:

  • MySQL:5.7 开始对单字段 DISTINCT + ORDER BY 索引列有松散索引扫描优化;但多字段 DISTINCT 仍依赖临时表;8.0 支持 CTE 和窗口函数,多数 DISTINCT 场景可重构
  • PostgreSQL:DISTINCT 默认走 HashAggregate(内存哈希去重),比排序快;配合 ENABLE_HASHAGG=off 可强制走 SortAggregate 测试对比;对 NULL 值处理更严格(NULLs are equal)
  • ClickHouse:DISTINCT 底层用 Set 数据结构,性能极好,但内存消耗明显;超大数据量建议用 GROUP BY + any() 聚合替代

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
数据分析工具有哪些
数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍:1、Excel,具有强大的计算和数据处理功能;2、SQL,可以进行数据查询、过滤、排序、聚合等操作;3、Python,拥有丰富的数据分析库;4、R,拥有丰富的统计分析库和图形库;5、Tableau,提供了直观易用的用户界面等等。

1027

2023.10.12

SQL中distinct的用法
SQL中distinct的用法

SQL中distinct的语法是“SELECT DISTINCT column1, column2,...,FROM table_name;”。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

337

2023.10.27

SQL中months_between使用方法
SQL中months_between使用方法

在SQL中,MONTHS_BETWEEN 是一个常见的函数,用于计算两个日期之间的月份差。想了解更多SQL的相关内容,可以阅读本专题下面的文章。

379

2024.02.23

SQL出现5120错误解决方法
SQL出现5120错误解决方法

SQL Server错误5120是由于没有足够的权限来访问或操作指定的数据库或文件引起的。想了解更多sql错误的相关内容,可以阅读本专题下面的文章。

1842

2024.03.06

sql procedure语法错误解决方法
sql procedure语法错误解决方法

sql procedure语法错误解决办法:1、仔细检查错误消息;2、检查语法规则;3、检查括号和引号;4、检查变量和参数;5、检查关键字和函数;6、逐步调试;7、参考文档和示例。想了解更多语法错误的相关内容,可以阅读本专题下面的文章。

377

2024.03.06

oracle数据库运行sql方法
oracle数据库运行sql方法

运行sql步骤包括:打开sql plus工具并连接到数据库。在提示符下输入sql语句。按enter键运行该语句。查看结果,错误消息或退出sql plus。想了解更多oracle数据库的相关内容,可以阅读本专题下面的文章。

1415

2024.04.07

sql中where的含义
sql中where的含义

sql中where子句用于从表中过滤数据,它基于指定条件选择特定的行。想了解更多where的相关内容,可以阅读本专题下面的文章。

585

2024.04.29

sql中删除表的语句是什么
sql中删除表的语句是什么

sql中用于删除表的语句是drop table。语法为drop table table_name;该语句将永久删除指定表的表和数据。想了解更多sql的相关内容,可以阅读本专题下面的文章。

437

2024.04.29

batoto漫画官网入口与网页版访问指南
batoto漫画官网入口与网页版访问指南

本专题系统整理batoto漫画官方网站最新可用入口,涵盖最新官网地址、网页版登录页面及防走失访问方式说明,帮助用户快速找到batoto漫画官方平台,稳定在线阅读各类漫画内容。

127

2026.02.25

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号