SQL 使用窗口函数实现去重保留最新记录

冷漠man

发布时间：2026-01-25 16:25:31

634人浏览过

来源于php中文网

原创

ROW_NUMBER() 是去重保最新最常用的选择，因其可在分组内按时间倒序编号后筛选序号为1的完整记录，逻辑清晰且主流数据库均支持；需配合OVER()中ORDER BY指定排序，重复时间时应加二级排序防不稳定。

sql 使用窗口函数实现去重保留最新记录

为什么 ROW_NUMBER() 是去重保最新最常用的选择

直接用 GROUP BY 无法保留“最新”那条完整记录，而 DISTINCT 又不认时间字段的大小关系。窗口函数中 ROW_NUMBER() 能按分组内时间倒序编号，再筛出序号为 1 的行，逻辑清晰、兼容性好（MySQL 8.0+、PostgreSQL、SQL Server、Oracle 都支持）。

必须配合 ORDER BY 子句在 OVER() 中指定排序依据，比如 created_at DESC 或 id DESC
如果时间字段有重复，建议加二级排序（如 ORDER BY updated_at DESC, id DESC），避免结果不稳定
RANK() 和 DENSE_RANK() 会把相同时间的多条都标为 1，达不到“只留一条”的目的

实际写法：子查询 + ROW_NUMBER() 筛选

核心是先在子查询或 CTE 中计算行号，外层过滤 rn = 1。不能在同一个查询层级里 WHERE 引用窗口函数结果。

SELECT id, user_id, status, updated_at
FROM (
  SELECT *,
         ROW_NUMBER() OVER (
           PARTITION BY user_id 
           ORDER BY updated_at DESC, id DESC
         ) AS rn
  FROM orders
) t
WHERE rn = 1;

PARTITION BY user_id 表示按用户分组去重；换成 product_id 就是按商品去重
ORDER BY updated_at DESC, id DESC 确保更新时间最新且 ID 最大的那条胜出
别忘了给子查询起别名（如 t），否则 MySQL 会报错

MySQL 5.7 或更老版本怎么办

这些版本不支持窗口函数，得用自连接或相关子查询模拟。性能差、写法绕，但有时不得不做：

AI Web Designer

AI网页设计师，快速生成个性化的网站设计

下载

SELECT o1.*
FROM orders o1
WHERE o1.updated_at = (
  SELECT MAX(o2.updated_at)
  FROM orders o2
  WHERE o2.user_id = o1.user_id
)
AND o1.id = (
  SELECT MAX(o3.id)
  FROM orders o3
  WHERE o3.user_id = o1.user_id
    AND o3.updated_at = o1.updated_at
);

这个写法假设“同用户同时间有多条时，取 id 最大的那条”
没有索引的话，user_id + updated_at 组合索引能大幅提速
如果数据量大，这种写法可能比窗口函数慢一个数量级，别在线上表盲目套用

容易被忽略的 NULL 和时区问题

updated_at 为 NULL 的记录会被排在最前面（多数数据库默认 NULLS FIRST），导致它们意外中标。还有时区不一致会让“最新”判断出错。

在 ORDER BY 中显式控制 NULL：加 NULLS LAST（PostgreSQL、Oracle 支持），MySQL 不支持，得提前用 COALESCE(updated_at, '1970-01-01') 处理
确保所有时间字段已转为统一时区（如 UTC），否则跨服务器写入的数据可能因本地时区不同导致排序错乱
如果业务要求“最后插入的那条”，优先用自增 id 排序，它比时间字段更可靠

MySQL如何解决大事务导致的从库延迟_拆分大事务与MTS多线程

如何利用EXPLAIN分析SQL瓶颈_type与Extra字段执行计划解读

SQL如何分析索引的碎片率_OPTIMIZE TABLE与重建表释放空间

如何解决MySQL安装失败问题_清理注册表与环境依赖检查

SQL布尔字段优化_BOOLEAN使用实践

相关标签:

mysql oracle sql mysql NULL oracle postgresql 数据库

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：SQL 执行计划中的关键字段解读下一篇：SQL 如何设计审计字段？

作者最新文章

Linux进程五种状态转换原理及R与D状态性能影响分析

2026-03-14 12:24

Linux系统中线程Thread与轻量级进程LWP内在联系分析

2026-03-14 12:41

MacOS系统针对外部存储的Spotlight索引禁用设置

2026-03-14 13:02

Windows运维中利用GPO配置无线网络配置文件自动连接

2026-03-14 13:14

Java中Apache缓存雪崩现象的预防与后端保护逻辑

2026-03-14 13:22

Linux系统卡死问题_内核日志分析

2026-03-14 13:34

Linux 大促场景性能优化_削峰填谷策略

2026-03-14 13:43

Linux日志切割配置_logrotate实践

2026-03-14 13:53

SQLSQL注入防护_输入校验与参数化查询

2026-03-14 14:02

SQL批量删除优化_DELETE与TRUNCATE对比

2026-03-14 14:51

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

1135

2023.10.12