0

0

如何用 ROW_NUMBER() + 子查询实现跨页去重分页

冷漠man

冷漠man

发布时间:2026-01-28 21:00:09

|

970人浏览过

|

来源于php中文网

原创

直接用ROW_NUMBER()分页会导致重复,因相同排序值的行顺序随机;须先按业务逻辑去重(如GROUP BY或PARTITION BY+rn=1),再编号分页,且跨页应采用键集分页避免OFFSET缺陷。

如何用 row_number() + 子查询实现跨页去重分页

为什么直接用 ROW_NUMBER() 会重复分页

当你对含重复数据的表(比如多条记录共享同一 user_id)直接套 ROW_NUMBER() OVER (ORDER BY ...) 分页时,相同排序值的行会被随机打乱顺序,导致第 1 页出现的某条 user_id = 100 记录,在第 2 页又因窗口函数重排而再次出现——本质是去重逻辑没落在分页之前。

子查询里先 DISTINCT 再编号,不行

DISTINCTROW_NUMBER() 不能共存于同一层 SELECT(语法报错),强行在子查询中 SELECT DISTINCT ... FROM t 后再套 ROW_NUMBER(),会丢失原始行信息(比如你本想取每用户最新一条订单,但 DISTINCT user_id 不知道哪条是最新)。

  • 错误写法:
    SELECT *, ROW_NUMBER() OVER (ORDER BY user_id) rn FROM (SELECT DISTINCT user_id FROM orders) t
  • 问题:丢掉了 order_timeamount 等关键字段,无法支撑“每个用户取最新订单”这类真实需求

正确做法:用 GROUP BY 或窗口内去重 + ROW_NUMBER()

核心是把“去重逻辑”显式表达为聚合或优先级选择,再编号。常见两种路径:

BibiGPT-哔哔终结者
BibiGPT-哔哔终结者

B站视频总结器-一键总结 音视频内容

下载
  • 按业务主键 GROUP BY,用 MAX(order_time)MAX(id) 拿最新行,再对结果集编号:
    SELECT *, ROW_NUMBER() OVER (ORDER BY latest_time DESC) rn FROM (  SELECT user_id, MAX(order_time) AS latest_time, MAX(amount) AS amount  FROM orders  GROUP BY user_id) t
  • ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY order_time DESC) 先标出每组第一条,再外层筛选 rn = 1,最后重新编号分页:
    SELECT *, ROW_NUMBER() OVER (ORDER BY user_id) rn FROM (  SELECT * FROM (    SELECT *, ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY order_time DESC) rn_inner    FROM orders  ) t WHERE rn_inner = 1) t2
  • 注意:第二层 ROW_NUMBER()ORDER BY 必须和分页意图一致(比如按创建时间倒序),否则页与页之间顺序不稳

跨页分页时 OFFSET 的坑

OFFSET 20 ROWS FETCH NEXT 10 ROWS ONLY 看似简洁,但底层仍要扫描前 30 行;如果去重后总行数少(比如 25 条),第 3 页就为空——而用户可能以为数据丢了。更稳的方式是用键集分页(Keyset Pagination),即记住上一页最后一条的 user_idlatest_time,下一页查:

WHERE (latest_time, user_id) < (‘2024-05-01’, ‘u999’) ORDER BY latest_time DESC, user_id DESC LIMIT 10

真正难的不是写对语法,而是把“去重策略”和“分页稳定性”绑在一起设计;一旦 PARTITION BY 字段和 ORDER BY 字段没对齐,或者没处理好 NULL 值排序优先级,跨页就会漏数或重复。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
数据分析工具有哪些
数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍:1、Excel,具有强大的计算和数据处理功能;2、SQL,可以进行数据查询、过滤、排序、聚合等操作;3、Python,拥有丰富的数据分析库;4、R,拥有丰富的统计分析库和图形库;5、Tableau,提供了直观易用的用户界面等等。

727

2023.10.12

SQL中distinct的用法
SQL中distinct的用法

SQL中distinct的语法是“SELECT DISTINCT column1, column2,...,FROM table_name;”。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

327

2023.10.27

SQL中months_between使用方法
SQL中months_between使用方法

在SQL中,MONTHS_BETWEEN 是一个常见的函数,用于计算两个日期之间的月份差。想了解更多SQL的相关内容,可以阅读本专题下面的文章。

350

2024.02.23

SQL出现5120错误解决方法
SQL出现5120错误解决方法

SQL Server错误5120是由于没有足够的权限来访问或操作指定的数据库或文件引起的。想了解更多sql错误的相关内容,可以阅读本专题下面的文章。

1243

2024.03.06

sql procedure语法错误解决方法
sql procedure语法错误解决方法

sql procedure语法错误解决办法:1、仔细检查错误消息;2、检查语法规则;3、检查括号和引号;4、检查变量和参数;5、检查关键字和函数;6、逐步调试;7、参考文档和示例。想了解更多语法错误的相关内容,可以阅读本专题下面的文章。

360

2024.03.06

oracle数据库运行sql方法
oracle数据库运行sql方法

运行sql步骤包括:打开sql plus工具并连接到数据库。在提示符下输入sql语句。按enter键运行该语句。查看结果,错误消息或退出sql plus。想了解更多oracle数据库的相关内容,可以阅读本专题下面的文章。

820

2024.04.07

sql中where的含义
sql中where的含义

sql中where子句用于从表中过滤数据,它基于指定条件选择特定的行。想了解更多where的相关内容,可以阅读本专题下面的文章。

581

2024.04.29

sql中删除表的语句是什么
sql中删除表的语句是什么

sql中用于删除表的语句是drop table。语法为drop table table_name;该语句将永久删除指定表的表和数据。想了解更多sql的相关内容,可以阅读本专题下面的文章。

423

2024.04.29

俄罗斯Yandex引擎入口
俄罗斯Yandex引擎入口

2026年俄罗斯Yandex搜索引擎最新入口汇总,涵盖免登录、多语言支持、无广告视频播放及本地化服务等核心功能。阅读专题下面的文章了解更多详细内容。

158

2026.01.28

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PHP自制框架
PHP自制框架

共8课时 | 0.6万人学习

PHP面向对象基础课程(更新中)
PHP面向对象基础课程(更新中)

共12课时 | 0.7万人学习

AI绘画教程
AI绘画教程

共2课时 | 0.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号