mysql去重语句怎么写_mysql去重语句编写方法指南

看不見的法師
发布: 2025-12-01 10:35:10
原创
277人浏览过
<p>答案:MySQL去重常用方法包括DELETE+JOIN、子查询、创建新表和窗口函数。使用DELETE t1 FROM user_info t1 INNER JOIN user_info t2 WHERE t1.id > t2.id AND t1.email = t2.email可保留最小ID记录;通过DELETE FROM user_info WHERE id NOT IN (SELECT min_id FROM (SELECT MIN(id) AS min_id FROM user_info GROUP BY email) AS tmp)利用子查询避免同一表操作限制;创建新表方式为CREATE TABLE user_info_distinct LIKE user_info, INSERT INTO user_info_distinct SELECT * FROM user_info GROUP BY email, 再RENAME TABLE完成替换;MySQL 8.0+可用DELETE FROM user_info WHERE id IN (SELECT id FROM (SELECT id, ROW_NUMBER() OVER (PARTITION BY email ORDER BY id) AS rn FROM user_info) AS t WHERE rn > 1)实现去重;选择方法需考虑版本、数据量及备份策略,操作前应备份以防误删。</p>

mysql去重语句怎么写_mysql去重语句编写方法指南

在MySQL中去除重复数据是日常开发中常见的需求,通常出现在数据清洗、表结构优化等场景。去重的核心思路是保留一条记录,删除其余重复项。以下是几种常用的MySQL去重语句编写方法。

使用 DELETE + JOIN 删除重复数据

当表中有主键或唯一标识字段时,可以通过自连接的方式保留ID最小(或最大)的那条记录,删除其他重复项。

  • 假设表名为 user_info,去重依据字段为 email
  • SQL语句如下:

DELETE t1 FROM user_info t1
INNER JOIN user_info t2
WHERE t1.id > t2.id AND t1.email = t2.email;

这条语句的意思是:如果两条记录email相同,且t1的id大于t2,则删除t1。这样就保留了每个email对应id最小的那条记录。

利用子查询配合 NOT IN 或 EXISTS 去重

通过子查询找出需要保留的记录(如每组最小id),然后删除不在该集合中的重复数据。

示例:

DELETE FROM user_info
WHERE id NOT IN (
  SELECT min_id FROM (
    SELECT MIN(id) AS min_id
    FROM user_info
    GROUP BY email
  ) AS tmp
);

注意:MySQL不允许直接对同一张表进行更新和子查询操作,因此需要再嵌套一层临时表(如AS tmp)来绕过限制。

创建新表并导入去重数据

如果原表数据量大或担心误删,可以先创建一张结构相同的新表,插入去重后的数据,再替换原表。

Shrink.media
Shrink.media

Shrink.media是当今市场上最快、最直观、最智能的图像文件缩减工具

Shrink.media 123
查看详情 Shrink.media

步骤如下:

CREATE TABLE user_info_distinct LIKE user_info;
INSERT INTO user_info_distinct
SELECT * FROM user_info
GROUP BY email;
RENAME TABLE user_info TO user_info_backup,
           user_info_distinct TO user_info;

这种方式安全可靠,适合生产环境大批量去重操作。

使用 ROW_NUMBER() 窗口函数标记重复行(MySQL 8.0+)

MySQL 8.0 支持窗口函数,可以更灵活地标记重复数据。

例如:

DELETE FROM user_info
WHERE id IN (
  SELECT id FROM (
    SELECT id,
        ROW_NUMBER() OVER (PARTITION BY email ORDER BY id) AS rn
    FROM user_info
  ) AS t
  WHERE rn > 1
);

该方法按email分组,按id排序,给每组内的记录编号,保留rn=1的记录,删除rn>1的。

基本上就这些常用方法。选择哪种方式取决于你的MySQL版本、数据量大小以及是否允许创建新表。建议操作前先备份数据,避免误删。

以上就是mysql去重语句怎么写_mysql去重语句编写方法指南的详细内容,更多请关注php中文网其它相关文章!

最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号