<p>答案:MySQL去重常用方法包括DELETE+JOIN、子查询、创建新表和窗口函数。使用DELETE t1 FROM user_info t1 INNER JOIN user_info t2 WHERE t1.id > t2.id AND t1.email = t2.email可保留最小ID记录;通过DELETE FROM user_info WHERE id NOT IN (SELECT min_id FROM (SELECT MIN(id) AS min_id FROM user_info GROUP BY email) AS tmp)利用子查询避免同一表操作限制;创建新表方式为CREATE TABLE user_info_distinct LIKE user_info, INSERT INTO user_info_distinct SELECT * FROM user_info GROUP BY email, 再RENAME TABLE完成替换;MySQL 8.0+可用DELETE FROM user_info WHERE id IN (SELECT id FROM (SELECT id, ROW_NUMBER() OVER (PARTITION BY email ORDER BY id) AS rn FROM user_info) AS t WHERE rn > 1)实现去重;选择方法需考虑版本、数据量及备份策略,操作前应备份以防误删。</p>

在MySQL中去除重复数据是日常开发中常见的需求,通常出现在数据清洗、表结构优化等场景。去重的核心思路是保留一条记录,删除其余重复项。以下是几种常用的MySQL去重语句编写方法。
当表中有主键或唯一标识字段时,可以通过自连接的方式保留ID最小(或最大)的那条记录,删除其他重复项。
DELETE t1 FROM user_info t1
INNER JOIN user_info t2
WHERE t1.id > t2.id AND t1.email = t2.email;
这条语句的意思是:如果两条记录email相同,且t1的id大于t2,则删除t1。这样就保留了每个email对应id最小的那条记录。
通过子查询找出需要保留的记录(如每组最小id),然后删除不在该集合中的重复数据。
示例:
DELETE FROM user_info
WHERE id NOT IN (
SELECT min_id FROM (
SELECT MIN(id) AS min_id
FROM user_info
GROUP BY email
) AS tmp
);
注意:MySQL不允许直接对同一张表进行更新和子查询操作,因此需要再嵌套一层临时表(如AS tmp)来绕过限制。
如果原表数据量大或担心误删,可以先创建一张结构相同的新表,插入去重后的数据,再替换原表。
步骤如下:
CREATE TABLE user_info_distinct LIKE user_info;
INSERT INTO user_info_distinct
SELECT * FROM user_info
GROUP BY email;
RENAME TABLE user_info TO user_info_backup,
user_info_distinct TO user_info;
这种方式安全可靠,适合生产环境大批量去重操作。
MySQL 8.0 支持窗口函数,可以更灵活地标记重复数据。
例如:
DELETE FROM user_info
WHERE id IN (
SELECT id FROM (
SELECT id,
ROW_NUMBER() OVER (PARTITION BY email ORDER BY id) AS rn
FROM user_info
) AS t
WHERE rn > 1
);
该方法按email分组,按id排序,给每组内的记录编号,保留rn=1的记录,删除rn>1的。
基本上就这些常用方法。选择哪种方式取决于你的MySQL版本、数据量大小以及是否允许创建新表。建议操作前先备份数据,避免误删。
以上就是mysql去重语句怎么写_mysql去重语句编写方法指南的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号