mysql迁移数据时如何处理大表_mysql大表迁移方案

P粉602998670

发布时间：2026-02-24 11:50:03

963人浏览过

来源于php中文网

原创

大表迁移禁用 insert into ... select，因其锁表、耗内存、拖垮主库；推荐 mysqldump --where 分批导出或 mydumper 并行导出，并注意切分 chunk、控制线程数、避免一致性锁；导入时用 truncate 或 insert ignore 防重复，迁移后须校验数据。

mysql迁移数据时如何处理大表_mysql大表迁移方案

大表迁移时为什么不能直接用 INSERT INTO ... SELECT

因为会锁表、占满内存、拖垮主库。MySQL 在执行 INSERT INTO t2 SELECT * FROM t1 时，如果 t1 是千万级大表，事务会长时间持有 MDL 锁，阻塞所有 DDL 和部分 DML；同时 binlog 写入压力剧增，从库容易延迟数小时甚至断连。

实操建议：

禁用该方式迁移单表 >500 万行的数据
如必须用，务必在业务低峰期 + 设置 innodb_lock_wait_timeout=30 防死锁
提前在目标库关闭 autocommit，手动分段提交（但依然不推荐）

pt-online-schema-change 能否用于纯数据迁移

可以，但它本质是「在线改表」工具，不是迁移工具。它通过创建影子表 + 触发器同步增量，适合结构变更场景；若只迁数据不改结构，反而引入额外风险：触发器可能丢失更新、主从 GTID 不一致、触发器堆积导致主库 CPU 暴涨。

实操建议：

仅当需同步迁移 + 同时修改表结构（如加索引、改字段）时才启用 pt-online-schema-change
纯数据迁移请用 mysqldump --where 分批导出，或 mydumper 并行导出
使用前确认源库 binlog_format=ROW，否则触发器无法捕获变更

用 mydumper 导出大表要注意哪些参数

mydumper 是 C 实现的并行逻辑导出工具，比 mysqldump 快 3–5 倍，但默认行为对大表不友好：它会把整张表当一个 chunk 导出，内存占用高、失败后重跑成本大。

Hotpot.ai

AI工具箱（图像、游戏和写作系列工具）

下载

实操建议：

强制按主键切分：加上 --chunk-filesize=64（单位 MB）或 --rows=100000 控制每 chunk 行数
指定导出线程数：-t 8（根据源库 CPU 核数设，别超 2×CPU 数）
跳过统计信息避免卡住：--no-views --no-triggers --no-sysinfo
导出时加 --trx-consistency-only，不开启全局一致性快照（避免 FLUSH TABLES WITH READ LOCK）

导入时如何避免主键冲突和重复写入

大表迁移常跨实例、跨版本，目标库可能已有部分数据（比如历史归档），或迁移中断后重试，此时直接 myloader 会报 Duplicate entry 'xxx' for key 'PRIMARY'。

实操建议：

导入前先清空目标表（如果允许）：TRUNCATE TABLE t1，比 DELETE FROM 快且不记 binlog
如需追加或去重，用 INSERT IGNORE 或 REPLACE INTO：需提前在 myloader 的 SQL 文件里批量替换 INSERT INTO → INSERT IGNORE INTO
更稳妥的做法：导入到临时表 t1_tmp，再用 INSERT INTO t1 SELECT ... ON DUPLICATE KEY UPDATE 合并
导入后立刻校验：SELECT COUNT(*) FROM t1 和 CHECKSUM TABLE t1（注意 CHECKSUM 在 8.0.26+ 已弃用，可用 SELECT MD5(GROUP_CONCAT(...)) 替代）

大表迁移真正难的不是命令怎么写，而是中间状态不可见——没日志、没进度条、不知道卡在哪一行。哪怕用了 mydumper，也得自己加 pv 或定时查 information_schema.PROCESSLIST 看当前正在 dump 哪个 chunk。

mysql MyISAM为什么只有表锁_mysql存储引擎差异分析

mysql如何防止权限被滥用_mysql权限控制实践

mysql在Windows上配置环境变量与启动服务

mysql如何在执行过程中优化SQL性能_mysql优化策略总结

mysql如何查看SQL是否走索引_mysql执行计划分析方法

相关标签:

mysql sql mysql count for select 堆线程 delete table

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：mysql函数可以返回多个值吗_mysql返回值解析下一篇：暂无

作者最新文章

mysql执行SQL时如何优化IO操作_mysql性能提升技巧

2026-02-24 09:41

mysql执行SQL时会缓存查询结果吗_mysql缓存机制解析

2026-02-24 09:47

CSS弹性盒子与层级关系_flex项目上的z-index表现规律

2026-02-24 09:48

CSS自动填充auto-fill_在容器宽度内自动创建网格列

2026-02-24 09:49

mysql如何查看SQL是否走索引_mysql执行计划分析方法

2026-02-24 09:50

CSS颜色文本阴影应用_text-shadow打造发光字效果

2026-02-24 09:51

360浏览器历史记录怎么查询_360浏览器访问痕迹查看方法

2026-02-24 09:51

CSS滚动触发动画基础_配合Intersection Observer的实践

2026-02-24 09:51

mysql如何在执行过程中优化SQL性能_mysql优化策略总结

2026-02-24 09:53

mysql在Windows上配置环境变量与启动服务

2026-02-24 09:56

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

AI 图片处理图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

1027

2023.10.12