SQL 如何批量插入百万级数据不卡死事务（分批 + 临时表）

舞夢輝影

发布时间：2026-01-29 17:30:10

681人浏览过

来源于php中文网

原创

直接 INSERT ... VALUES (...) 卡死因解析大语句、锁表、预分配日志致内存/WAL爆；应改用临时表+分批INSERT SELECT，每批5000–10000行、独立事务、主键范围切片。

sql 如何批量插入百万级数据不卡死事务（分批 + 临时表）

为什么直接 INSERT ... VALUES (...) 会卡死？

因为单条 INSERT 带上百万行值，SQL 解析器要先完整解析整个语句、构建执行计划、锁住目标表、预分配事务日志空间——还没开始写数据，内存和日志就可能爆了。MySQL 甚至会直接报 Packet too large 或 Out of memory；PostgreSQL 可能卡在 WAL 写入阶段；SQL Server 容易触发锁升级成表锁。

单次插入超 1000 行值，性能断崖式下降
事务日志（WAL / LDF）膨胀严重，尤其在 FULL 恢复模式下
主从延迟陡增，binlog 写入成为瓶颈
锁持有时间过长，阻塞其他读写请求

用临时表 + 分批 INSERT 的实操要点

核心思路是：把原始数据先灌进一个本地临时表（CREATE TEMPORARY TABLE），再按 5000–10000 行一批，用 INSERT INTO ... SELECT 拆着写进目标表。这样避免大 SQL 解析，也控制事务粒度。

临时表必须与目标表结构一致（含索引、约束可省略，但字段类型、NULL 性、字符集要对齐）
分批时用 LIMIT + OFFSET 不推荐（深度分页慢），改用主键/自增 ID 范围切片，例如：WHERE id BETWEEN ? AND ?
每批单独开启事务（BEGIN; INSERT ...; COMMIT;），别包在一个大事务里
MySQL 下可加 INSERT IGNORE 或 ON DUPLICATE KEY UPDATE 避免唯一冲突中断流程

不同数据库的分批写法差异

语法细节决定成败。比如 PostgreSQL 没有 LIMIT 在子查询里的限制，但 MySQL 8.0+ 才支持 INSERT ... SELECT 带 LIMIT；SQL Server 要用 TOP 和 OFFSET/FETCH 组合。

千音漫语

全能AI配音神器

下载

MySQL：INSERT INTO target SELECT * FROM temp_table WHERE id >= 10000 AND id
PostgreSQL：INSERT INTO target SELECT * FROM temp_table ORDER BY id LIMIT 10000 OFFSET 20000;
SQL Server：INSERT INTO target SELECT * FROM temp_table ORDER BY id OFFSET 20000 ROWS FETCH NEXT 10000 ROWS ONLY;
所有数据库都建议关闭自动提交（SET autocommit = 0），手动 COMMIT 控制时机

容易被忽略的三个性能开关

光分批还不够，不调底层参数，照样慢得像在等编译完成。

禁用目标表非必要索引：批量导入前 DROP INDEX，导入完重建（尤其是唯一索引、全文索引）
调整日志刷盘策略：MySQL 设 innodb_flush_log_at_trx_commit = 2（仅限导入期间）；PostgreSQL 临时设 synchronous_commit = off
增大事务日志缓冲：MySQL 调 innodb_log_file_size，SQL Server 扩 ldf 文件，避免频繁日志切换

临时表本身不走 WAL（多数引擎），但目标表的每次 INSERT 仍记日志——所以分批大小不是越小越好，5000～10000 是兼顾吞吐与回滚成本的经验平衡点。

VARCHAR(n) 与 TEXT 在 MySQL 中的性能与存储区别

SQL 如何高效查询 JSON 数组中任意元素包含某值的记录

如何用 FORCE INDEX / INDEX HINT 强制走指定索引的时机

CTE 递归查询深度过大导致栈溢出的 max_recursion 设置

SQL 如何用 SUBSTRING_INDEX / SPLIT_PART 拆分逗号分隔字段

相关标签:

mysql 为什么 sql mysql NULL select 切片 table postgresql 数据库

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：SQL 如何实现“游标分页”（keyset pagination）避免深分页慢下一篇：SQL 如何实现“增量同步”基于时间戳或版本号的方案

作者最新文章

iSCSI session 频繁 logout/login 的 timeout / MPIO / queue_depth 配置

2026-01-29 12:00

Apple 在港正式推出新代 AirTag 物品追蹤工具！卖 $249 更强精準寻找，一图分清较前代有何改进

2026-01-29 12:06

DeepSeek提示词设计 DeepSeek提示词创意设计方法

2026-01-29 12:38

大量残留 netns 的 ip netns list | xargs -n1 ip netns delete 脚本

2026-01-29 13:54

Chrome 浏览器官方下载入口在哪？Chrome 浏览器官方下载入口中文

2026-01-29 13:54

window如何本地部署Clawdbot windows安装Clawdbot指南

2026-01-29 14:00

手把手教你使用 Clawdbot 部署telegram助手

2026-01-29 14:04

豆包网页版入口直达步骤豆包网页版怎么用

2026-01-29 14:11

nftables 规则加载成功但流量不匹配的 hook / priority 问题

2026-01-29 14:15

nft list ruleset 不显示新规则的 table / chain / priority 冲突

2026-01-29 14:26

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

728

2023.10.12