0

0

如何将CSV数据批量导入数据库_LOAD DATA INFILE与并行导入

P粉602998670

P粉602998670

发布时间:2026-03-12 17:59:02

|

256人浏览过

|

来源于php中文网

原创

LOAD DATA INFILE 无法导入本地文件是因为MySQL服务端未启用local_infile=ON且客户端未显式允许;需修改my.cnf并重启服务,连接时加--local-infile=1或pymysql中设local_infile=True。

如何将csv数据批量导入数据库_load data infile与并行导入

LOAD DATA INFILE 为什么导入不了本地文件?

MySQL 默认禁用 LOAD DATA INFILE 读取客户端本地路径,报错通常是 ERROR 1148 (42000): The used command is not allowed with this MySQL configuration 或直接提示文件不存在——哪怕文件明明在你电脑上。

根本原因不是权限不够,而是服务端配置没开:MySQL 服务端必须启用 local_infile=ON,且客户端连接时也要显式允许。光改 my.cnf 不够,还要确认连接参数。

  • 服务端:在 /etc/mysql/my.cnf(Linux)或 my.ini(Windows)的 [mysqld] 段加 local_infile=ON,然后重启 mysqld
  • 客户端:用 mysql --local-infile=1 -u root -p 连接;如果用 Python 的 pymysql,初始化连接时要加 local_infile=True
  • 安全限制:某些托管数据库(如阿里云 RDS、AWS RDS)默认禁用且不可修改,此时 LOAD DATA INFILE 直接不可用

CSV 字段乱码、截断、NULL 值识别失败

看似是数据问题,其实是字段分隔符、行结束符和 NULL 处理策略不匹配导致的。MySQL 不会自动猜编码或空值格式,所有解析行为都由 LOAD DATA INFILE 的子句严格控制。

常见现象:中文变问号、最后一列总少一位、数字字段出现 NULL 却被当成字符串 "NULL"

  • 编码必须显式指定:CHARACTER SET utf8mb4(别用 utf8,它不支持 emoji)
  • 字段分隔符默认是 \t,不是逗号!要导 CSV 必须写 FIELDS TERMINATED BY ','
  • 文本包裹符很关键:如果 CSV 有逗号在引号内(如 "Smith, John",25),必须加 OPTIONALLY ENCLOSED BY '"'
  • 空字符串转 NULL:加 SET col_name = NULLIF(col_name, ''),否则空字符串会被存成 '' 而非 NULL

并行导入 ≠ 同时跑多个 LOAD DATA INFILE

MySQL 的 LOAD DATA INFILE 是表级锁(InnoDB 下为意向排他锁 + 行锁),并发执行多个会排队,甚至因锁等待超时失败。所谓“并行”,实际是指把大 CSV 拆成小块,再用不同连接、不同目标表(或分区)分散处理。

Sora
Sora

Sora是OpenAI发布的一种文生视频AI大模型,可以根据文本指令创建现实和富有想象力的场景。

下载

真正在用的方案只有两种:预分片 + 多连接,或先入库临时表再合并。

  • 拆文件:用 split -l 100000 data.csv chunk_ 分割,再用 shell 循环启动多个 mysql 进程,各自导入不同 chunk 到同一张表(注意:需确保表无唯一键冲突)
  • 多表中转:建若干临时表(如 tmp_import_1, tmp_import_2),分别导入,再用 INSERT INTO main_table SELECT * FROM tmp_import_1 等语句合并
  • 跳过索引加速:导入前执行 ALTER TABLE t DISABLE KEYS,导入完再 ENABLE KEYS(仅对 MyISAM 有效;InnoDB 请关掉唯一约束校验或用 SET unique_checks=0

替代方案比硬刚 LOAD DATA INFILE 更省心

当遇到云数据库限制、字段逻辑复杂(比如需要清洗、映射、关联查证)、或导入频率高需自动化时,LOAD DATA INFILE 反而成为瓶颈。这时候直接走应用层批量插入更可控。

例如 Python + pymysql:用 executemany() 批量提交,配合 cursor.executemany("INSERT INTO t VALUES (%s,%s)", rows),每批 1000–5000 行,比单条快 10–50 倍;若再加 INSERT IGNOREON DUPLICATE KEY UPDATE,还能天然防重。

  • 不要低估网络开销:千兆内网下,纯 SQL 导入 100 万行约 3–8 秒;Python 批量插入约 10–20 秒,但可嵌入清洗逻辑、日志、重试、监控
  • PostgreSQL 用户注意:COPY 命令性能接近 MySQL 的 LOAD DATA,但它也要求服务端文件路径或启用 client_encoding 显式设为 UTF8
  • 真正的大数据量(千万级以上):别卡在单机导入,考虑用 mysqldump --tab 输出 + LOAD DATA 配合,或迁移到 ClickHouse / Doris 做前置 ETL

最常被忽略的一点:CSV 文件本身是否真正合规——有没有隐藏的 BOM 头、混合换行符(\r\n\n 并存)、Excel 自动加的双引号逃逸错误。这些都会让 LOAD DATA INFILE 在第 8372 行突然失败,且报错信息完全不提具体哪一行。建议先导一份前 100 行做验证。

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
数据分析工具有哪些
数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍:1、Excel,具有强大的计算和数据处理功能;2、SQL,可以进行数据查询、过滤、排序、聚合等操作;3、Python,拥有丰富的数据分析库;4、R,拥有丰富的统计分析库和图形库;5、Tableau,提供了直观易用的用户界面等等。

1133

2023.10.12

SQL中distinct的用法
SQL中distinct的用法

SQL中distinct的语法是“SELECT DISTINCT column1, column2,...,FROM table_name;”。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

340

2023.10.27

SQL中months_between使用方法
SQL中months_between使用方法

在SQL中,MONTHS_BETWEEN 是一个常见的函数,用于计算两个日期之间的月份差。想了解更多SQL的相关内容,可以阅读本专题下面的文章。

381

2024.02.23

SQL出现5120错误解决方法
SQL出现5120错误解决方法

SQL Server错误5120是由于没有足够的权限来访问或操作指定的数据库或文件引起的。想了解更多sql错误的相关内容,可以阅读本专题下面的文章。

2174

2024.03.06

sql procedure语法错误解决方法
sql procedure语法错误解决方法

sql procedure语法错误解决办法:1、仔细检查错误消息;2、检查语法规则;3、检查括号和引号;4、检查变量和参数;5、检查关键字和函数;6、逐步调试;7、参考文档和示例。想了解更多语法错误的相关内容,可以阅读本专题下面的文章。

380

2024.03.06

oracle数据库运行sql方法
oracle数据库运行sql方法

运行sql步骤包括:打开sql plus工具并连接到数据库。在提示符下输入sql语句。按enter键运行该语句。查看结果,错误消息或退出sql plus。想了解更多oracle数据库的相关内容,可以阅读本专题下面的文章。

1683

2024.04.07

sql中where的含义
sql中where的含义

sql中where子句用于从表中过滤数据,它基于指定条件选择特定的行。想了解更多where的相关内容,可以阅读本专题下面的文章。

585

2024.04.29

sql中删除表的语句是什么
sql中删除表的语句是什么

sql中用于删除表的语句是drop table。语法为drop table table_name;该语句将永久删除指定表的表和数据。想了解更多sql的相关内容,可以阅读本专题下面的文章。

440

2024.04.29

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

76

2026.03.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号