sqlalchemy 如何写“批量插入忽略重复键”并返回插入数量

舞夢輝影

发布时间：2026-01-28 16:43:34

732人浏览过

来源于php中文网

原创

MySQL用INSERT IGNORE跳过唯一冲突行并返回实际插入数；PostgreSQL用ON CONFLICT DO NOTHING，需指定index_elements；跨库兼容可先查后插但非原子操作。

sqlalchemy 如何写“批量插入忽略重复键”并返回插入数量

MySQL 中用 `insert_ignore` 实现批量去重插入

MySQL 原生支持 INSERT IGNORE，SQLAlchemy 通过 Insert 构造配合 prefix_with("IGNORE") 可直接映射。关键点是：它跳过违反唯一约束（如主键、UNIQUE 索引）的行，不报错，且能拿到实际插入行数。

实操建议：

必须确保目标表已定义主键或唯一索引，否则 IGNORE 不生效
使用 session.execute() 而非 session.add_all()，后者无法触发 IGNORE 行为
插入后调用 result.rowcount 获取真正插入的记录数（不是“尝试插入”的数量）

from sqlalchemy import insert
stmt = insert(MyModel).prefix_with("IGNORE")
result = session.execute(stmt, [{"id": 1, "name": "a"}, {"id": 2, "name": "b"}, {"id": 1, "name": "c"}])
print(result.rowcount)  # 输出：2（id=1 的第二条被忽略）
session.commit()

PostgreSQL 中用 `ON CONFLICT DO NOTHING` 替代

PostgreSQL 没有 IGNORE，对应的是 ON CONFLICT 子句。SQLAlchemy 2.0+ 原生支持 on_conflict_do_nothing，需指定冲突目标（通常是主键或唯一索引字段）。

常见错误现象：

漏写 index_elements，导致 SQL 报错 there is no unique or exclusion constraint matching the ON CONFLICT specification
用错字段名（比如写了列名而非 Python 属性名），实际生成 SQL 时出错
在 SQLAlchemy 1.4 中强行用 2.0 语法，会抛 AttributeError

from sqlalchemy.dialects.postgresql import insert
stmt = insert(MyModel).on_conflict_do_nothing(index_elements=["id"])
result = session.execute(stmt, [{"id": 1, "name": "a"}, {"id": 2, "name": "b"}, {"id": 1, "name": "c"}])
print(result.rowcount)  # 输出：2
session.commit()

跨数据库兼容写法：先查后插（低并发适用）

如果必须兼容多种数据库，或业务要求严格控制“哪些被跳过”，可手动做存在性检查。但注意：这不是原子操作，高并发下仍可能重复插入。

Devin

世界上第一位AI软件工程师，可以独立完成各种开发任务。

下载

使用场景：

数据量小（
需要精确知道每条记录是否新增/跳过
目标库不支持 IGNORE 或 ON CONFLICT（如某些 SQLite 版本）

性能影响：N 条数据 → 至少 N 次查询 + 最多 N 次插入，远慢于原生批量忽略。

ids_to_insert = [1, 2, 3]
existing_ids = set(session.scalars(select(MyModel.id).where(MyModel.id.in_(ids_to_insert))).all())
new_records = [MyModel(id=i, name=f"item_{i}") for i in ids_to_insert if i not in existing_ids]
session.add_all(new_records)
session.flush()
print(len(new_records))  # 插入数量

返回插入数量时最容易忽略的细节

rowcount 在不同驱动和模式下行为不一致：

SQLite 的 pysqlite 驱动在 executemany 后可能返回 -1，必须用单条 execute + 手动构造多值 INSERT
MySQL 的 pymysql 和 mysqldb 通常返回正确值，但开启 autocommit=False 时需 commit() 后才稳定
PostgreSQL 的 psycopg2 在 ON CONFLICT 下返回准确值，但若用了 RETURNING 子句，rowcount 会失效，得用 result.fetchall() 数长度

复杂点在于：没有一个写法能在所有数据库、所有驱动、所有 SQLAlchemy 版本上 100% 返回可靠数字。最稳妥的做法是——明确你的目标数据库和驱动，然后选对应方案，别强求“一次写完到处跑”。

如何正确处理 MySQL 连接字符串中的特殊字符（如 @ 符号）

sqlalchemy 如何写“插入或更新”并返回受影响行数

sqlalchemy 如何写“存在则更新，不存在则插入”（upsert）

sqlalchemy 如何写批量插入或忽略（on conflict do nothing）

如何将本地文本文件内容插入 MySQL 数据表

相关标签:

mysql python session ai sql mysql Session 并发 postgresql 数据库

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：CPU steal 高但 vmware-tools 未安装的 guest OS 调度问题下一篇：pure-ftpd 虚拟用户 chroot 失败的 PureDB 权限与 ChrootEveryone

作者最新文章

Linux 网络延迟高的根因分析

2026-01-27 19:29

如何让一个类支持 len(obj) 但实际长度由外部计算

2026-01-27 19:33

slots 定义后还能使用 dict 吗？会发生什么异常

2026-01-27 19:33

MySQL query_cache_type 在 8.0 移除后的 Redis 缓存替代

2026-01-27 19:35

requests 如何实现带随机延时的重试避免被限流

2026-01-27 19:35

Python 可调用对象的类型判断

2026-01-27 19:40

SQL 如何用临时表 + 索引加速复杂多表关联聚合

2026-01-27 19:48

SQL 如何用 WITH 子句递归计算 BOM（物料清单）展开

2026-01-27 19:56

SQL 如何用 VACUUM / ANALYZE 手动维护 PostgreSQL 表统计

2026-01-27 19:58

mbti十六型人格分析图_mbti十六型人格分析图表解析

2026-01-28 09:47

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

727

2023.10.12