如何用Python解析XML并存入SQLite数据库

月夜之吻

发布时间：2025-12-17 11:56:04

354人浏览过

来源于php中文网

原创

Python解析XML存入SQLite需三步：先用xml.etree.ElementTree分析结构并提取字段（区分.get()取属性与.text取文本），再转为字典列表；然后用sqlite3建表（注意字段类型匹配）；最后executemany()批量插入，兼顾安全与性能。

如何用python解析xml并存入sqlite数据库

用Python解析XML并存入SQLite数据库，核心是三步：读取XML、提取数据、插入SQLite。关键在于结构化处理——XML格式多变，需先理清标签层级和字段映射关系，再用标准库（xml.etree.ElementTree）安全解析，避免第三方依赖；SQLite用sqlite3原生支持，无需额外安装。

1. 分析XML结构，明确要存的字段

比如有如下简化XML（books.xml）：


  
    Python编程
    张三
    59.9
  
  
    数据结构
    李四
    45.5

目标字段是：id（属性）、title、author、price。注意id在book标签上，其余是子元素内容——解析时需区分.get()（取属性）和.text（取文本）。

2. 用ElementTree解析XML，转为Python字典列表

不建议直接逐节点拼SQL，先统一转成结构化数据更安全、易调试：

立即学习“Python免费学习笔记（深入）”；

Python v2.4 中文手册 chm

Python v2.4版chm格式的中文手册，内容丰富全面，不但是一本手册，你完全可以把她作为一本Python的入门教程，教你如何使用Python解释器、流程控制、数据结构、模板、输入和输出、错误和异常、类和标准库详解等方面的知识技巧。同时后附的手册可以方便你的查询。

下载

用ET.parse()加载文件，或ET.fromstring()加载字符串
用.findall("book")定位所有记录节点
对每个book，用.get("id")取属性，.find("title").text等取子元素值
加try/except防缺失字段（如某本书没），设默认值或跳过

示例代码片段：

import xml.etree.ElementTree as ET

tree = ET.parse("books.xml")
root = tree.getroot()

books = []
for book in root.findall("book"):
    books.append({
        "id": book.get("id"),
        "title": book.find("title").text if book.find("title") is not None else None,
        "author": book.find("author").text if book.find("author") is not None else None,
        "price": float(book.find("price").text) if book.find("price") is not None else None,
    })

3. 创建SQLite表并批量插入

表结构要匹配字段类型：id可设TEXT或INTEGER（若XML中全是数字），price用REAL，title/author用TEXT：

用sqlite3.connect()连数据库（文件不存在会自动创建）
cursor.execute()建表，注意加IF NOT EXISTS避免重复报错
用executemany()批量插入，比循环execute()快得多，且自动处理SQL注入（参数化）
别忘了conn.commit()和conn.close()

接上例：

import sqlite3

conn = sqlite3.connect("library.db")
cursor = conn.cursor()

cursor.execute("""
    CREATE TABLE IF NOT EXISTS books (
        id TEXT PRIMARY KEY,
        title TEXT,
        author TEXT,
        price REAL
    )
""")

cursor.executemany(
    "INSERT OR REPLACE INTO books (id, title, author, price) VALUES (?, ?, ?, ?)",
    [(b["id"], b["title"], b["author"], b["price"]) for b in books]
)

conn.commit()
conn.close()

4. 小心常见坑

编码问题：XML文件含中文时，确保用ET.parse("books.xml", parser=ET.XMLParser(encoding="utf-8"))显式指定编码。
空值与类型：XML中或空白标签会导致.text为None，转换float(None)会报错，务必提前判断。
特殊字符：ElementTree能自动处理&、等实体，不用手动解码。大数据量：若XML超大（百MB以上），改用iterparse()边读边处理，避免内存爆满。

Python Pandas如何将DataFrame导出为指定XML

XML序列化是什么如何将对象转换为XML字符串

Python怎么比较两个XML文件是否在逻辑上相等

如何对XML映射逻辑进行单元测试

在上传的XML文件中查找和替换内容 Java/Python脚本

相关标签:

python 编码大数据 app sql注入 python编程标准库 sql Integer Float if try xml 字符串循环 sqlite 数据库

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：在XML中，属性的顺序重要吗，解析器会保留原始顺序吗？下一篇：Python lxml objectify怎么让XML访问像对象属性一样简单

作者最新文章

AI模型微调(Fine-tuning)入门，让模型更符合你的业务需求

2026-01-31 13:21

常见的html编辑器有哪些软件各有什么优缺点

2026-01-31 13:49

B站4K视频播放卡顿？优化B站画质与流畅度的保姆级设置

2026-01-31 14:03

PPT怎么修改母版Logo PPT母版统一修改标志方法【技巧】

2026-01-31 14:21

2026查分数成绩查询入口查分数成绩查询入口中考

2026-01-31 14:46

AI帮你进行文献翻译和润色，告别机翻尴尬

2026-01-31 14:51

2026各省招办志愿填报系统入口 2026全国各省市高考志愿填报时间表

2026-01-31 14:53

Clawdbot抢票提示操作过快怎么办 Clawdbot频率调整避坑教程【干货】

2026-01-31 15:07

三角洲行动摸金模式入口危险行动玩法入口

2026-01-31 15:09

cad看图王极速版网页入口在线秒开CAD文件

2026-01-31 15:20

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

751

2023.10.12