C# 如何从一个大的xml流中分块读取数据

煙雲

发布时间：2025-10-31 12:01:08

347人浏览过

来源于php中文网

原创

使用XmlReader流式读取大XML文件可避免内存溢出，通过ReadSubtree()逐个处理Order节点，结合XmlSerializer反序列化为对象，实现高效低耗的数据提取与处理。

c# 如何从一个大的xml流中分块读取数据

在处理大型 XML 文件时，直接加载整个文档到内存中会导致性能问题甚至内存溢出。C# 提供了 XmlReader 类，支持以流式方式高效读取大 XML 文件，无需一次性加载全部内容。通过分块读取特定节点，可以有效控制内存使用。

使用 XmlReader 流式读取 XML 数据块

XmlReader 采用只进、只读的方式解析 XML，非常适合处理大文件。你可以按需提取某个父节点下的数据块，逐个处理。

示例：从一个包含多个 Order 节点的大 XML 文件中分块读取

假设 XML 结构如下：

<Orders>
  <Order Id="1">
    <Item>Apple</Item>
    <Qty>10</Qty>
  </Order>
  <Order Id="2">
    <Item>Banana</Item>
    <Qty>5</Qty>
  </Order>
  ...
</Orders>

使用以下代码逐个读取每个 Order 节点：

using (var reader = XmlReader.Create("large.xml"))
{
    while (reader.Read())
    {
        if (reader.IsStartElement("Order"))
        {
            // 读取当前节点的完整子树
            using (var subtree = reader.ReadSubtree())
            {
                var orderDoc = new XmlDocument();
                orderDoc.Load(subtree);
                // 处理单个 Order 节点（例如序列化、转换或保存）
                ProcessOrder(orderDoc.DocumentElement);
            }
        }
    }
}

关键点：

ReadSubtree()：捕获当前节点及其所有子节点，生成独立的可读子流。
每次只加载一个 Order 节点，内存占用恒定。
XmlDocument 仅用于处理当前块，可替换为更轻量的对象映射（如反序列化到类）。

跳过不关心的数据以提升性能

XmlReader 允许快速跳过不需要的节点，避免不必要的解析开销。

ImgGood

免费在线AI照片编辑器

下载

如果只想读取特定条件的节点（如 Id > 100），可在判断后调用 reader.Skip() 跳过整个节点树。

if (reader.IsStartElement("Order"))
{
    string id = reader["Id"];
    if (int.TryParse(id, out int orderId) && orderId <= 100)
    {
        reader.Skip(); // 直接跳过该节点
    }
    else
    {
        using (var subtree = reader.ReadSubtree())
        {
            // 只处理符合条件的节点
        }
    }
}

结合流式反序列化提高效率

如果你的数据结构固定，可定义对应的 C# 类，并使用 XmlSerializer 直接反序列化子树。

public class Order
{
    [XmlAttribute("Id")]
    public int Id { get; set; }
    public string Item { get; set; }
    public int Qty { get; set; }
}

在读取时直接反序列化：

if (reader.IsStartElement("Order"))
{
    var serializer = new XmlSerializer(typeof(Order));
    var order = (Order)serializer.Deserialize(reader);
    ProcessOrder(order); // 处理对象
}

这种方式更简洁，且避免创建 XmlDocument 对象，进一步降低开销。

基本上就这些。使用 XmlReader 配合 ReadSubtree 或反序列化，能高效地从大 XML 流中分块提取数据，保持低内存占用和良好性能。

C#怎么给DataGridView添加复选框_C#如何实现多选功能【代码】

C#怎么实现文本的自动换行显示_C#如何设置Label显示模式【示例】

C# 文件上传的重试风暴 C#如何避免因失败重试导致的服务雪崩

C#怎么防止SQL注入攻击_C#如何使用参数化查询数据【技巧】

C#怎么实现窗口的自动缩放适配_C#如何调整控件Anchor属性【技巧】

相关标签:

c# apple 内存占用 xml 数据结构对象

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：C# 在Unity中如何读写xml配置文件下一篇：.NET怎么判断一个文件或文件夹是否存在_文件文件夹存在判断方法

作者最新文章

XML Schema xs:key与keyref XSD中定义主键和外键约束

2026-03-13 11:47

增值税发票真伪查询系统官网入口全国发票查验平台唯一入口

2026-03-13 11:55

Dapper中怎么显式指定参数类型 Dapper DbType设置方法

2026-03-13 12:15

Julia语言如何实现HTTP文件上传 HTTP.jl库

2026-03-13 12:32

Postman怎么发送XML格式的请求 Postman教程

2026-03-13 12:32

PS如何使用蒙版修改图片？Photoshop蒙版工具全方位深度解析

2026-03-13 12:53

Android arrays.xml字符串数组资源文件中定义列表数据

2026-03-13 13:03

钉钉脑图支持什么格式导入钉钉思维导图格式要求【百科】

2026-03-13 13:12

C# TPL Dataflow使用方法 C#如何构建数据流处理管道

2026-03-13 13:26

XML文件转YAML Java SnakeYAML库转换XML配置

2026-03-13 13:44

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

pdf怎么转换成xml格式

将 pdf 转换为 xml 的方法：1. 使用在线转换器；2. 使用桌面软件（如 adobe acrobat、itext）；3. 使用命令行工具（如 pdftoxml）。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

1949

2024.04.01

xml怎么变成word

步骤：1. 导入 xml 文件；2. 选择 xml 结构；3. 映射 xml 元素到 word 元素；4. 生成 word 文档。提示：确保 xml 文件结构良好，并预览 word 文档以验证转换是否成功。想了解更多xml的相关内容，可以阅读本专题下面的文章。

2119

2024.08.01

xml是什么格式的文件

xml是一种纯文本格式的文件。xml指的是可扩展标记语言，标准通用标记语言的子集，是一种用于标记电子文件使其具有结构性的标记语言。想了解更多相关的内容，可阅读本专题下面的相关文章。

1172

2024.11.28

treenode的用法

在计算机编程领域，TreeNode是一种常见的数据结构，通常用于构建树形结构。在不同的编程语言中，TreeNode可能有不同的实现方式和用法，通常用于表示树的节点信息。更多关于treenode相关问题详情请看本专题下面的文章。php中文网欢迎大家前来学习。

550

2023.12.01

C++ 高效算法与数据结构

本专题讲解 C++ 中常用算法与数据结构的实现与优化，涵盖排序算法（快速排序、归并排序）、查找算法、图算法、动态规划、贪心算法等，并结合实际案例分析如何选择最优算法来提高程序效率。通过深入理解数据结构（链表、树、堆、哈希表等），帮助开发者提升在复杂应用中的算法设计与性能优化能力。

2025.12.22

深入理解算法：高效算法与数据结构专题

本专题专注于算法与数据结构的核心概念，适合想深入理解并提升编程能力的开发者。专题内容包括常见数据结构的实现与应用，如数组、链表、栈、队列、哈希表、树、图等；以及高效的排序算法、搜索算法、动态规划等经典算法。通过详细的讲解与复杂度分析，帮助开发者不仅能熟练运用这些基础知识，还能在实际编程中优化性能，提高代码的执行效率。本专题适合准备面试的开发者，也适合希望提高算法思维的编程爱好者。

2026.01.06

TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开，深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析，帮助开发者构建类型安全、结构清晰、易维护的前端工程体系，提高团队协作效率与代码质量。

2026.03.13

Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开，深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例，帮助开发者掌握 Python 在高并发场景中的高效开发方法，并提升系统资源利用率与整体运行性能。

2026.03.12

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

234

2026.03.11

热门下载

网站特效

网站源码

网站素材

前端模板