0

0

OpenXML SDK怎么用 C#操作Word(docx)的XML

月夜之吻

月夜之吻

发布时间:2026-01-13 09:49:49

|

994人浏览过

|

来源于php中文网

原创

open xml sdk 是微软官方 .net 类库,用于直接读写 office open xml 文件(如 .docx),不依赖 word 应用程序;通过强类型对象模型(如 document、paragraph)操作内容,自动处理 xml 序列化与包结构;需安装 documentformat.openxml nuget 包,创建文档须手动添加 maindocumentpart 并初始化 document 根元素;插入文本需按 body→paragraph→run→text 层级构建对象树后 append;修改现有文档可遍历 text 元素赋值;直触 xml 时须注意命名空间和流操作规范;每次操作后须调用 close() 或使用 using 确保资源释放。

openxml sdk怎么用 c#操作word(docx)的xml

Open XML SDK 是微软提供的用于操作 Office Open XML 文件(如 .docx、.xlsx、.pptx)的官方 .NET 类库。它不依赖 Word 应用程序,而是直接读写底层 ZIP 封装内的 XML 内容,性能高、可控性强。用 C# 操作 Word 文档的 XML,本质是通过 SDK 提供的强类型对象模型(如 DocumentParagraphRun 等)来增删改查内容,SDK 自动处理底层 XML 序列化与包结构(如 document.xml、rels、styles.xml 等)。

安装 Open XML SDK 并创建基础文档

在项目中安装 NuGet 包:DocumentFormat.OpenXml(最新稳定版,如 3.0+)。注意:.NET 6/7/8 项目推荐使用该包;旧版 OpenXML SDK 2.5 已停止更新,且需额外安装运行时。

  • 新建空白 .docx:用 WordprocessingDocument.Create() 创建新文件,指定 WordprocessingDocumentType.Document
  • 必须手动添加主文档部件(MainDocumentPart),再通过 AddMainDocumentPart() 获取引用
  • 调用 MainDocumentPart.Document = new Document() 初始化根元素,否则后续操作会抛异常

向文档插入文本与段落

所有内容都封装在 BodyParagraphRunText 的层级中。SDK 不直接编辑原始 XML 字符串,而是构建对象树后保存。

Pinokio
Pinokio

Pinokio是一款开源的AI浏览器,可以安装运行各种AI模型和应用

下载
  • 获取 Body:通过 mainPart.Document.Body ??= new Body() 确保存在
  • 新建段落:var para = new Paragraph(new Run(new Text("Hello, World!")))
  • 追加到文档:body.Append(para)(注意不是 AppendChild,这是常见误区)
  • 支持格式:可在 Run 中添加 RunProperties 设置字体、加粗、颜色等

读取并修改现有文档中的文本

打开已有 .docx 时用 WordprocessingDocument.Open(path, isEditable: true)。读取文本需遍历 ParagraphText 元素。

  • 获取所有文本节点:doc.MainDocumentPart.Document.Body.Descendants<text>()</text>
  • 修改内容:textNode.Text = "New content"(直接赋值即可,SDK 会在 Save() 时同步)
  • 注意:不要直接修改 InnerText 或手动拼接 XML 字符串——这会破坏命名空间和结构,SDK 会忽略或报错
  • 若需定位特定段落(如含某关键词),可用 LINQ 配合 InnerTextGetText() 辅助方法

访问底层 XML 进行高级定制

虽然 SDK 推荐使用对象模型,但某些场景(如插入自定义 XML 部件、修改页眉页脚复杂结构、调试)需要直触 XML。

  • 获取原始 XML 字符串:mainPart.GetStream().ReadAllText()(仅用于查看,不可直接修改后写回)
  • 安全方式:用 mainPart.Document.Save(mainPart.GetStream()) 保存对象树;若需注入自定义 XML 片段,应通过 OuterXml 属性或 XmlDocument 加载后插入节点(需严格匹配命名空间)
  • 常用命名空间前缀:w:wordprocessingML)、r:(relationships)、mc:(markup compatibility)——SDK 对象已自动处理,手动操作 XML 时必须显式声明

不复杂但容易忽略:每次修改后必须调用 document.Close() 或使用 using 语句释放资源,否则文件可能被锁住或内容未写入磁盘。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
pdf怎么转换成xml格式
pdf怎么转换成xml格式

将 pdf 转换为 xml 的方法:1. 使用在线转换器;2. 使用桌面软件(如 adobe acrobat、itext);3. 使用命令行工具(如 pdftoxml)。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1937

2024.04.01

xml怎么变成word
xml怎么变成word

步骤:1. 导入 xml 文件;2. 选择 xml 结构;3. 映射 xml 元素到 word 元素;4. 生成 word 文档。提示:确保 xml 文件结构良好,并预览 word 文档以验证转换是否成功。想了解更多xml的相关内容,可以阅读本专题下面的文章。

2116

2024.08.01

xml是什么格式的文件
xml是什么格式的文件

xml是一种纯文本格式的文件。xml指的是可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。想了解更多相关的内容,可阅读本专题下面的相关文章。

1142

2024.11.28

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

658

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

219

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1560

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

645

2023.11.24

java读取文件转成字符串的方法
java读取文件转成字符串的方法

Java8引入了新的文件I/O API,使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java,可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中,你需要将文件路径替换为你的实际文件路径,并且可能需要处理可能的IOException异常。想了解更多java的相关内容,可以阅读本专题下面的文章。

1108

2024.03.22

Golang 测试体系与代码质量保障:工程级可靠性建设
Golang 测试体系与代码质量保障:工程级可靠性建设

Go语言测试体系与代码质量保障聚焦于构建工程级可靠性系统。本专题深入解析Go的测试工具链(如go test)、单元测试、集成测试及端到端测试实践,结合代码覆盖率分析、静态代码扫描(如go vet)和动态分析工具,建立全链路质量监控机制。通过自动化测试框架、持续集成(CI)流水线配置及代码审查规范,实现测试用例管理、缺陷追踪与质量门禁控制,确保代码健壮性与可维护性,为高可靠性工程系统提供质量保障。

43

2026.02.28

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
HTML5/CSS3/JavaScript/ES6入门课程
HTML5/CSS3/JavaScript/ES6入门课程

共102课时 | 7.2万人学习

前端基础到实战(HTML5+CSS3+ES6+NPM)
前端基础到实战(HTML5+CSS3+ES6+NPM)

共162课时 | 21万人学习

第二十二期_前端开发
第二十二期_前端开发

共119课时 | 13.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号