C#分割PDF文件 C#如何将一个多页PDF拆分成多个单页文件

幻夢星雲

发布时间：2026-03-04 09:39:21

644人浏览过

来源于php中文网

原创

最直接方法是用iTextSharp的PdfReader和PdfCopy：先用PdfReader读取源PDF，再用PdfCopy.AddPage配合GetImportedPage逐页导出。需注意资源释放、页码格式化、避免复用PdfCopy实例，并校验NumberOfPages和IsEncrypted等状态。

c#分割pdf文件 c#如何将一个多页pdf拆分成多个单页文件

用 iTextSharp 提取单页 PDF 文件最直接

iTextSharp 是 C# 生态里最成熟的免费 PDF 操作库（注意：v5.x 是免费的，v7+ 需商业授权），iTextSharp.text.pdf.PdfReader 和 iTextSharp.text.pdf.PdfCopy 配合就能稳定拆页。别用 System.Drawing 或硬解析二进制——PDF 不是图像，强行读字节会丢文字、矢量图和元数据。

常见错误现象：IOException: The process cannot access the file，往往是因为 PdfReader 未释放或输出流没关闭；还有人误用 PdfWriter.GetInstance 写单页，结果生成损坏文件——必须用 PdfCopy 复制页面结构。

确保 NuGet 安装的是 iTextSharp.LGPLv2.Core（.NET Core/.NET 5+ 兼容版）或经典 iTextSharp（.NET Framework）
PdfReader 构造后立即检查 NumberOfPages，避免空 PDF 导致循环越界
每生成一个单页文件，必须新建 PdfCopy 实例并调用 AddPage，不能复用同一个 PdfCopy 写多个文件

代码示例：按页码导出独立 PDF 文件

以下片段可直接运行，支持 .NET 6+，已处理异常和资源释放：

using iTextSharp.text.pdf;
using System.IO;
<p>string inputPdf = @"C:\docs\multi.pdf";
using var reader = new PdfReader(inputPdf);</p><p>for (int i = 1; i <= reader.NumberOfPages; i++)
{
string outputPdf = $@"C:\docs\page_{i:D3}.pdf";
using var fs = new FileStream(outputPdf, FileMode.Create);
using var doc = new Document();
using var copy = new PdfCopy(doc, fs);</p><pre class="brush:php;toolbar:false;">doc.Open();
copy.AddPage(copy.GetImportedPage(reader, i));
doc.Close();

}

关键点：copy.GetImportedPage(reader, i) 是核心，它把原 PDF 第 i 页完整导入新文档；D3 格式化页码防止文件名顺序错乱（如 page_1.pdf 排在 page_10.pdf 前面）。

探迹

探迹AI销售智能体平台

下载

用 PdfPig 替代 iTextSharp（.NET Core 原生首选）

如果项目禁用 LGPL 库或需纯 .NET Standard 支持，PdfPig 是更现代的选择——MIT 协议、无依赖、支持读取但不支持写入 PDF。等等，那怎么拆页？答案是：只读 + 外部工具生成。实际流程是：PdfPig 解析页数 → 用 Ghostscript 命令行按页提取。

PdfPig 仅用于探测页数和元信息，避免自己解析 PDF 结构
执行命令：gswin64c -sDEVICE=pdfwrite -dNOPAUSE -dQUIET -dFIRSTPAGE={i} -dLASTPAGE={i} -sOutputFile=page_{i}.pdf input.pdf
注意 Windows 上 Ghostscript 路径需加入环境变量，否则 Process.Start 找不到命令

性能与大文件注意事项

拆 100 页 PDF 时，iTextSharp 方式内存占用约 2–3 倍原文档大小——因为每页都要加载字体、资源字典等。容易被忽略的点：

不要在循环内反复 new PdfReader，它很重；一个实例复用即可
若源 PDF 含加密（reader.IsEncrypted 为 true），需传密码构造 PdfReader(input, password)，否则 GetImportedPage 抛 BadPasswordException
含 XFA 表单或 AcroForm 的 PDF，iTextSharp v5 可能丢失交互逻辑，这种场景建议先用 Adobe Acrobat「打印为 PDF」扁平化再拆

真正麻烦的不是拆页本身，而是 PDF 的隐式结构差异：线性化 PDF、增量更新、对象流压缩……这些都会让“看似简单”的一页变成需要解压、重组、重映射的完整子文档。所以别省事跳过 PdfReader 初始化校验。

C# 生成PDF文件方法 C#如何使用QuestPDF或iTextSharp创建PDF

C# 内存流使用方法 C#如何使用MemoryStream

C#将HTML保存为PDF C#如何把HTML内容转换成PDF文件

C# 验证PDF签名 C#如何检查PDF文件中的数字签名是否有效

C#读取PDF文本 C#如何提取PDF文件中的文字内容

相关专题

点击input框没有光标怎么办

点击input框没有光标的解决办法：1、确认输入框焦点；2、清除浏览器缓存；3、更新浏览器；4、使用JavaScript；5、检查硬件设备；6、检查输入框属性；7、调试JavaScript代码；8、检查页面其他元素；9、考虑浏览器兼容性。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

196

2023.11.24

windows查看端口占用情况

Windows端口可以认为是计算机与外界通讯交流的出入口。逻辑意义上的端口一般是指TCP/IP协议中的端口，端口号的范围从0到65535，比如用于浏览网页服务的80端口，用于FTP服务的21端口等等。怎么查看windows端口占用情况呢？php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

1381

2023.07.26

查看端口占用情况windows

端口占用是指与端口关联的软件占用端口而使得其他应用程序无法使用这些端口，端口占用问题是计算机系统编程领域的一个常见问题，端口占用的根本原因可能是操作系统的一些错误，服务器也可能会出现端口占用问题。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

1159

2023.07.27

windows照片无法显示

当我们尝试打开一张图片时，可能会出现一个错误提示，提示说"Windows照片查看器无法显示此图片，因为计算机上的可用内存不足"，本专题为大家提供windows照片无法显示相关的文章，帮助大家解决该问题。

829

2023.08.01

windows查看端口被占用的情况

windows查看端口被占用的情况的方法：1、使用Windows自带的资源监视器；2、使用命令提示符查看端口信息；3、使用任务管理器查看占用端口的进程。本专题为大家提供windows查看端口被占用的情况的相关的文章、下载、课程内容，供大家免费下载体验。

460

2023.08.02

windows无法访问共享电脑

在现代社会中，共享电脑是办公室和家庭的重要组成部分。然而，有时我们可能会遇到Windows无法访问共享电脑的问题。这个问题可能会导致数据无法共享，影响工作和生活的正常进行。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

2361

2023.08.08

windows自动更新

Windows操作系统的自动更新功能可以确保系统及时获取最新的补丁和安全更新，以提高系统的稳定性和安全性。然而，有时候我们可能希望暂时或永久地关闭Windows的自动更新功能。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

854

2023.08.10

windows boot manager

windows boot manager无法开机的解决方法：1、系统文件损坏，使用Windows安装光盘或USB启动盘进入恢复环境，选择修复计算机，然后选择自动修复；2、引导顺序错误，进入恢复环境，选择命令提示符，输入命令"bootrec /fixboot"和"bootrec /fixmbr"，然后重新启动计算机；3、硬件问题，使用硬盘检测工具进行扫描和修复；4、重装操作系统。本专题还提供其他解决

1944

2023.08.28