讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题人工智能 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架人工智能 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 AI 提示词

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

0

0

C#读取损坏的ZIP文件 C#如何尝试恢复部分损坏的压缩包内容

煙雲

发布时间：2026-02-21 08:04:53

|

776人浏览过

|

来源于php中文网

原创

.net原生ziparchive严格校验zip结构，遇损坏即抛invaliddataexception或ioexception；推荐用sharpziplib的zipinputstream流式解析并跳过坏条目，或手动扫描0x504b0304魔数盲提数据。

c#读取损坏的zip文件 c#如何尝试恢复部分损坏的压缩包内容

损坏ZIP文件读取时直接抛出`InvalidDataException`或`IOException`

标准ZipArchive（来自System.IO.Compression）在遇到结构损坏（如中央目录偏移错乱、尾部签名缺失、局部文件头校验失败）时会立即终止，不提供“尽力读取”能力。这不是bug，而是设计使然——它默认要求ZIP格式严格合规。

实际中，损坏常表现为：能用7-Zip或WinRAR手动解压出部分文件，但C#代码完全失败。原因在于这些工具内置了启发式修复逻辑（跳过坏块、重扫描文件头、忽略CRC错误），而.NET原生类库没有。

不要依赖ZipFile.OpenRead()或new ZipArchive(stream)处理可疑文件——它们几乎必然崩溃
避免先用FileStream读整个文件再传入ZipArchive——内存浪费且无法控制解析流程
损坏位置影响极大：若损坏在中央目录（通常位于文件末尾），前面的文件条目可能完好；若损坏在开头，则大概率全盘不可读

用`SharpZipLib`启用容错模式逐项提取

SharpZipLib（v1.3+）支持ZipInputStream流式解析，并允许跳过单个损坏条目。关键不是“修复ZIP”，而是绕过坏扇区，尝试读取其余有效内容。

示例核心逻辑：

using (var input = File.OpenRead("corrupt.zip"))
using (var zipStream = new ZipInputStream(input))
{
    ZipEntry entry;
    while ((entry = zipStream.GetNextEntry()) != null)
    {
        try
        {
            if (!string.IsNullOrEmpty(entry.Name) && !entry.IsDirectory)
            {
                // 分配缓冲区，逐块读取，不依赖Length（损坏时可能为-1）
                using (var output = File.Create($"extracted/{entry.Name}"))
                {
                    byte[] buffer = new byte[4096];
                    int read;
                    while ((read = zipStream.Read(buffer, 0, buffer.Length)) > 0)
                    {
                        output.Write(buffer, 0, read);
                    }
                }
            }
        }
        catch (ZipException ex) when (ex.Message.Contains("CRC") || ex.Message.Contains("invalid"))
        {
            // CRC校验失败：该文件内容已损坏，跳过，继续下一个
            continue;
        }
        catch (IOException)
        {
            // 流提前结束：当前条目截断，放弃此文件
            continue;
        }
    }
}

必须用ZipInputStream而非ZipFile——前者是流式、可中断的；后者仍会尝试加载中央目录，易崩
GetNextEntry()本身可能抛异常（如中央目录损坏），需在外层try/catch包裹
不要信任entry.Size或entry.Crc——损坏ZIP中这些字段常为0或乱码，以实际读取字节数为准

手动定位并跳过损坏区域（适用于中央目录丢失场景）

当ZIP损坏导致ZipInputStream在GetNextEntry()阶段就失败（例如抛Unexpected end of stream），说明连第一个本地文件头都找不到。此时可尝试“盲扫”：从文件起始逐字节查找0x50 0x4B 0x03 0x04（ZIP本地文件头魔数）。

NotebookLM

NotebookLM

Google推出的AI笔记应用工具

下载

简化的扫描逻辑要点：

用BinaryReader配合BaseStream.Position遍历，每次读4字节比对
找到魔数后，解析后续12字节中的文件名长度、额外字段长度，跳转到文件数据起始位置
跳过CRC/压缩大小/未压缩大小等校验字段（直接设为0或占位值），仅按“文件名长度 + 额外字段长度 + 数据体”粗略提取
此法无法恢复文件名编码（可能乱码）、无目录结构、无法跳过加密文件——但能抢救出原始二进制内容

注意：这种扫描不保证100%准确，可能把普通数据误判为ZIP头，需结合文件头后字段合理性二次过滤（如文件名长度不能超65535）。

损坏程度决定恢复上限，别指望100%还原

真正严重的损坏（如ZIP头部被覆盖、多处CRC错、压缩算法标识损坏）会导致即使SharpZipLib也无法识别任何条目。此时唯一可行路径是：用xxd或十六进制编辑器人工定位疑似文件起始，按常见格式（PNG头89 50 4E 47、PDF头25 50 44 46）搜索并手动切割。

自动化脚本能做的极限是：在“中央目录损坏但局部文件头完好”的常见情况下，提取出前N个完好的文件。一旦损坏波及局部文件头本身（即每个文件开头的4字节魔数被破坏），所有库都无能为力。

所以，优先检查损坏ZIP是否还能被7-Zip的命令行7z x -y corrupt.zip部分解压——如果它能，SharpZipLib大概率也能；如果它也不能，C#里基本不用再试了。

相关文章

C#读写CSV文件 C#如何解析和生成CSV文件

C# MAUI文件系统访问 C#在MAUI中如何读取应用沙箱或用户文件

C# SignalR文件传输 C#如何利用SignalR实现客户端与服务器的文件交换

C#文件操作与IO调度器 C#文件IO行为如何受操作系统调度策略影响

C# 调试时查看并行任务 C# Visual Studio如何使用并行堆栈窗口

相关标签:

c# try catch FileStream position 算法 bug 自动化 winrar

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：C#限制上传文件大小 C#如何在服务端控制上传文件的大小下一篇：暂无

作者最新文章

浏览器网页打开是乱码怎么办切换网页编码格式教程【教程】

2026-02-19 13:49

悟空浏览器历史记录怎么删彻底清除搜索记录方法【攻略】

2026-02-19 14:00

PPT多张图片怎么做立体堆叠效果 PPT图片3D旋转排版方法【炫酷】

2026-02-19 14:09

Win10系统怎么永久关闭自动更新？教你彻底杜绝系统强制重启更新

2026-02-19 14:29

谷歌浏览器无法访问应用商店怎么办 Chrome离线安装插件方法【解决】

2026-02-19 14:34

Excel怎么制作甘特图 Excel项目进度管理图表制作方法【技巧】

2026-02-19 14:59

浏览器提示ERR_CONNECTION_RESET 解决重置连接错误【方法】

2026-02-19 16:00

Windows11更新怎么关？一劳永逸禁止Win11系统自动更新方案

2026-02-19 16:09

豆包AI生成思维导图教程，一句话理清所有思路

2026-02-19 16:28

Chrome浏览器如何分析网页性能瓶颈 F12 Performance面板使用【性能优化】

2026-02-19 16:48

热门AI工具

更多

DeepSeek

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

AI 图片处理图片拼接

ChatGPT

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

更多

CSS position定位有几种方式

CSS position定位有几种方式

有4种，分别是静态定位、相对定位、绝对定位和固定定位。更多关于CSS position定位有几种方式的内容，可以访问下面的文章。

83

2023.11.23

页面置换算法

页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章，大家可以免费体验。

459

2023.08.14

PHP 命令行脚本与自动化任务开发

PHP 命令行脚本与自动化任务开发

本专题系统讲解 PHP 在命令行环境（CLI）下的开发与应用，内容涵盖 PHP CLI 基础、参数解析、文件与目录操作、日志输出、异常处理，以及与 Linux 定时任务（Cron）的结合使用。通过实战示例，帮助开发者掌握使用 PHP 构建自动化脚本、批处理工具与后台任务程序的能力。

58

2025.12.13

pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式，涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明，帮助用户高效找到pixiv官方网站，实现便捷、安全的网页端浏览与账号登录体验。

776

2026.02.13

微博网页版主页入口与登录指南_官方网页端快速访问方法

微博网页版主页入口与登录指南_官方网页端快速访问方法

本专题系统整理微博网页版官方入口及网页端登录方式，涵盖首页直达地址、账号登录流程与常见访问问题说明，帮助用户快速找到微博官网主页，实现便捷、安全的网页端登录与内容浏览体验。

247

2026.02.13

Flutter跨平台开发与状态管理实战

Flutter跨平台开发与状态管理实战

本专题围绕Flutter框架展开，系统讲解跨平台UI构建原理与状态管理方案。内容涵盖Widget生命周期、路由管理、Provider与Bloc状态管理模式、网络请求封装及性能优化技巧。通过实战项目演示，帮助开发者构建流畅、可维护的跨平台移动应用。

141

2026.02.13

TypeScript工程化开发与Vite构建优化实践

TypeScript工程化开发与Vite构建优化实践

本专题面向前端开发者，深入讲解 TypeScript 类型系统与大型项目结构设计方法，并结合 Vite 构建工具优化前端工程化流程。内容包括模块化设计、类型声明管理、代码分割、热更新原理以及构建性能调优。通过完整项目示例，帮助开发者提升代码可维护性与开发效率。

24

2026.02.13

Redis高可用架构与分布式缓存实战

Redis高可用架构与分布式缓存实战

本专题围绕 Redis 在高并发系统中的应用展开，系统讲解主从复制、哨兵机制、Cluster 集群模式及数据分片原理。内容涵盖缓存穿透与雪崩解决方案、分布式锁实现、热点数据优化及持久化策略。通过真实业务场景演示，帮助开发者构建高可用、可扩展的分布式缓存系统。

69

2026.02.13

c语言数据类型

c语言数据类型

本专题整合了c语言数据类型相关内容，阅读专题下面的文章了解更多详细内容。

52

2026.02.12

热门下载

更多

网站特效

/

网站源码

/

网站素材

/

前端模板

相关下载

更多

php商城系统

淘源码商城PHP淘宝查信誉

PHP房产程序[BBWPS]

PHP简约自动发卡平台个人版

ERMEB域名PHP离线网络授权系统

Difeye-敏捷的轻量级PHP框架

大泉州汽车网PHP整站程序

精品课程

更多

相关推荐

/

热门推荐

/

最新课程

C# 教程

C# 教程

共94课时 | 9.9万人学习

C 教程

C 教程

共75课时 | 4.9万人学习

C++教程

C++教程

共115课时 | 18.7万人学习

最新文章

更多

C# 文件内容的命名实体链接 C#如何将文本中的实体链接到知识库(如维基百科)

C# 文件上传的CDN回源 C#如何配置CDN以便在缓存未命中时从源站拉取文件

C# Dbus文件传输 C#在Linux上如何通过D-Bus服务交换文件

C# 虚拟文件系统方法 C#如何使用IFileProvider抽象文件访问

C# 文件内容的风格迁移 C#如何将一个文件的写作风格应用到另一个文件

C#读写CSV文件 C#如何解析和生成CSV文件

C# MAUI文件系统访问 C#在MAUI中如何读取应用沙箱或用户文件

C# SignalR文件传输 C#如何利用SignalR实现客户端与服务器的文件交换

C#文件操作与IO调度器 C#文件IO行为如何受操作系统调度策略影响

C# 调试时查看并行任务 C# Visual Studio如何使用并行堆栈窗口

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部