0

0

如何使用Java实现文件压缩与解压_JavaIO综合项目讲解

P粉602998670

P粉602998670

发布时间:2026-01-17 10:04:39

|

304人浏览过

|

来源于php中文网

原创

java.util.zip可完成zip压缩解压但需手动处理流、编码、目录结构和中文路径;压缩时路径须标准化、递归处理目录、正确调用putnextentry/closeentry;解压需防路径穿越、校验合法性;中文名需统一utf-8或按需fallback gbk;jar类仅适用于java应用打包。

如何使用java实现文件压缩与解压_javaio综合项目讲解

Java 标准库的 java.util.zip 包能完成基础 ZIP 压缩与解压,无需第三方依赖,但必须手动处理流、编码、目录结构和中文路径问题——多数失败都卡在这四点上。

ZipOutputStream 压缩多个文件或目录

核心是把每个条目(ZipEntry)写入输出流,注意路径标准化和文件内容读取顺序:

  • ZipEntryname 必须用正斜杠 / 分隔,不能含盘符或开头的 /(如 "docs/readme.txt" 合法,"C:\docs\readme.txt""/docs/readme.txt" 会出错)
  • 压缩目录时需递归遍历,对子目录也创建一个带结尾 /ZipEntry(如 "images/"),否则解压后目录丢失
  • 写入文件内容前必须先调用 putNextEntry(),且每个 entry 只能写一次;写完要调用 closeEntry()
  • 若源文件含中文名,ZipOutputStream 默认使用 IBM437 编码,Windows 下需改用 ZipOutputStream(OutputStream, Charset.forName("GBK"))(JDK 7+ 支持)
try (ZipOutputStream zos = new ZipOutputStream(new FileOutputStream("out.zip"), StandardCharsets.UTF_8)) {
    addFileToZip(zos, Paths.get("src"), "");
} catch (IOException e) {
    e.printStackTrace();
}

void addFileToZip(ZipOutputStream zos, Path file, String prefix) throws IOException {
    String entryName = prefix + file.getFileName().toString();
    if (Files.isDirectory(file)) {
        zos.putNextEntry(new ZipEntry(entryName + "/"));
        zos.closeEntry();
        try (Stream<Path> stream = Files.list(file)) {
            stream.forEach(child -> {
                try {
                    addFileToZip(zos, child, entryName + "/");
                } catch (IOException e) {
                    throw new UncheckedIOException(e);
                }
            });
        }
    } else {
        zos.putNextEntry(new ZipEntry(entryName));
        Files.copy(file, zos);
        zos.closeEntry();
    }
}

ZipInputStream 安全解压 ZIP 文件

不能直接按 ZipEntry.getName() 创建 File,否则可能被路径穿越攻击(如 "../etc/passwd");同时要校验条目类型和目标路径合法性:

  • 跳过 isDirectory()true 的条目(目录本身不包含数据,只靠路径名隐式存在)
  • 对每个 entry.getName() 调用 Paths.get(entry.getName()).normalize(),再检查是否仍以目标解压根目录为前缀
  • 禁止解压到系统敏感路径(如 "C:\""/etc/"),建议统一解压到临时子目录
  • 读取内容时用 ZipInputStream.read(byte[]) 循环,不要一次性 readAllBytes()——大文件会 OOM
Path targetDir = Paths.get("unzipped");
Files.createDirectories(targetDir);

try (ZipInputStream zis = new ZipInputStream(new FileInputStream("in.zip"), StandardCharsets.UTF_8)) {
    ZipEntry entry;
    while ((entry = zis.getNextEntry()) != null) {
        Path targetFile = targetDir.resolve(entry.getName()).normalize();
        // 防穿越:确保 targetFile 仍在 targetDir 下
        if (!targetFile.startsWith(targetDir.toAbsolutePath().normalize())) {
            throw new IOException("Bad zip entry: " + entry.getName());
        }
        if (entry.isDirectory()) {
            Files.createDirectories(targetFile);
        } else {
            Files.createDirectories(targetFile.getParent());
            Files.copy(zis, targetFile, StandardCopyOption.REPLACE_EXISTING);
        }
        zis.closeEntry();
    }
}

处理 ZIP 中的中文文件名乱码问题

根本原因是 ZIP 规范未强制指定编码,不同操作系统/工具默认不同:Windows 通常用 GBK,macOS/Linux 多用 UTF-8。JDK 7+ 的 ZipInputStream/ZipOutputStream 构造函数支持传入 Charset,但旧版 JDK(≤6)或某些 ZIP 工具生成的包仍可能不兼容:

VIVA
VIVA

一个免费的AI创意视觉设计平台

下载

立即学习Java免费学习笔记(深入)”;

  • 若已知 ZIP 由 Windows 上 7-Zip 或 WinRAR 生成,优先试 Charset.forName("GBK")
  • 若不确定,可先用 ZipInputStream 读取条目名,按 UTF-8 解码失败后再用 GBK 尝试(需自己封装 fallback 逻辑)
  • 避免用 FileInputStream + ZipInputStream 组合去“猜”编码——流已消费不可重置,应改用 ByteArrayInputStream 缓存原始字节再多次尝试
  • 真正跨平台稳定的方案是:压缩端统一用 UTF-8(JDK 7+ 设置 StandardCharsets.UTF_8),解压端也用 UTF-8;若必须兼容老 ZIP,则需引入 ant.jarZipFile(支持自动检测)或 TrueZip

为什么不用 java.util.jar

JarOutputStreamJarInputStreamZipOutputStream/ZipInputStream 的子类,仅额外支持 META-INF/MANIFEST.MF。普通压缩解压完全没必要用它:

  • 写 JAR 会强制在 ZIP 根目录加 META-INF/ 目录,哪怕你没提供清单文件
  • 读 JAR 时若 ZIP 不含 META-INF/MANIFEST.MFJarInputStream 会抛 IOException(而 ZipInputStream 不会)
  • 性能无差异,API 几乎一致,但语义混淆——除非你在打包 Java 应用,否则坚持用 zip 相关类

最常被忽略的是:ZIP 条目名编码不是流的字符集,而是 ZIP 文件元数据的编码;ZipInputStream 构造时传的 Charset 只影响 getEntry().getName() 返回值,不影响文件内容解码——内容始终是原始字节流,该用什么编码读文件内容,和 ZIP 编码无关。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
windows查看端口占用情况
windows查看端口占用情况

Windows端口可以认为是计算机与外界通讯交流的出入口。逻辑意义上的端口一般是指TCP/IP协议中的端口,端口号的范围从0到65535,比如用于浏览网页服务的80端口,用于FTP服务的21端口等等。怎么查看windows端口占用情况呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

1496

2023.07.26

查看端口占用情况windows
查看端口占用情况windows

端口占用是指与端口关联的软件占用端口而使得其他应用程序无法使用这些端口,端口占用问题是计算机系统编程领域的一个常见问题,端口占用的根本原因可能是操作系统的一些错误,服务器也可能会出现端口占用问题。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

1170

2023.07.27

windows照片无法显示
windows照片无法显示

当我们尝试打开一张图片时,可能会出现一个错误提示,提示说"Windows照片查看器无法显示此图片,因为计算机上的可用内存不足",本专题为大家提供windows照片无法显示相关的文章,帮助大家解决该问题。

835

2023.08.01

windows查看端口被占用的情况
windows查看端口被占用的情况

windows查看端口被占用的情况的方法:1、使用Windows自带的资源监视器;2、使用命令提示符查看端口信息;3、使用任务管理器查看占用端口的进程。本专题为大家提供windows查看端口被占用的情况的相关的文章、下载、课程内容,供大家免费下载体验。

463

2023.08.02

windows无法访问共享电脑
windows无法访问共享电脑

在现代社会中,共享电脑是办公室和家庭的重要组成部分。然而,有时我们可能会遇到Windows无法访问共享电脑的问题。这个问题可能会导致数据无法共享,影响工作和生活的正常进行。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

2361

2023.08.08

windows自动更新
windows自动更新

Windows操作系统的自动更新功能可以确保系统及时获取最新的补丁和安全更新,以提高系统的稳定性和安全性。然而,有时候我们可能希望暂时或永久地关闭Windows的自动更新功能。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

874

2023.08.10

windows boot manager
windows boot manager

windows boot manager无法开机的解决方法:1、系统文件损坏,使用Windows安装光盘或USB启动盘进入恢复环境,选择修复计算机,然后选择自动修复;2、引导顺序错误,进入恢复环境,选择命令提示符,输入命令"bootrec /fixboot"和"bootrec /fixmbr",然后重新启动计算机;3、硬件问题,使用硬盘检测工具进行扫描和修复;4、重装操作系统。本专题还提供其他解决

1976

2023.08.28

windows锁屏快捷键
windows锁屏快捷键

windows锁屏快捷键是Windows键+L、Ctrl+Alt+Del、Windows键+D、Windows键+P和Windows键+R。本专题为大家提供windows相关的文章、下载、课程内容,供大家免费下载体验。

1670

2023.08.30

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

3

2026.03.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 10.5万人学习

Git 教程
Git 教程

共21课时 | 4.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号