0

0

如何大幅提升Java处理3万行Excel数据的性能

碧海醫心

碧海醫心

发布时间:2025-12-30 23:28:13

|

352人浏览过

|

来源于php中文网

原创

如何大幅提升Java处理3万行Excel数据的性能

本文针对使用apache poi逐行修改excel单元格导致极慢(每行1秒、总耗时超1小时)的问题,指出核心瓶颈在于**循环内反复打开/关闭文件流和重复调用`workbook.write()`**,并提供高效、安全、可落地的优化方案。

在处理包含30,000+记录的Excel文件(如formatted.xlsx)时,原始Java代码存在严重性能反模式:每次循环都执行FileOutputStream的创建、workbook.write(outFile)的全量写入、以及流关闭操作。由于XSSF(.xlsx)基于ZIP压缩包结构,workbook.write()并非增量更新,而是每次重建整个OPC容器——这意味着每处理1行就重新序列化全部已加载的Sheet、Style、SharedStrings等对象,I/O开销呈线性爆炸式增长,直接导致单行耗时高达1秒以上。

✅ 正确做法是:“读—改—写”三阶段分离,且仅执行一次物理写入。优化后的核心逻辑如下:

public static void main(String[] args) throws IOException {
    String filePath = "formatted.xlsx";

    // 1. 一次性读取(注意:使用 try-with-resources 自动释放)
    try (FileInputStream file = new FileInputStream(filePath);
         XSSFWorkbook workbook = new XSSFWorkbook(file)) {

        XSSFSheet sheet = workbook.getSheetAt(0);
        int rowCount = sheet.getLastRowNum();

        // 2. 内存中批量修改(无I/O)
        for (int i = 1; i <= rowCount; i++) {
            XSSFRow row = sheet.getRow(i);
            if (row == null) continue; // 跳过空行

            Cell descriptionCell = row.getCell(3); // 第4列(索引3)
            if (descriptionCell != null && descriptionCell.getCellType() == CellType.STRING) {
                String original = descriptionCell.getStringCellValue();
                String modified = original.replace("#", "-");
                descriptionCell.setCellValue(modified);
            }
        }

        // 3. 一次性写出(关键!移出循环)
        try (FileOutputStream outFile = new FileOutputStream(filePath)) {
            workbook.write(outFile);
        }

        System.out.println("✅ 更新完成:共处理 " + rowCount + " 行");
    }
}

⚠️ 关键注意事项

Bika.ai
Bika.ai

打造您的AI智能体员工团队

下载
  • 绝不循环内写文件:workbook.write() 是重量级操作,必须置于循环外;
  • 显式检查空行与空单元格:避免NullPointerException(如row.getCell(3)返回null);
  • 校验单元格类型:getStringCellValue()仅适用于CellType.STRING,否则抛异常;
  • 使用try-with-resources:确保FileInputStream和FileOutputStream自动关闭,防止资源泄漏;
  • 内存考量:30K行xlsx在内存中约占用50–100MB,现代JVM默认配置可轻松承载;若数据量达百万级,建议切换至SXSSFWorkbook(流式写入)或改用CSV处理。

? 进阶提示:若需更高性能(如并发处理多Sheet、正则替换、跨列逻辑),可结合ExecutorService分片处理,但务必保证Workbook线程不安全——每个线程应操作独立XSSFWorkbook实例。

立即学习Java免费学习笔记(深入)”;

经此优化,处理30,000行Excel的总耗时通常可从1小时+降至3–10秒内,性能提升超300倍,真正实现高效、健壮的企业级Excel批处理。

相关文章

数码产品性能查询
数码产品性能查询

该软件包括了市面上所有手机CPU,手机跑分情况,电脑CPU,电脑产品信息等等,方便需要大家查阅数码产品最新情况,了解产品特性,能够进行对比选择最具性价比的商品。

下载

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

910

2023.08.02

c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

251

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

967

2024.03.01

线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

723

2023.08.10

apache是什么意思
apache是什么意思

Apache是Apache HTTP Server的简称,是一个开源的Web服务器软件。是目前全球使用最广泛的Web服务器软件之一,由Apache软件基金会开发和维护,Apache具有稳定、安全和高性能的特点,得益于其成熟的开发和广泛的应用实践,被广泛用于托管网站、搭建Web应用程序、构建Web服务和代理等场景。本专题为大家提供了Apache相关的各种文章、以及下载和课程,希望对各位有所帮助。

418

2023.08.23

apache启动失败
apache启动失败

Apache启动失败可能有多种原因。需要检查日志文件、检查配置文件等等。想了解更多apache启动的相关内容,可以阅读本专题下面的文章。

937

2024.01.16

Java 流式处理与 Apache Kafka 实战
Java 流式处理与 Apache Kafka 实战

本专题专注讲解 Java 在流式数据处理与消息队列系统中的应用,系统讲解 Apache Kafka 的基础概念、生产者与消费者模型、Kafka Streams 与 KSQL 流式处理框架、实时数据分析与监控,结合实际业务场景,帮助开发者构建 高吞吐量、低延迟的实时数据流管道,实现高效的数据流转与处理。

119

2026.02.04

excel对比两列数据异同
excel对比两列数据异同

Excel作为数据的小型载体,在日常工作中经常会遇到需要核对两列数据的情况,本专题为大家提供excel对比两列数据异同相关的文章,大家可以免费体验。

1447

2023.07.25

Golang 测试体系与代码质量保障:工程级可靠性建设
Golang 测试体系与代码质量保障:工程级可靠性建设

Go语言测试体系与代码质量保障聚焦于构建工程级可靠性系统。本专题深入解析Go的测试工具链(如go test)、单元测试、集成测试及端到端测试实践,结合代码覆盖率分析、静态代码扫描(如go vet)和动态分析工具,建立全链路质量监控机制。通过自动化测试框架、持续集成(CI)流水线配置及代码审查规范,实现测试用例管理、缺陷追踪与质量门禁控制,确保代码健壮性与可维护性,为高可靠性工程系统提供质量保障。

48

2026.02.28

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Excel 教程
Excel 教程

共162课时 | 19.7万人学习

成为PHP架构师-自制PHP框架
成为PHP架构师-自制PHP框架

共28课时 | 2.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号