0

0

怎么在Java中读取Excel文件_Apache POI库解析xls/xlsx实战

P粉602998670

P粉602998670

发布时间:2026-03-12 10:56:08

|

500人浏览过

|

来源于php中文网

原创

应使用workbookfactory.create(inputstream)自动识别.xls/.xlsx格式;索引从0开始,空单元格需用missingcellpolicy处理;大文件用streamingreader或sax解析;中文、日期、公式需分别配置编码、样式和formulaevaluator。

怎么在java中读取excel文件_apache poi库解析xls/xlsx实战

读取 .xls.xlsx 文件要用不同类,别混用

Apache POI 对两种格式的底层处理完全不同:HSSFWorkbook 专用于旧版二进制 .xlsXSSFWorkbook 用于新版 XML 格式 .xlsx。直接拿 XSSFWorkbook 去读 .xls 文件会抛出 InvalidFormatException;反过来用 HSSFWorkbook.xlsx 则报 OfficeXmlFileException

实操建议:

立即学习Java免费学习笔记(深入)”;

  • 优先用 WorkbookFactory.create(InputStream) —— 它自动识别格式,返回 Workbook 接口实例,不用手动判断
  • 如果必须显式指定,检查文件扩展名或魔数(如 InputStream.mark(8); InputStream.read())再选类
  • .xlsb.xlsm 等变体也得走 XSSFWorkbook,但需确保依赖了 poi-ooxml 模块

SheetRow 的索引从 0 开始,但 Excel 界面显示从 1

这是新手最常踩的坑:调用 sheet.getRow(1) 拿到的是 Excel 里第 2 行(即界面显示的“第2行”),不是标题行。如果表头在第1行,实际要取 getRow(0)

实操建议:

立即学习Java免费学习笔记(深入)”;

  • 遍历 sheet 时用 sheet.getFirstRowNum()sheet.getLastRowNum(),别硬写 01000
  • row.getCell(0) 可能返回 null(空单元格未创建),要用 row.getCell(0, Row.MissingCellPolicy.CREATE_NULL_AS_BLANK) 避免 NPE
  • 数值型单元格默认读出来是 double,比如 “123” 会变成 123.0,需用 cell.getNumericCellValue() + 类型判断转成整型或字符串

内存占用大?用 StreamingReaderSAX 模式读大文件

默认的 XSSFWorkbook 把整个 .xlsx 解压进内存,10MB 文件可能吃掉 500MB 堆空间。5万行以上就容易 OutOfMemoryError

智简简历
智简简历

免费AI简历制作工具,智能生成、可视化编辑、多格式导出。

下载

实操建议:

立即学习Java免费学习笔记(深入)”;

  • 对只读场景,用 org.apache.poi.ss.usermodel.StreamingReader(需额外引入 poi-scratchpad)—— 支持逐行流式读,内存稳定在几 MB
  • 超大数据(百万行+),直接上 OPCPackage + XSSFReader + SAX 解析,跳过 Workbook 层,但要自己解析 XML 结构
  • .xls 大文件没流式方案,只能分批读(如每次读 1000 行)+ 及时 row.dispose()

中文乱码、日期错乱、公式不计算?看这三处配置

POI 默认不处理编码和样式上下文,很多“读出来不对”其实不是 bug,是没设对参数。

实操建议:

立即学习Java免费学习笔记(深入)”;

  • 中文乱码:确保文件本身是 UTF-8 或 GBK 编码(Excel 保存时选“另存为 → 工具 → Web 选项 → 编码”),POI 不负责解码文本内容,它只是原样读取字符串
  • 日期错乱:调用 cell.getDateCellValue() 前先 cell.getCellStyle().getDataFormatString() 确认是否真为日期类型;否则可能被当成数字(Excel 内部用浮点数存日期)
  • 公式不计算:默认只读公式字符串(如 "=SUM(A1:A10)"),要结果得用 FormulaEvaluator,且注意 XSSFFormulaEvaluator 必须绑定到 XSSFWorkbook 实例

复杂点在于:同一个 Excel 文件里可能混合文本、数字、日期、布尔、错误值五种单元格类型,cell.getCellType() 在新版本已弃用,必须用 cell.getType() + switch 分支处理,漏一种就可能崩。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

254

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

1089

2024.03.01

switch语句用法
switch语句用法

switch语句用法:1、Switch语句只能用于整数类型,枚举类型和String类型,不能用于浮点数类型和布尔类型;2、每个case语句后面必须跟着一个break语句,以防止执行其他case的代码块,没有break语句,将会继续执行下一个case的代码块;3、可以在一个case语句中匹配多个值,使用逗号分隔;4、Switch语句中的default代码块是可选的等等。

569

2023.09.21

Java switch的用法
Java switch的用法

Java中的switch语句用于根据不同的条件执行不同的代码块。想了解更多switch的相关内容,可以阅读本专题下面的文章。

441

2024.03.13

pdf怎么转换成xml格式
pdf怎么转换成xml格式

将 pdf 转换为 xml 的方法:1. 使用在线转换器;2. 使用桌面软件(如 adobe acrobat、itext);3. 使用命令行工具(如 pdftoxml)。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1947

2024.04.01

xml怎么变成word
xml怎么变成word

步骤:1. 导入 xml 文件;2. 选择 xml 结构;3. 映射 xml 元素到 word 元素;4. 生成 word 文档。提示:确保 xml 文件结构良好,并预览 word 文档以验证转换是否成功。想了解更多xml的相关内容,可以阅读本专题下面的文章。

2119

2024.08.01

xml是什么格式的文件
xml是什么格式的文件

xml是一种纯文本格式的文件。xml指的是可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。想了解更多相关的内容,可阅读本专题下面的相关文章。

1168

2024.11.28

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

760

2023.08.03

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

76

2026.03.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 4.3万人学习

C# 教程
C# 教程

共94课时 | 11.1万人学习

Java 教程
Java 教程

共578课时 | 80.5万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号