
本文介绍一种不依赖固定列序号的 excel xlsx 解析方案:先扫描首行获取动态列名与位置映射,再逐行按列名读取对应单元格,支持缺失列容错与类型化处理。
在当前代码中,row.getCell(0) 和 row.getCell(1) 等硬编码列索引的方式存在严重可维护性问题:一旦 Excel 模板调整列顺序、增删列(如缺少 "kpgz" 列),程序将抛出 NullPointerException 或读取错误字段,且无法明确提示哪一列缺失。
✅ 正确做法是 两阶段解析:
-
首行分析阶段:读取第 0 行(表头),构建 Map
,将列名(如 "Number"、"kpgz")映射到其所在列索引; - 数据遍历阶段:对每一数据行(i ≥ 1),通过列名查出实际列索引,再安全读取单元格——即使某列不存在,也不会崩溃,而是跳过或记录警告。
以下是重构后的核心逻辑(基于 Apache POI):
public ResponseEntity<Object> importPcpXlsx(MultipartFile xlsx) {
try (XSSFWorkbook workbook = new XSSFWorkbook(xlsx.getInputStream())) {
XSSFSheet sheet = workbook.getSheetAt(0);
Row headerRow = sheet.getRow(0);
if (headerRow == null) {
return ResponseEntity.badRequest().body("Excel 文件缺少表头行");
}
// ✅ 第一阶段:动态构建列名 → 列索引映射
Map<String, Integer> columnMap = new HashMap<>();
for (int col = 0; col < headerRow.getLastCellNum(); col++) {
Cell cell = headerRow.getCell(col);
if (cell != null && cell.getCellType() == CellType.STRING) {
String headerName = cell.getStringCellValue().trim();
// 标准化列名(忽略大小写和空格差异)
columnMap.put(headerName.toLowerCase(), col);
}
}
// 定义需提取的列及其标准化键名
final String NUMBER_KEY = "number";
final String KPGZ_KEY = "kpgz";
List<String> numbers = new ArrayList<>();
List<String> kpgzList = new ArrayList<>();
// ✅ 第二阶段:逐行解析,按列名查索引,自动容错
for (int i = 1; i <= sheet.getLastRowNum(); i++) {
Row row = sheet.getRow(i);
if (row == null) continue;
// 安全读取 Number 列(若列存在)
if (columnMap.containsKey(NUMBER_KEY)) {
int numberColIndex = columnMap.get(NUMBER_KEY);
Cell numberCell = row.getCell(numberColIndex);
if (numberCell != null && numberCell.getCellType() == CellType.STRING) {
String value = numberCell.getStringCellValue().trim();
if (!value.isEmpty()) {
numbers.add(value);
log.info("number: {} → {}", i, value);
}
}
}
// 安全读取 kpgz 列(若列存在)
if (columnMap.containsKey(KPGZ_KEY)) {
int kpgzColIndex = columnMap.get(KPGZ_KEY);
Cell kpgzCell = row.getCell(kpgzColIndex);
if (kpgzCell != null && kpgzCell.getCellType() == CellType.STRING) {
String value = kpgzCell.getStringCellValue().trim();
if (!value.isEmpty()) {
kpgzList.add(value);
log.info("kpgz: {} → {}", i, value);
}
}
}
}
// 后续业务处理(如保存、校验、返回结果)
return ResponseEntity.ok(Map.of("numbers", numbers, "kpgz", kpgzList));
} catch (IOException e) {
log.error("解析 Excel 失败", e);
return ResponseEntity.status(500).body("文件解析异常:" + e.getMessage());
}
}? 关键改进点说明:
- 使用 try-with-resources 自动关闭流,避免资源泄漏;
- 表头统一转为小写比对,提升兼容性(如 "NUMBER"、"number " 均可匹配);
- 显式检查 CellType.STRING,避免数字型单元格调用 getStringCellValue() 返回空字符串;
- 对缺失列完全静默跳过,不中断流程,便于后续扩展更多列(只需新增 if (columnMap.containsKey(...)) 块);
- 支持空值/空白值过滤,避免存入无效数据。
⚠️ 注意事项:
- 若业务要求严格校验必填列(如 "Number" 必须存在),可在构建 columnMap 后添加断言:
if (!columnMap.containsKey(NUMBER_KEY)) { return ResponseEntity.badRequest().body("缺少必需列:'Number'"); } - 对于超大 Excel(>10MB),建议改用 SXSSFWorkbook 流式读取,避免内存溢出;
- 列名标准化策略(如去空格、下划线替换等)应与前端导出模板约定一致,确保鲁棒性。
该方案彻底解耦了代码与 Excel 物理列序,使解析逻辑真正面向语义而非位置,显著提升系统健壮性与可维护性。










