Spring Batch 中实现单作业多文件并行读取的正确实践

心靈之曲

发布时间：2026-01-27 14:58:02

521人浏览过

来源于php中文网

原创

Spring Batch 中实现单作业多文件并行读取的正确实践

本文介绍如何在 spring batch 中高效处理同一目录下多个 json 文件（如按国家/地区及类型排序），通过“每文件一作业实例”策略实现真正并行读取与写入，兼顾顺序控制、可扩展性与故障隔离。

在 Spring Batch 中，一个 Step 仅允许配置一个 ItemReader，这是框架的核心设计约束——它保障了步骤级事务一致性与状态可追踪性。因此，试图在单个 Step 内“动态切换多个 Reader 实例”或“让一个 Step 并行消费多个资源”本质上违背了批处理模型，不仅无法原生支持，强行绕过（如自定义 Reader 封装多资源迭代）还会导致事务边界模糊、重启语义失效、监控粒度粗化等严重问题。

✅ 正确且推荐的解决方案是：采用“一个文件 → 一个 Job 实例”的设计范式。即不追求“单 Job 多 Reader”，而是将每个待处理文件（如 sg_company_group_alternate_id.json）作为独立的、可识别的 Job 执行单元。

Khroma

AI调色盘生成工具

下载

✅ 实现步骤概览

预扫描并排序文件列表（满足业务顺序要求）
在触发批量执行前，使用 ResourcePatternResolver 或 Files.walk() 扫描目标目录，并按规则排序：

优先级：sg_* > my_*
同国家内：*_alternate_id.json > *.json

List<Path> sortedFiles = Files.walk(Paths.get("company_group"))
    .filter(Files::isRegularFile)
    .filter(p -> p.toString().endsWith(".json"))
    .sorted((p1, p2) -> {
        String n1 = p1.getFileName().toString();
        String n2 = p2.getFileName().toString();
        // 先按国家分组（sg > my）
        int countryCmp = compareCountry(n1, n2);
        if (countryCmp != 0) return countryCmp;
        // 再按是否为 alternate_id 排序
        boolean alt1 = n1.contains("_alternate_id");
        boolean alt2 = n2.contains("_alternate_id");
        return Boolean.compare(alt2, alt1); // alternate 优先
    })
    .collect(Collectors.toList());

为每个文件启动独立 Job 实例
使用唯一标识参数（如 input.file.path）构建 JobParameters，确保每个 Job 实例可区分、可重启：

for (Path file : sortedFiles) {
    JobParameters params = new JobParametersBuilder()
        .addString("input.file.path", file.toUri().toString())
        .addLong("run.time", System.currentTimeMillis())
        .toJobParameters();
    jobLauncher.run(job, params);
}

在 Job 配置中注入文件路径并构建 Reader
利用 @Value("#{jobParameters['input.file.path']}") 动态注入路径，在 @Bean 中创建 FlatFileItemReader（或 JsonItemReader）：

@Bean
public JsonItemReader<CompanyGroup> reader(
        @Value("#{jobParameters['input.file.path']}") String filePath) {
    return new JsonItemReaderBuilder<CompanyGroup>()
            .jsonObjectReader(new JacksonJsonObjectReader<>(CompanyGroup.class))
            .resource(new UrlResource(URI.create(filePath)))
            .name("companyGroupReader")
            .build();
}

⚠️ 注意事项与最佳实践

无需 Partitioner：该方案天然规避了 MultiResourcePartitioner 的复杂性与单 Step 瓶颈，每个 Job 实例独占 Reader/Writter/Transaction。
并行执行：配合 TaskExecutor（如 SimpleAsyncTaskExecutor 或线程池）与 JobLauncher，可轻松实现多文件并发处理。
精准重启：任一文件处理失败，仅需重跑对应 JobParameters 的 Job，不影响其他文件。
监控友好：每个 Job 实例在 BATCH_JOB_EXECUTION 表中独立记录，便于按文件粒度审计、统计耗时、排查异常。
顺序保障（如需强顺序）：若业务严格要求“SG alternate → SG main → MY alternate → MY main”串行执行，则在启动循环中同步调用 jobLauncher.run(...)；若仅需逻辑分组优先级（如 SG 组整体早于 MY 组），可对排序后列表分组提交至线程池。

✅ 总结

与其在 Spring Batch 的单 Step 模型中“硬塞多个 Reader”，不如拥抱其“Job 为部署与调度基本单元”的设计理念。以文件为 Job 边界，辅以参数化配置与合理排序，不仅能自然满足您的读取顺序与并行需求，更能显著提升系统的健壮性、可观测性与运维效率。这是 Spring Batch 社区广泛验证的生产级实践模式。

如何在 OkHttp SSL Pinning 失败时捕获异常并获取错误信息

SSL Pinning 失败时如何捕获 OkHttp 异常并获取错误详情

如何在下拉菜单中实现多选复选框（Bootstrap 实战教程）

在Java里如何设计一个图形化天气预报系统_JavaWeb与第三方API应用解析

Java初学者项目实战：开发一个基本的网络爬虫应用

相关标签:

js json ai batch spring json 封装循环线程并发 input

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何查看并切换 Java 版本 JDK 多版本环境管理教程【方法】下一篇：在Java中接口与抽象类如何选择_Java面向对象设计解析

作者最新文章

如何在 MAMP 中正确访问本地 PHP 项目文件

2026-03-12 16:13

如何让 Flex 布局的双栏页脚在移动端自动堆叠显示

2026-03-12 16:17

Steam新主机配件短缺 V社在GDC上公开求购内存条

2026-03-12 16:26

Go 标准库中无函数体的导出函数是如何工作的？

2026-03-12 16:34

如何在 Reactor 非阻塞线程中安全获取并复用 API 认证 Token

2026-03-12 16:48

vscode安装包打开后怎么安装

2026-03-12 16:50

如何在 JavaScript 对象中为多个数组批量插入新元素（如新增关键帧）

2026-03-12 17:03

《零红蝶：重制版》Steam多半好评：移植出色玩法升级

2026-03-12 17:04

Spring Boot 服务层事务失效的典型原因与解决方案

2026-03-12 17:37

PHP中true == "expired"为何为真？深入理解松散比较与类型转换

2026-03-12 17:45

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

spring框架介绍

本专题整合了spring框架相关内容，想了解更多详细内容，请阅读专题下面的文章。

161

2025.08.06

Java Spring Security 与认证授权

本专题系统讲解 Java Spring Security 框架在认证与授权中的应用，涵盖用户身份验证、权限控制、JWT与OAuth2实现、跨站请求伪造（CSRF）防护、会话管理与安全漏洞防范。通过实际项目案例，帮助学习者掌握如何使用 Spring Security 实现高安全性认证与授权机制，提升 Web 应用的安全性与用户数据保护。

2026.01.26

json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章，帮助大家解决问题。

457

2023.08.07

json是什么

JSON是一种轻量级的数据交换格式，具有简洁、易读、跨平台和语言的特点，JSON数据是通过键值对的方式进行组织，其中键是字符串，值可以是字符串、数值、布尔值、数组、对象或者null，在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容，供大家免费下载体验。

549

2023.08.23

jquery怎么操作json

操作的方法有：1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”；3、“$.each(obj, callback)”；4、“$.ajax()”。更多jquery怎么操作json的详细内容，可以访问本专题下面的文章。

337

2023.10.13

go语言处理json数据方法

本专题整合了go语言中处理json数据方法，阅读专题下面的文章了解更多详细内容。

2025.09.10

线程和进程的区别

线程和进程的区别：线程是进程的一部分，用于实现并发和并行操作，而线程共享进程的资源，通信更方便快捷，切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

766

2023.08.10

点击input框没有光标怎么办

点击input框没有光标的解决办法：1、确认输入框焦点；2、清除浏览器缓存；3、更新浏览器；4、使用JavaScript；5、检查硬件设备；6、检查输入框属性；7、调试JavaScript代码；8、检查页面其他元素；9、考虑浏览器兼容性。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

197

2023.11.24