0

0

如何在Java中逐行扫描文件A,并对每一行在文件B中全局匹配后输出结果

碧海醫心

碧海醫心

发布时间:2025-12-29 23:22:02

|

269人浏览过

|

来源于php中文网

原创

如何在Java中逐行扫描文件A,并对每一行在文件B中全局匹配后输出结果

本文讲解如何用java实现:读取文件a的每一行,然后在文件b的全部内容中查找是否存在匹配项;若找到,则将该行写入输出文件。核心在于避免scanner因流耗尽而无法重复读取文件b,解决方案是每次循环重建scanner。

在Java中处理多文件交叉匹配时,一个常见误区是复用同一个Scanner对象反复读取同一文件——但Scanner基于输入流(如FileInputStream),一旦读到末尾,流即关闭或耗尽,无法自动重置。正如提问者所察觉:当前代码中scanB在第一次外层循环后已无更多行可读,导致后续personA行永远无法被检查。

✅ 正确做法是:每次进入内层循环前,新建一个Scanner实例指向文件B。这样就能确保每次都是从文件开头完整扫描。

以下是优化后的完整示例代码(含资源管理与逻辑修正):

import java.io.*;
import java.util.Scanner;

public class FileMatcher {
    public static void main(String[] args) {
        File fileA = new File("A.txt");
        File fileB = new File("B.txt");
        File outputFile = new File("PersonList.txt");

        try (Scanner scanA = new Scanner(fileA)) {
            while (scanA.hasNextLine()) {
                String lineFromA = scanA.nextLine().trim(); // 去除首尾空格,提升匹配鲁棒性

                // ✅ 每次都新建 Scanner 读取 B 文件(从头开始)
                try (Scanner scanB = new Scanner(fileB)) {
                    boolean matched = false;
                    while (scanB.hasNextLine()) {
                        String nameInB = scanB.nextLine().trim();
                        // 若 lineFromA 中包含 nameInB(注意:此处为子串匹配;如需精确单词匹配,建议用 split + contains 或正则)
                        if (lineFromA.contains(nameInB) && !nameInB.isEmpty()) {
                            matched = true;
                            break; // 找到即跳出,避免冗余扫描
                        }
                    }

                    // 匹配成功则追加写入结果文件
                    if (matched) {
                        try (FileWriter fw = new FileWriter(outputFile, true);
                             BufferedWriter bw = new BufferedWriter(fw);
                             PrintWriter writer = new PrintWriter(bw)) {
                            writer.println(lineFromA); // 使用 println 保证每行独立
                        }
                    }
                }
            }
        } catch (FileNotFoundException e) {
            System.err.println("文件未找到: " + e.getMessage());
        } catch (IOException e) {
            System.err.println("IO异常: " + e.getMessage());
        }
    }
}

? 关键改进说明:

Napkin AI
Napkin AI

Napkin AI 可以将您的文本转换为图表、流程图、信息图、思维导图视觉效果,以便快速有效地分享您的想法。

下载

立即学习Java免费学习笔记(深入)”;

  • 使用 try-with-resources 自动关闭所有Scanner、FileWriter、BufferedWriter和PrintWriter,彻底规避资源泄漏风险(原答案中的手动close()易遗漏且顺序敏感);
  • 内层Scanner scanB在每次外层循环中新建,确保始终从B.txt第一行开始扫描;
  • 添加trim()防止因空格导致匹配失败;
  • 使用break提前退出内层循环,提升效率;
  • writer.println()替代writer.print(),确保每条匹配记录独占一行,输出格式清晰。

⚠️ 注意事项:

  • 当前逻辑是子字符串匹配(例如 "Alice Smith" 包含 "Alice" 即命中)。如需全词匹配(如仅当"Alice"作为独立单词出现才匹配),应改用split("\s+")分割后遍历,或使用正则\bAlice\b;
  • 若B.txt极大(如超百万行),频繁打开文件可能影响性能,此时建议一次性读入内存(如Set<String>存储所有姓名),再做O(1)查找——但这属于进阶优化,初学者优先掌握健壮、可读、安全的流式处理方式;
  • 务必确保文件路径正确,或使用绝对路径调试;编码问题(如中文乱码)可通过new Scanner(fileB, "UTF-8")显式指定。

掌握这种“外层驱动、内层重置”的模式,是处理文件交叉校验、日志筛选、黑白名单匹配等场景的基础能力。坚持从规范资源管理和清晰逻辑结构起步,你已走在扎实的编程之路上。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
python中print函数的用法
python中print函数的用法

python中print函数的语法是“print(value1, value2, ..., sep=' ', end=' ', file=sys.stdout, flush=False)”。本专题为大家提供print相关的文章、下载、课程内容,供大家免费下载体验。

193

2023.09.27

python print用法与作用
python print用法与作用

本专题整合了python print的用法、作用、函数功能相关内容,阅读专题下面的文章了解更多详细教程。

19

2026.02.03

string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

1051

2023.08.02

java中break的作用
java中break的作用

本专题整合了java中break的用法教程,阅读专题下面的文章了解更多详细内容。

120

2025.10.15

java break和continue
java break和continue

本专题整合了java break和continue的区别相关内容,阅读专题下面的文章了解更多详细内容。

261

2025.10.24

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

761

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

221

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1570

2023.10.24

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

26

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 4.4万人学习

C# 教程
C# 教程

共94课时 | 11.3万人学习

Java 教程
Java 教程

共578课时 | 82.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号