0

0

如何在Java中逐行扫描文件A,并对每一行在文件B中进行全文匹配

聖光之護

聖光之護

发布时间:2025-12-30 12:45:32

|

277人浏览过

|

来源于php中文网

原创

如何在Java中逐行扫描文件A,并对每一行在文件B中进行全文匹配

本文讲解如何用java实现:读取文件a的每一行,然后在文件b的全部内容中查找该行是否包含任意一个b中的名字;若匹配成功,则将该行写入结果文件。核心在于避免scanner无法重置的问题,通过循环内重建scanner实现重复读取。

在Java中,Scanner 是单向流式读取器,一旦读到文件末尾(hasNextLine() 返回 false),它无法自动回退到开头——这正是原代码逻辑失效的根本原因。因此,要让“每行A都完整比对整个B”,必须确保每次进入内层循环时,都能从B文件起始位置重新扫描。最直接、清晰且适合初学者的解决方案是:在每次外层循环迭代中,新建一个 Scanner 实例来读取文件B

以下是优化后的完整实现(含资源管理与健壮性改进):

import java.io.*;
import java.util.Scanner;

public class NameMatcher {
    public static void main(String[] args) {
        File fileA = new File("A.txt");
        File fileB = new File("B.txt");
        File outputFile = new File("PersonList.txt");

        try (Scanner scanA = new Scanner(fileA)) {
            // 逐行读取A.txt
            while (scanA.hasNextLine()) {
                String lineFromA = scanA.nextLine().trim();
                if (lineFromA.isEmpty()) continue;

                // 每次都新建Scanner,确保从B文件开头重新扫描
                try (Scanner scanB = new Scanner(fileB)) {
                    boolean matched = false;
                    while (scanB.hasNextLine()) {
                        String nameInB = scanB.nextLine().trim();
                        if (nameInB.isEmpty()) continue;
                        // 判断lineFromA是否包含nameInB(全名精确匹配,不区分大小写)
                        if (lineFromA.toLowerCase().contains(nameInB.toLowerCase())) {
                            matched = true;
                            break; // 找到一个即跳出,避免重复写入同一行
                        }
                    }

                    // 匹配成功则追加写入结果文件
                    if (matched) {
                        try (FileWriter fw = new FileWriter(outputFile, true);
                             BufferedWriter bw = new BufferedWriter(fw);
                             PrintWriter writer = new PrintWriter(bw)) {
                            writer.println(lineFromA); // 使用println确保换行
                        }
                    }
                }
            }
        } catch (FileNotFoundException e) {
            System.err.println("错误:找不到输入文件 — " + e.getMessage());
        } catch (IOException e) {
            System.err.println("I/O错误 — " + e.getMessage());
        }
    }
}

关键改进说明:

  • 使用 try-with-resources 自动关闭所有 Scanner、FileWriter、BufferedWriter 和 PrintWriter,彻底避免资源泄漏(无需手动调用 .close());
  • 对每行做 .trim() 处理,消除首尾空格干扰;跳过空行,提升鲁棒性;
  • 添加 matched 标志位,防止同一行因多次匹配而重复写入;
  • 使用 println() 而非 print(),确保输出文件每条记录独占一行;
  • 错误处理覆盖常见异常(FileNotFoundException、IOException),便于调试。

⚠️ 注意事项:

阿里云AI平台
阿里云AI平台

阿里云AI平台

下载

立即学习Java免费学习笔记(深入)”;

  • 当前逻辑是「A中某行 包含 B中某名字」(子串匹配)。如需精确单词匹配(例如避免 "Anna" 匹配 "Annabelle"),建议将B中名字存入 Set<String>,再对A中每行按空格/分隔符切分后逐词比对;
  • 若B文件极大(如百万行),频繁重建Scanner并重读磁盘会显著降低性能——此时应改用「预加载B为内存集合」策略(如 Set<String> namesInB = Files.readAllLines(Paths.get("B.txt")).stream().map(String::trim).filter(s -> !s.isEmpty()).collect(Collectors.toSet());),后续仅做O(1)哈希查找;
  • 文件编码未显式指定,默认使用系统平台编码。生产环境建议统一用 StandardCharsets.UTF_8 显式声明(如 new Scanner(fileB, "UTF-8"))。

掌握这种“外层驱动、内层重置”的模式,是处理多文件交叉扫描任务的基础范式。它简洁、可读性强,也完美契合初学者对流程控制的直观理解。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
python中print函数的用法
python中print函数的用法

python中print函数的语法是“print(value1, value2, ..., sep=' ', end=' ', file=sys.stdout, flush=False)”。本专题为大家提供print相关的文章、下载、课程内容,供大家免费下载体验。

193

2023.09.27

python print用法与作用
python print用法与作用

本专题整合了python print的用法、作用、函数功能相关内容,阅读专题下面的文章了解更多详细教程。

19

2026.02.03

string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

1051

2023.08.02

golang map内存释放
golang map内存释放

本专题整合了golang map内存相关教程,阅读专题下面的文章了解更多相关内容。

77

2025.09.05

golang map相关教程
golang map相关教程

本专题整合了golang map相关教程,阅读专题下面的文章了解更多详细内容。

40

2025.11.16

golang map原理
golang map原理

本专题整合了golang map相关内容,阅读专题下面的文章了解更多详细内容。

67

2025.11.17

java判断map相关教程
java判断map相关教程

本专题整合了java判断map相关教程,阅读专题下面的文章了解更多详细内容。

47

2025.11.27

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

25

2026.03.13

Python异步编程与Asyncio高并发应用实践
Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开,深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例,帮助开发者掌握 Python 在高并发场景中的高效开发方法,并提升系统资源利用率与整体运行性能。

44

2026.03.12

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 4.4万人学习

C# 教程
C# 教程

共94课时 | 11.3万人学习

Java 教程
Java 教程

共578课时 | 81.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号