0

0

如何统计目标单词在文本文件中出现的次数

聖光之護

聖光之護

发布时间:2026-01-04 14:50:03

|

446人浏览过

|

来源于php中文网

原创

如何统计目标单词在文本文件中出现的次数

本文详解如何使用 java 正确读取文本文件并精确统计用户指定单词在整个文件中的完整匹配次数,修正常见逻辑错误(如仅读首行、未逐行遍历、误用 `contains()` 导致子串误判等),并提供健壮、可运行的完整示例代码。

在原始代码中,存在几个关键性逻辑缺陷,直接导致计数始终为 0:

  1. 仅读取首行:szSearch = br.readLine(); 只读了一次第一行,后续未循环读取;
  2. 错误使用 contains():while (szSearch.contains(szWord)) 并非计数逻辑——它会无限循环(因 szSearch 不变)或直接跳过,且 contains() 匹配的是子字符串(如搜索 "long" 会错误匹配 "longer" 或 "belong");
  3. 未按单词边界分割:未对每行内容进行合理分词,无法实现“完整单词”匹配。

✅ 正确做法是:逐行读取 → 按空白符切分为单词数组 → 逐个比对是否完全相等(区分大小写或忽略大小写)→ 累加匹配次数

以下是修复后的完整、生产就绪代码(使用 try-with-resources 自动资源管理,增强健壮性与可读性):

fortran语言语法 WORD版
fortran语言语法 WORD版

本文档主要讲述的是fortran语言语法;FORTRAN是世界上最早出现的高级编程语言,是工程界最常用的编程语言,它在科学计算中(如航空航天、地质勘探、天气预报和建筑工程等领域)发挥着极其重要的作用。经过40多年的发展,伴随着FORTRAN语言多次版本的更新及相应开发系统的出现,其功能不断完善,最新版本的开发系统几乎具备了VC、VB的所有特点,如图形界面编程、数据库等。希望本文档会给有需要的朋友带来帮助;感兴趣的朋友可以过来看看

下载
import java.io.*;
import java.util.Arrays;
import java.util.Scanner;

public class WordCounter {
    public static void main(String[] args) {
        Scanner szKeyboard = new Scanner(System.in);
        System.out.print("What word are you searching for? ");
        String targetWord = szKeyboard.nextLine().trim();
        System.out.println("Searching the file...");

        int count = 0;
        String fileName = "WORDLIST.txt";

        // 使用 try-with-resources 自动关闭流,更安全简洁
        try (BufferedReader br = new BufferedReader(new FileReader(fileName))) {
            String line;
            while ((line = br.readLine()) != null) {
                // 按空白字符(空格、制表符、换行等)分割为单词
                String[] words = line.split("\s+");
                for (String word : words) {
                    // 去除单词前后可能的标点/空格,并进行精确匹配(可选:忽略大小写用 .equalsIgnoreCase)
                    if (!word.isEmpty() && word.equals(targetWord)) {
                        count++;
                    }
                }
            }
        } catch (FileNotFoundException e) {
            System.err.println("Error: File '" + fileName + "' not found.");
        } catch (IOException e) {
            System.err.println("Error reading file: " + e.getMessage());
        } finally {
            szKeyboard.close();
        }

        System.out.println("The word "" + targetWord + "" appears " + count + " times in the file " + fileName + ".");
        System.out.println("

--- File End ---");
    }
}

? 关键改进说明

  • ✅ 使用 while ((line = br.readLine()) != null) 实现逐行遍历全文件
  • ✅ line.split("\s+") 基于正则 \s+(一个或多个空白符)准确分词,避免空字符串干扰;
  • word.equals(targetWord) 确保全词精确匹配(若需忽略大小写,替换为 word.equalsIgnoreCase(targetWord));
  • ✅ try-with-resources 替代手动 close(),杜绝资源泄漏风险;
  • ✅ 细粒度异常处理:分别捕获 FileNotFoundException 和通用 IOException,提升调试友好性。

⚠️ 注意事项

  • 若 WORDLIST.txt 中单词以逗号、句号等标点连接(如 "hello, world."),建议先用正则清洗:word = word.replaceAll("[^a-zA-Z]", "");
  • 对于超大文件,可考虑使用 Files.lines(Paths.get(fileName)) 配合 Stream API 进行函数式处理;
  • 生产环境推荐使用 Apache Commons IO 或 Guava 库简化 I/O 操作,但本例保持零依赖,纯 JDK 实现。

掌握此模式后,你不仅能准确统计单词频次,还可轻松扩展为:统计多词、生成词频表、支持正则模糊匹配等高级功能。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
guava包作用
guava包作用

guava是一个java库,增强了java标准库,提供更有效率和易于使用的集合、实用程序、缓存和并发工具。想了解更多guava的相关内容,可以阅读本专题下面的文章。

270

2024.05.29

c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

251

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

967

2024.03.01

while的用法
while的用法

while的用法是“while 条件: 代码块”,条件是一个表达式,当条件为真时,执行代码块,然后再次判断条件是否为真,如果为真则继续执行代码块,直到条件为假为止。本专题为大家提供while相关的文章、下载、课程内容,供大家免费下载体验。

104

2023.09.25

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

678

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

219

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1560

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

645

2023.11.24

Golang 测试体系与代码质量保障:工程级可靠性建设
Golang 测试体系与代码质量保障:工程级可靠性建设

Go语言测试体系与代码质量保障聚焦于构建工程级可靠性系统。本专题深入解析Go的测试工具链(如go test)、单元测试、集成测试及端到端测试实践,结合代码覆盖率分析、静态代码扫描(如go vet)和动态分析工具,建立全链路质量监控机制。通过自动化测试框架、持续集成(CI)流水线配置及代码审查规范,实现测试用例管理、缺陷追踪与质量门禁控制,确保代码健壮性与可维护性,为高可靠性工程系统提供质量保障。

48

2026.02.28

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 4.1万人学习

C# 教程
C# 教程

共94课时 | 10.6万人学习

Java 教程
Java 教程

共578课时 | 75.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号