Java 中高效去重读取整数文件并填充数组的完整实现

聖光之護

发布时间：2026-03-11 23:13:05

477人浏览过

来源于php中文网

原创

本文详解如何在 java 中正确读取整数文件、自动过滤重复值与非法输入，并将唯一非负整数安全填入预分配数组，重点修复因变量作用域导致的重复判定失效问题。

本文详解如何在 java 中正确读取整数文件、自动过滤重复值与非法输入，并将唯一非负整数安全填入预分配数组，重点修复因变量作用域导致的重复判定失效问题。

在 Java 中从文件读取整数并去重填充数组是一个常见但易出错的任务。原始代码的核心缺陷在于布尔标志 ID 的声明位置不当：它被定义为方法级变量（boolean ID = false;），在循环中一旦被置为 true（发现某重复值），该状态会持续影响后续所有数字的判定，导致本应保留的“新唯一值”被错误跳过——最终仅成功录入 11 个而非全部 10 个唯一正整数（注意：题干中“10 唯一、10 复制”共 20 个整数，目标是填入 10 个唯一值）。

关键修复在于将 ID 声明移至 while 循环内部，确保每次处理新数字时都以干净的 false 状态开始检测：

private static int read(String inFileName, int[] list) {
    int size = 0;
    Scanner inFile = null;
    int trash = 0, uniqueCount = 0, dupeCount = 0, lineCount = 0;

    try {
        inFile = new Scanner(new File(inFileName));
        while (inFile.hasNext()) {
            lineCount++;
            boolean isDuplicate = false; // ✅ 每次迭代重置标志位

            try {
                int val = inFile.nextInt();
                if (val < 0) {
                    trash++;
                    continue;
                }

                // 遍历已存唯一值，检查是否重复
                for (int i = 0; i < size; i++) {
                    if (list[i] == val) {
                        isDuplicate = true;
                        dupeCount++;
                        break; // ✅ 找到即退出，提升效率
                    }
                }

                // 仅当非重复且数组未满时写入
                if (!isDuplicate && size < list.length) {
                    list[size] = val;
                    size++;
                    uniqueCount++;
                }

            } catch (InputMismatchException e) {
                trash++;
                inFile.nextLine(); // 跳过整行非法输入
            }
        }

        System.out.printf("Lines: %d | Unique: %d | Duplicates: %d | Invalid/Negative: %d%n", 
                         lineCount, uniqueCount, dupeCount, trash);

    } catch (FileNotFoundException e) {
        System.err.println("Error: File '" + inFileName + "' not found.");
        return 0;
    } finally {
        if (inFile != null) inFile.close(); // ✅ 防止资源泄漏
    }

    return size;
}

重要注意事项与最佳实践：

Dora

创建令人惊叹的3D动画网站，无需编写一行代码。

下载

资源管理：务必在 finally 块中关闭 Scanner，避免文件句柄泄露；现代写法推荐使用 try-with-resources（需调整方法签名）；
性能优化：break 语句在内层 for 循环中及时终止比较，避免无效遍历；
边界防护：size
命名规范：将 ID 改为语义清晰的 isDuplicate，增强可读性与可维护性；
扩展建议：若数据量增大（如千级以上），应改用 HashSet 实现 O(1) 查重，时间复杂度从 O(n²) 降至 O(n)；
输入校验强化：当前逻辑忽略负数，如需支持负数去重，只需移除 val

此实现兼顾正确性、可读性与鲁棒性，适用于教学及中小型数据场景。掌握变量作用域与循环内状态重置原则，是规避此类逻辑陷阱的关键。

立即学习“Java免费学习笔记（深入）”；

Java终端颜色重置失效问题解析与正确实践

在Java中如何避免内存泄漏_Java内存管理最佳实践

Java项目中如何配置Pulsar环境_Apache Pulsar消息发布订阅

Java项目中如何配置架构守护环境_ArchUnit代码依赖约束测试

Java终端颜色控制：正确重置ANSI转义序列避免颜色残留

相关标签:

java Integer Boolean for while try break 变量作用域循环 Length finally 作用域性能优化

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：MapStruct 中正确实现多字段拼接映射的完整指南下一篇：暂无

作者最新文章

如何在页面刷新后持久化保存复选框的选中状态

2026-03-09 13:20

Go 程序中 HTTP 连接复用导致内存持续增长的解决方案

2026-03-09 13:22

Python正则表达式中字符类内连字符（-）的位置规则详解

2026-03-09 13:24

一键启动！KiriGiri发布D加密虚拟机破解启动器

2026-03-09 13:33

Python中批量替换列表中所有匹配元素的正确方法

2026-03-09 13:41

如何在 Pandas 中安全获取首个存在的列值（避免 KeyError）

2026-03-09 13:54

如何在时间类中保留原始输入值以实现准确的总秒数计算

2026-03-09 13:56

《杀戮尖塔2》Steam峰值超57万成2026年首发最高游戏

2026-03-09 13:59

如何在单页中正确结合 AJAX 与 PHP 实现用户名实时校验

2026-03-09 14:01

壹心理如何提问

2026-03-09 14:15

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

java中boolean的用法

在Java中，boolean是一种基本数据类型，它只有两个可能的值：true和false。boolean类型经常用于条件测试，比如进行比较或者检查某个条件是否满足。想了解更多java中boolean的相关内容，可以阅读本专题下面的文章。

367

2023.11.13

java boolean类型

本专题整合了java中boolean类型相关教程，阅读专题下面的文章了解更多详细内容。

2025.11.30

while的用法

while的用法是“while 条件: 代码块”，条件是一个表达式，当条件为真时，执行代码块，然后再次判断条件是否为真，如果为真则继续执行代码块，直到条件为假为止。本专题为大家提供while相关的文章、下载、课程内容，供大家免费下载体验。

106

2023.09.25

java中break的作用

本专题整合了java中break的用法教程，阅读专题下面的文章了解更多详细内容。

120

2025.10.15

java break和continue

本专题整合了java break和continue的区别相关内容，阅读专题下面的文章了解更多详细内容。

261

2025.10.24

length函数用法

length函数用于返回指定字符串的字符数或字节数。可以用于计算字符串的长度，以便在查询和处理字符串数据时进行操作和判断。需要注意的是length函数计算的是字符串的字符数，而不是字节数。对于多字节字符集，一个字符可能由多个字节组成。因此，length函数在计算字符串长度时会将多字节字符作为一个字符来计算。更多关于length函数的用法，大家可以阅读本专题下面的文章。

954

2023.09.19

PHP 高并发与性能优化

本专题聚焦 PHP 在高并发场景下的性能优化与系统调优，内容涵盖 Nginx 与 PHP-FPM 优化、Opcode 缓存、Redis/Memcached 应用、异步任务队列、数据库优化、代码性能分析与瓶颈排查。通过实战案例（如高并发接口优化、缓存系统设计、秒杀活动实现），帮助学习者掌握构建高性能PHP后端系统的核心能力。

112

2025.10.16

PHP 数据库操作与性能优化

本专题聚焦于PHP在数据库开发中的核心应用，详细讲解PDO与MySQLi的使用方法、预处理语句、事务控制与安全防注入策略。同时深入分析SQL查询优化、索引设计、慢查询排查等性能提升手段。通过实战案例帮助开发者构建高效、安全、可扩展的PHP数据库应用系统。

2025.11.13

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

2026.03.11

热门下载

网站特效

网站源码

网站素材

前端模板