如何在 Java 中正确去重填充数组

聖光之護

发布时间：2026-03-11 23:56:37

876人浏览过

来源于php中文网

原创

本文详解 java 中读取文件整数并去重存入数组的实现方法，重点解决因布尔变量作用域错误导致的重复判断失效问题，并提供健壮、可复用的代码方案。

本文详解 java 中读取文件整数并去重存入数组的实现方法，重点解决因布尔变量作用域错误导致的重复判断失效问题，并提供健壮、可复用的代码方案。

在 Java 中从文件读取整数并仅保留唯一值填充目标数组，是一个常见但易出错的任务。核心挑战在于：如何准确识别并跳过已存在的重复值。原代码逻辑本身合理——遍历已填充部分（list[0..size-1]）检查新读取值是否已存在；但关键缺陷在于 boolean ID = false 被声明在 while 循环外部，导致一旦某次检测到重复，ID 保持 true 状态直至下次显式重置，从而错误地将后续所有合法新值判定为重复。

✅ 正确做法：限定布尔标志的作用域

必须将 ID 声明移至 while 循环内部（即每次处理一个新数值前），确保其每次初始化为 false，独立标记当前值是否为重复：

Dora

创建令人惊叹的3D动画网站，无需编写一行代码。

下载

private static int read(String inFileName, int[] list) {
    int size = 0;
    Scanner inFile = null;
    int trash = 0, unique = 0, dupe = 0, lineCount = 0;

    try {
        inFile = new Scanner(new File(inFileName));
        while (inFile.hasNext()) {
            lineCount++;
            boolean isDuplicate = false; // ✅ 关键修复：每次循环新建，确保初始为 false

            try {
                int val = inFile.nextInt();
                if (val < 0) {
                    trash++;
                    continue;
                }

                // 检查是否已在 list[0..size-1] 中存在
                for (int i = 0; i < size; i++) {
                    if (list[i] == val) {
                        isDuplicate = true;
                        dupe++;
                        break; // ✅ 找到即退出，提升效率
                    }
                }

                // 仅当非重复且数组未满时添加
                if (!isDuplicate && size < list.length) {
                    list[size] = val;
                    size++;
                    unique++;
                }

            } catch (InputMismatchException e) {
                trash++;
                inFile.nextLine(); // 清除错误行，避免死循环
            }
        }
        System.out.printf("Lines: %d | Unique: %d | Duplicates: %d | Invalid/Negative: %d%n", 
                         lineCount, unique, dupe, trash);

    } catch (FileNotFoundException e) {
        System.err.println("Error: Cannot open file '" + inFileName + "'");
        return 0;
    } finally {
        if (inFile != null) inFile.close(); // ✅ 防止资源泄漏
    }

    return size;
}

? 关键改进说明

作用域修正：isDuplicate 在每次迭代开始时重新声明，彻底消除状态残留问题；
提前终止：break 语句在发现重复后立即退出内层循环，避免冗余比较；
资源安全：finally 块中关闭 Scanner，符合 Java 最佳实践；
输出优化：使用 printf 提升日志可读性，并区分“无效/负数”与“重复”两类丢弃数据；
命名规范：采用 isDuplicate（驼峰命名+布尔语义）替代模糊的 ID，增强可维护性。

⚠️ 注意事项与扩展建议

数组容量限制：当前逻辑在 size 动态扩容，或抛出 IllegalArgumentException 明确提示。
性能考量：对大量数据，O(n²) 的线性查找效率较低。可升级为 HashSet
缓存已见值，将查重复杂度降至 O(1)：
```
Set<Integer> seen = new HashSet<>();
// ... 在循环内替换为：if (seen.add(val)) { /* 新值，存入数组 */ }
```
输入鲁棒性：当前仅跳过负数和格式异常，如需支持浮点数、空行、注释等，应增强解析逻辑或使用更成熟的 CSV 解析库。

该方案直击原始 bug 根源，兼顾正确性、可读性与工程健壮性，适用于教学及中小型数据去重场景。

在 Android Java 项目中正确集成 Kotlin 代码的完整配置指南

Java终端颜色重置失效问题：正确使用ANSI转义序列恢复默认文本颜色

Java终端颜色重置失效问题解析与正确实践

在Java中如何避免内存泄漏_Java内存管理最佳实践

Java项目中如何配置Pulsar环境_Apache Pulsar消息发布订阅

相关标签:

java Integer Boolean while printf break 变量作用域循环 Length finally 作用域 bug

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：G1 GC调优指南：避免Old区GC导致Minecraft服务器冻结下一篇：Java中如何将整型数组转为字符串数组_Stream.map与String.valueOf

作者最新文章

如何在页面刷新后持久化保存复选框的选中状态

2026-03-09 13:20

Go 程序中 HTTP 连接复用导致内存持续增长的解决方案

2026-03-09 13:22

Python正则表达式中字符类内连字符（-）的位置规则详解

2026-03-09 13:24

一键启动！KiriGiri发布D加密虚拟机破解启动器

2026-03-09 13:33

Python中批量替换列表中所有匹配元素的正确方法

2026-03-09 13:41

如何在 Pandas 中安全获取首个存在的列值（避免 KeyError）

2026-03-09 13:54

如何在时间类中保留原始输入值以实现准确的总秒数计算

2026-03-09 13:56

《杀戮尖塔2》Steam峰值超57万成2026年首发最高游戏

2026-03-09 13:59

如何在单页中正确结合 AJAX 与 PHP 实现用户名实时校验

2026-03-09 14:01

壹心理如何提问

2026-03-09 14:15

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

java中boolean的用法

在Java中，boolean是一种基本数据类型，它只有两个可能的值：true和false。boolean类型经常用于条件测试，比如进行比较或者检查某个条件是否满足。想了解更多java中boolean的相关内容，可以阅读本专题下面的文章。

367

2023.11.13

java boolean类型

本专题整合了java中boolean类型相关教程，阅读专题下面的文章了解更多详细内容。

2025.11.30

while的用法

while的用法是“while 条件: 代码块”，条件是一个表达式，当条件为真时，执行代码块，然后再次判断条件是否为真，如果为真则继续执行代码块，直到条件为假为止。本专题为大家提供while相关的文章、下载、课程内容，供大家免费下载体验。

106

2023.09.25

printf用法大全

php中文网为大家提供printf用法大全，以及其他printf函数的相关文章、相关下载资源以及各种相关课程，供大家免费下载体验。

2023.06.20

fprintf和printf的区别

fprintf和printf的区别在于输出的目标不同，printf输出到标准输出流，而fprintf输出到指定的文件流。根据需要选择合适的函数来进行输出操作。更多关于fprintf和printf的相关文章详情请看本专题下面的文章。php中文网欢迎大家前来学习。

304

2023.11.28

java中break的作用

本专题整合了java中break的用法教程，阅读专题下面的文章了解更多详细内容。

120

2025.10.15

java break和continue

本专题整合了java break和continue的区别相关内容，阅读专题下面的文章了解更多详细内容。

261

2025.10.24

length函数用法

length函数用于返回指定字符串的字符数或字节数。可以用于计算字符串的长度，以便在查询和处理字符串数据时进行操作和判断。需要注意的是length函数计算的是字符串的字符数，而不是字节数。对于多字节字符集，一个字符可能由多个字节组成。因此，length函数在计算字符串长度时会将多字节字符作为一个字符来计算。更多关于length函数的用法，大家可以阅读本专题下面的文章。

954

2023.09.19

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

2026.03.11

热门下载

网站特效

网站源码

网站素材

前端模板