0

0

如何在含重复元素的百万级有序整数数组中高效定位缺失数字

心靈之曲

心靈之曲

发布时间:2026-03-03 12:53:12

|

349人浏览过

|

来源于php中文网

原创

如何在含重复元素的百万级有序整数数组中高效定位缺失数字

本文介绍一种时间复杂度为 o(n)、实际性能优异的线性扫描法,用于在已排序但含重复元素的大规模整数数组中精准定位首个缺失正整数(如序列应为连续递增,但存在一个空缺且可能夹杂重复值)。

本文介绍一种时间复杂度为 o(n)、实际性能优异的线性扫描法,用于在已排序但含重复元素的大规模整数数组中精准定位首个缺失正整数(如序列应为连续递增,但存在一个空缺且可能夹杂重复值)。

在处理大规模有序数据时,直觉常倾向于采用二分查找以追求 O(log n) 的理论效率。然而,当数组中存在重复元素时,标准二分策略会失效:因为缺失数字与重复数字可能共存于同一子区间,导致无法通过局部差值或计数准确判断哪一侧包含缺失值——例如 [1,2,2,4,5] 中缺失 3,但左半段 [1,2,2] 与右半段 [4,5] 均无法单靠长度或端点差排除缺失可能性。此时,任何试图“剪枝”的分治逻辑都将退化为全量检查,反而增加分支开销。

幸运的是,线性扫描在此场景下不仅是可行的,更是最优实践。原因在于:

  • 数组已严格升序排列,缺失必体现为相邻两元素之差 ≥ 2;
  • 只需一次遍历,检测 ar[i] - ar[i-1] == 2 即可锁定缺失值 ar[i] - 1;
  • 现代 CPU 对连续内存访问高度优化,百万至千万级整数数组的遍历耗时极低(实测 1000 万元素平均仅约 5ms);
  • 空间复杂度稳定为 O(1),无额外内存分配压力。

以下是核心实现(Java):

LibLib AI
LibLib AI

中国领先原创AI模型分享社区,拥有LibLib等于拥有了超多模型的模型库、免费的在线生图工具,不考虑配置的模型训练工具

下载
public static int findFirstMissing(int[] arr) {
    if (arr == null || arr.length < 2) return -1;

    for (int i = 1; i < arr.length; i++) {
        int diff = arr[i] - arr[i - 1];
        if (diff == 2) {
            return arr[i] - 1; // 缺失的整数
        }
        // 若 diff > 2(如 [1,5]),说明缺失多个数,按题意取首个:arr[i-1] + 1
        if (diff > 2) {
            return arr[i - 1] + 1;
        }
        // diff == 1:正常连续;diff == 0:重复(忽略);diff < 0:违反升序前提,可加校验
    }
    return -1; // 未找到缺失
}

关键注意事项

  • 前提强依赖有序性:算法仅适用于严格非递减(推荐升序)数组。若输入无序,须先排序(O(n log n)),此时二分预处理才可能有意义,但整体效率反低于直接线性扫描原数组。
  • ⚠️ 边界鲁棒性:示例代码假设序列从正整数开始且缺失发生在内部。若需支持任意起始值(如从 start 开始),可初始化 expected = arr[0] + 1,遍历时比对 arr[i] != expected 并动态更新 expected。
  • ? 不解决多缺失/全局统计:本方法返回首个缺失值。如需全部缺失数,可改为收集所有 diff > 1 处的间隙;若需判断是否“完全连续”,则检查 diff 是否恒为 1 或 0。
  • ? 性能实证:在主流 JVM(HotSpot)及 SSD 内存环境下,10^7 规模数组遍历稳定在 5–10ms 内,远快于任何通用库的抽象开销,也规避了哈希集(O(n) 空间)或位图(需已知值域范围)的局限性。

综上,面对“有序+重复+大规模”这一特定组合,放弃过度设计的分治幻想,拥抱简洁、可靠、贴近硬件特性的线性扫描,是工程实践中最务实的高性能解法。

相关标签:

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

485

2023.08.14

C++高性能网络编程与Reactor模型实践
C++高性能网络编程与Reactor模型实践

本专题围绕 C++ 在高性能网络服务开发中的应用展开,深入讲解 Socket 编程、多路复用机制、Reactor 模型设计原理以及线程池协作策略。内容涵盖 epoll 实现机制、内存管理优化、连接管理策略与高并发场景下的性能调优方法。通过构建高并发网络服务器实战案例,帮助开发者掌握 C++ 在底层系统与网络通信领域的核心技术。

0

2026.03.03

Golang 测试体系与代码质量保障:工程级可靠性建设
Golang 测试体系与代码质量保障:工程级可靠性建设

Go语言测试体系与代码质量保障聚焦于构建工程级可靠性系统。本专题深入解析Go的测试工具链(如go test)、单元测试、集成测试及端到端测试实践,结合代码覆盖率分析、静态代码扫描(如go vet)和动态分析工具,建立全链路质量监控机制。通过自动化测试框架、持续集成(CI)流水线配置及代码审查规范,实现测试用例管理、缺陷追踪与质量门禁控制,确保代码健壮性与可维护性,为高可靠性工程系统提供质量保障。

65

2026.02.28

Golang 工程化架构设计:可维护与可演进系统构建
Golang 工程化架构设计:可维护与可演进系统构建

Go语言工程化架构设计专注于构建高可维护性、可演进的企业级系统。本专题深入探讨Go项目的目录结构设计、模块划分、依赖管理等核心架构原则,涵盖微服务架构、领域驱动设计(DDD)在Go中的实践应用。通过实战案例解析接口抽象、错误处理、配置管理、日志监控等关键工程化技术,帮助开发者掌握构建稳定、可扩展Go应用的最佳实践方法。

57

2026.02.28

Golang 性能分析与运行时机制:构建高性能程序
Golang 性能分析与运行时机制:构建高性能程序

Go语言以其高效的并发模型和优异的性能表现广泛应用于高并发、高性能场景。其运行时机制包括 Goroutine 调度、内存管理、垃圾回收等方面,深入理解这些机制有助于编写更高效稳定的程序。本专题将系统讲解 Golang 的性能分析工具使用、常见性能瓶颈定位及优化策略,并结合实际案例剖析 Go 程序的运行时行为,帮助开发者掌握构建高性能应用的关键技能。

44

2026.02.28

Golang 并发编程模型与工程实践:从语言特性到系统性能
Golang 并发编程模型与工程实践:从语言特性到系统性能

本专题系统讲解 Golang 并发编程模型,从语言级特性出发,深入理解 goroutine、channel 与调度机制。结合工程实践,分析并发设计模式、性能瓶颈与资源控制策略,帮助将并发能力有效转化为稳定、可扩展的系统性能优势。

23

2026.02.27

Golang 高级特性与最佳实践:提升代码艺术
Golang 高级特性与最佳实践:提升代码艺术

本专题深入剖析 Golang 的高级特性与工程级最佳实践,涵盖并发模型、内存管理、接口设计与错误处理策略。通过真实场景与代码对比,引导从“可运行”走向“高质量”,帮助构建高性能、可扩展、易维护的优雅 Go 代码体系。

20

2026.02.27

Golang 测试与调试专题:确保代码可靠性
Golang 测试与调试专题:确保代码可靠性

本专题聚焦 Golang 的测试与调试体系,系统讲解单元测试、表驱动测试、基准测试与覆盖率分析方法,并深入剖析调试工具与常见问题定位思路。通过实践示例,引导建立可验证、可回归的工程习惯,从而持续提升代码可靠性与可维护性。

4

2026.02.27

漫蛙app官网链接入口
漫蛙app官网链接入口

漫蛙App官网提供多条稳定入口,包括 https://manwa.me、https

336

2026.02.27

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号