0

0

Python中二分查找实现数组交集的常见陷阱与优化策略

DDD

DDD

发布时间:2025-11-18 10:34:16

|

861人浏览过

|

来源于php中文网

原创

Python中二分查找实现数组交集的常见陷阱与优化策略

本文深入探讨了在python中使用二分查找算法实现两个数组交集时可能遇到的`typeerror`及一系列逻辑问题。文章详细分析了`list.pop()`方法的错误使用、二分查找前置条件(排序)、结果去重(集合应用)以及搜索范围重置等关键点,并提供了一个修正后的二分查找实现。此外,还介绍了一种更简洁高效的python集合操作替代方案,旨在帮助开发者编写更健壮、高效的代码。

理解问题与初始代码分析

在处理两个整数数组的交集问题时,一种常见的思路是尝试结合二分查找来提高效率。然而,在实际编码过程中,尤其是在对列表进行修改时,很容易引入错误。以下是一个尝试使用二分查找解决此问题的初始代码示例,它在执行时会遇到TypeError:

a = [1,2,2,1]
b = [2,2]

if len(a) > len(b):
    my_list = a
    target = b
else:
    my_list = b
    target = a
ans = []
min_idx = 0 # 将 'min' 重命名为 'min_idx' 以避免与内置函数冲突
max_idx = len(my_list) -1 # 将 'max' 重命名为 'max_idx' 以避免与内置函数冲突

for i in target:
    while min_idx <= max_idx:
        mid = (min_idx + max_idx) // 2
        guess = my_list[mid]
        if guess == i:
            ans.append(guess)
            # 错误点:尝试将pop()的返回值赋给my_list
            my_list = my_list.pop(my_list[mid])
            break # 假设这里会跳出
        if guess < i:
            min_idx = mid + 1
        else:
            max_idx = mid - 1

这段代码旨在通过遍历一个数组(target),并在另一个数组(my_list)中通过二分查找寻找匹配项。当找到匹配项时,将其添加到结果列表ans中,并尝试从my_list中移除该元素。

核心错误解析:TypeError: 'int' object is not subscriptable

代码中出现的TypeError: 'int' object is not subscriptable错误,通常发生在尝试使用索引访问一个非序列类型(如整数)的对象时。在这个特定的案例中,问题出在这一行:

my_list = my_list.pop(my_list[mid])

Python的list.pop()方法用于移除列表中指定索引处的元素,并返回被移除的元素。其正确用法是my_list.pop(index)。

立即学习Python免费学习笔记(深入)”;

一点PPT
一点PPT

一句话生成专业PPT,AI自动排版配图

下载

在上述错误代码中:

  1. my_list[mid]首先被计算,它返回my_list中mid索引处的元素值(一个整数)。
  2. 然后,这个整数值被作为参数传递给my_list.pop()。这意味着my_list.pop(value),而不是my_list.pop(index)。尽管pop()通常期望一个索引,但如果传递的参数是整数,它会尝试将其解释为索引。
  3. 更关键的是,my_list.pop(...)的返回值是被移除的元素(一个整数),而不是修改后的列表本身。
  4. 当执行my_list = my_list.pop(...)时,my_list这个变量被重新赋值为这个被移除的整数。
  5. 在下一次循环迭代中,当代码尝试执行guess = my_list[mid]时,my_list已经是一个整数,而不是一个列表。整数是不可下标(not subscriptable)的,因此引发了TypeError。

正确的移除元素方式应该是直接调用my_list.pop(mid),它会原地修改列表,并且不需要将返回值重新赋给my_list:

my_list.pop(mid) # 正确移除my_list中mid索引处的元素

二分查找实现交点查找的逻辑修正

即使修正了pop()的用法,原始代码仍存在多处逻辑问题,使其无法正确实现数组交集:

  1. 前置条件:列表排序 二分查找算法要求其操作的列表必须是有序的。原始代码中的a = [1,2,2,1]是一个未排序的列表,这会导致二分查找结果不准确。在使用二分查找前,必须对列表进行排序。

  2. 结果去重:使用集合 题目要求返回的交集元素必须是唯一的。将结果存储在list中,如果处理不当,可能会包含重复项。Python的set(集合)数据结构天然支持元素去重,是存储唯一结果的理想选择。

  3. 重置搜索范围 在for i in target:循环中,每次开始对一个新的target元素进行二分查找时,min_idx和max_idx(搜索范围的边界)需要被重置为my_list的完整范围(即0到len(my_list) - 1)。原始代码没有重置这些值,导致后续的二分查找在错误的子范围内进行,从而错过匹配项或产生错误结果。

  4. 找到即停止 一旦在my_list中找到了与target元素i匹配的项,就应该结束当前i的二分查找,并继续处理target中的下一个元素。否则,可能会因为my_list被修改(元素被移除)导致索引错乱,或者在已经找到匹配项后进行不必要的搜索。

综合以上修正,下面是使用二分查找实现数组交集的改进代码:

a = [1, 2, 2, 1]
b = [2, 2]

# 确保my_list是较长的列表,以优化二分查找的性能,但这不是必须的
if len(a) > len(b):
    my_list = a
    target = b
else:
    my_list = b
    target = a

ans = set() # 使用集合存储结果,自动去重
my_list.sort() # 对用于二分查找的列表进行排序

for i in target:
    # 每次对新的target元素进行查找时,重置二分查找的搜索范围
    min_idx = 0
    max_idx = len(my_list) - 1

    while min_idx <= max_idx:
        mid = (min_idx + max_idx) // 2

        # 边界条件检查,防止mid超出my_list当前范围(因为my_list可能被pop修改)
        # 如果mid越界,说明当前搜索范围无效,跳出
        if mid >= len(my_list): 
            break

        guess = my_list[mid]

        if guess == i:
            ans.add(guess) # 将匹配项添加到结果集合
            my_list.pop(mid) # 从my_list中移除该元素,避免重复匹配
            break # 找到匹配后,结束当前target元素的二分查找
        elif guess < i:
            min_idx = mid + 1
        else:
            max_idx = mid - 1

print(list(ans)) # 将结果集合转换为列表输出

注意事项: 在上述修正代码中,虽然解决了TypeError和大部分逻辑问题,但频繁地对my_list进行pop(mid)操作会改变列表的结构,使得后续的二分查找变得复杂且效率低下。每次pop()操作都会导致列表元素移动,len(my_list)也会变化,这使得mid的计算和min_idx/max_idx

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

1051

2023.08.02

int占多少字节
int占多少字节

int占4个字节,意味着一个int变量可以存储范围在-2,147,483,648到2,147,483,647之间的整数值,在某些情况下也可能是2个字节或8个字节,int是一种常用的数据类型,用于表示整数,需要根据具体情况选择合适的数据类型,以确保程序的正确性和性能。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

614

2024.08.29

c++怎么把double转成int
c++怎么把double转成int

本专题整合了 c++ double相关教程,阅读专题下面的文章了解更多详细内容。

335

2025.08.29

C++中int的含义
C++中int的含义

本专题整合了C++中int相关内容,阅读专题下面的文章了解更多详细内容。

235

2025.08.29

treenode的用法
treenode的用法

​在计算机编程领域,TreeNode是一种常见的数据结构,通常用于构建树形结构。在不同的编程语言中,TreeNode可能有不同的实现方式和用法,通常用于表示树的节点信息。更多关于treenode相关问题详情请看本专题下面的文章。php中文网欢迎大家前来学习。

550

2023.12.01

C++ 高效算法与数据结构
C++ 高效算法与数据结构

本专题讲解 C++ 中常用算法与数据结构的实现与优化,涵盖排序算法(快速排序、归并排序)、查找算法、图算法、动态规划、贪心算法等,并结合实际案例分析如何选择最优算法来提高程序效率。通过深入理解数据结构(链表、树、堆、哈希表等),帮助开发者提升 在复杂应用中的算法设计与性能优化能力。

30

2025.12.22

深入理解算法:高效算法与数据结构专题
深入理解算法:高效算法与数据结构专题

本专题专注于算法与数据结构的核心概念,适合想深入理解并提升编程能力的开发者。专题内容包括常见数据结构的实现与应用,如数组、链表、栈、队列、哈希表、树、图等;以及高效的排序算法、搜索算法、动态规划等经典算法。通过详细的讲解与复杂度分析,帮助开发者不仅能熟练运用这些基础知识,还能在实际编程中优化性能,提高代码的执行效率。本专题适合准备面试的开发者,也适合希望提高算法思维的编程爱好者。

45

2026.01.06

treenode的用法
treenode的用法

​在计算机编程领域,TreeNode是一种常见的数据结构,通常用于构建树形结构。在不同的编程语言中,TreeNode可能有不同的实现方式和用法,通常用于表示树的节点信息。更多关于treenode相关问题详情请看本专题下面的文章。php中文网欢迎大家前来学习。

550

2023.12.01

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

26

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.5万人学习

Django 教程
Django 教程

共28课时 | 5万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号