0

0

Python 中基于广度优先搜索 (BFS) 的多层级字典数据提取教程

DDD

DDD

发布时间:2025-10-05 15:53:01

|

548人浏览过

|

来源于php中文网

原创

Python 中基于广度优先搜索 (BFS) 的多层级字典数据提取教程

本文详细介绍了如何使用 Python 的广度优先搜索 (BFS) 算法来遍历和提取嵌套字典中的数据。针对给定起始节点列表和目标节点列表,我们将学习如何按层级(迭代)从字典中抽取相关键值对,直到路径遇到目标节点。教程将提供两种 BFS 实现方案,包括一种优化版本,并深入探讨如何处理图中的循环以及高效利用数据结构。

引言与问题定义

在处理复杂数据结构时,我们经常会遇到将字典视为图(graph)进行遍历的需求。设想我们有一个字典 my_dict,其中键代表节点,值代表其直接邻居节点。我们被赋予一个起始节点列表 source_list 和一个目标节点列表 target_list。任务是:从 source_list 中的每个节点开始,逐层(或称逐迭代)地遍历 my_dict,提取当前层级中与遍历路径相关的键值对,并将它们组织成一个结果字典,其中键是层级编号。遍历路径应在遇到 target_list 中的任何节点时停止。

例如,给定以下数据:

source_list = ['a', 'b']
target_list = ['x', 'y', 'z']
my_dict = {
    'a': ['e'],
    'b': ['f', 'd'],
    'e': ['g'],
    'f': ['t', 'h'],
    'd': ['x'],
    'g': ['x'],
    't': ['y'],
    'h': ['z']
}

我们期望得到如下结果,其中键 0、1、2 代表遍历的层级:

{0: {'a': ['e'], 'b': ['f', 'd']},
 1: {'e': ['g'], 'f': ['t', 'h'], 'd': ['x']},
 2: {'g': ['x'], 't': ['y'], 'h': ['z']}}

这种按层级提取数据的需求,正是广度优先搜索 (BFS) 算法的典型应用场景。

广度优先搜索 (BFS) 基础

广度优先搜索是一种用于遍历或搜索树或图的算法。它从图的根节点(或任意给定节点)开始,首先探索所有邻近的节点,然后是下一层级的邻近节点,依此类推。这使得 BFS 非常适合解决需要“最短路径”或“按层级”遍历的问题。

立即学习Python免费学习笔记(深入)”;

在 Python 中,collections 模块中的 deque(双端队列)是实现 BFS 队列的理想选择,因为它支持高效的从两端添加和移除元素操作。

方案一:标准 BFS 实现

以下是一个基于标准 BFS 算法的解决方案,它能够正确地按层级提取所需数据。

from collections import deque

def bfs_extract_levels(source, target, graph):
    """
    使用广度优先搜索从图中按层级提取数据。

    Args:
        source (list): 起始节点列表。
        target (list): 目标节点列表,遇到这些节点时停止该路径的进一步遍历。
        graph (dict): 表示图的字典,键是节点,值是其邻居列表。

    Returns:
        dict: 一个字典,键是层级编号,值是该层级中提取的节点及其邻居。
    """
    queue = deque((0, node) for node in source)  # 队列存储 (层级, 节点) 对
    target_set = set(target)  # 转换为集合以提高查找效率
    seen = set(source)  # 记录已访问节点,防止循环和重复处理
    result = {}  # 存储最终结果

    while queue:
        level, node = queue.popleft()  # 弹出当前层级和节点

        # 确保当前层级的字典已初始化
        result.setdefault(level, {})

        # 提取当前节点的邻居
        neighbors = graph.get(node, [])
        result[level][node] = neighbors.copy() # 将节点及其邻居添加到结果中

        for neighbor in neighbors:
            # 如果邻居已访问过,或者邻居是目标节点,则不再进一步遍历此路径
            if neighbor in seen or neighbor in target_set:
                continue

            seen.add(neighbor)  # 标记为已访问
            queue.append((level + 1, neighbor))  # 将邻居及其下一层级加入队列

    return result

# 示例数据
source_list = ['a', 'b']
target_list = ['x', 'y', 'z']
my_dict = {
    'a': ['e'],
    'b': ['f', 'd'],
    'e': ['g'],
    'f': ['t', 'h'],
    'd': ['x'],
    'g': ['x'],
    't': ['y'],
    'h': ['z']
}

# 运行并打印结果
output = bfs_extract_levels(source_list, target_list, my_dict)
print(output)

输出:

Tome
Tome

先进的AI智能PPT制作工具

下载
{0: {'a': ['e'], 'b': ['f', 'd']}, 1: {'e': ['g'], 'f': ['t', 'h'], 'd': ['x']}, 2: {'g': ['x'], 't': ['y'], 'h': ['z']}}

关键概念与注意事项

  1. deque 的使用: collections.deque 作为队列,提供了 O(1) 的 append 和 popleft 操作,这对于 BFS 算法的性能至关重要。
  2. target_set: 将 target_list 转换为 set (target_set),使得在判断一个节点是否为目标节点时,查找时间复杂度从 O(N) 降低到 O(1),显著提升效率。
  3. seen 集合: seen 集合用于记录所有已被添加到队列或已处理过的节点。它的主要作用是:
    • 防止循环: 在有向图或无向图中,如果存在循环(例如 a -> b -> a),seen 集合可以防止算法陷入无限循环。
    • 避免重复处理: 确保每个节点只被处理一次,即使它可以通过多条路径到达,从而优化性能。
    • 在每次将邻居加入队列之前,检查 neighbor in seen,如果已存在,则跳过,避免重复路径。
  4. 层级跟踪: 队列中存储 (level, node) 对,使得在弹出节点时可以方便地获取其所在的层级,并将其邻居加入队列时,层级加一。
  5. 停止条件: 当一个 neighbor 位于 target_set 中时,表示这条路径已经到达目标,因此 continue 跳过,不再将该目标节点及其后续节点加入队列。这意味着,target_list 中的节点本身不会被作为“下一层级”的起点,但它们可能出现在当前层级的邻居列表中。

方案二:优化层级构建的 BFS

在某些场景下,为了更清晰地组织代码或针对特定性能需求,我们可以优化层级构建的方式,即在每次循环中处理完一个完整层级的所有节点。

from collections import deque

def build_level_dict(graph, queue, seen, target_set):
    """
    辅助函数:构建当前层级的字典。
    """
    # 标记当前层级队列的末尾,以便知道何时停止处理当前层级
    # 注意:这里假设queue在传入时已经包含了当前层级的所有节点
    # 且这些节点在seen中已标记。
    tail_of_current_level = queue[-1] if queue else None 
    level_dict = {}

    while True:
        if not queue: # 如果队列为空,且没有tail,说明已经处理完所有
            break

        node = queue.popleft()
        neighbors = graph.get(node, [])
        level_dict[node] = neighbors.copy()

        for neighbor in neighbors:
            if neighbor in seen or neighbor in target_set:
                continue
            seen.add(neighbor)
            queue.append(neighbor)

        # 当处理到当前层级的最后一个节点时,返回该层级的字典
        if node == tail_of_current_level:
            return level_dict
    return level_dict # 如果队列为空,直接返回

def bfs_optimized_extract_levels(source, target, graph):
    """
    使用优化后的广度优先搜索从图中按层级提取数据。
    每次循环处理一个完整的层级。
    """
    target_set = set(target)
    result = {}

    # 初始层级的所有节点都标记为已访问,并加入队列
    seen = set(source)
    queue = deque(source)
    level = 0

    while queue:
        # 调用辅助函数构建当前层级的字典
        result[level] = build_level_dict(graph, queue, seen, target_set)
        level += 1

    return result

# 示例数据 (与之前相同)
source_list = ['a', 'b']
target_list = ['x', 'y', 'z']
my_dict = {
    'a': ['e'],
    'b': ['f', 'd'],
    'e': ['g'],
    'f': ['t', 'h'],
    'd': ['x'],
    'g': ['x'],
    't': ['y'],
    'h': ['z']
}

# 运行并打印结果
output_optimized = bfs_optimized_extract_levels(source_list, target_list, my_dict)
print(output_optimized)

输出:

{0: {'a': ['e'], 'b': ['f', 'd']}, 1: {'e': ['g'], 'f': ['t', 'h'], 'd': ['x']}, 2: {'g': ['x'], 't': ['y'], 'h': ['z']}}

优化说明:

这个优化版本通过 build_level_dict 函数,在一个内部循环中处理完当前层级的所有节点。它通过在进入 build_level_dict 时记录队列的 tail(即当前层级最后一个加入队列的节点),来判断何时结束当前层级的处理。当 node == tail_of_current_level 时,表示当前层级的所有节点都已处理完毕,可以返回该层级的 level_dict。这种方式可以使主循环的逻辑更专注于层级递增,而层级内部的细节则由辅助函数封装。在某些情况下,这种结构可能在处理大量节点时略微提高效率,因为它减少了每次弹出节点时对层级变量的更新操作,并更集中地处理一个层级的数据。

总结

本教程详细展示了如何利用 Python 中的广度优先搜索 (BFS) 算法,有效地从一个表示图结构的字典中,按层级提取数据。我们通过两种不同的实现方式,包括一个标准版本和一个优化版本,解决了从 source_list 开始,逐层遍历并收集相关节点及其邻居,直到遇到 target_list 中的节点为止的问题。

核心要点包括:

  • collections.deque 是实现 BFS 队列的最佳选择。
  • seen 集合 对于处理循环图和避免重复访问至关重要。
  • target_set 优化了目标节点的查找效率,并控制了遍历路径的停止。
  • 通过在队列中存储 (level, node) 对,可以轻松跟踪当前的遍历层级。

掌握这些技术,您将能够更灵活地处理复杂的图数据结构,并根据业务需求进行高效的数据提取和组织。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
java break和continue
java break和continue

本专题整合了java break和continue的区别相关内容,阅读专题下面的文章了解更多详细内容。

261

2025.10.24

treenode的用法
treenode的用法

​在计算机编程领域,TreeNode是一种常见的数据结构,通常用于构建树形结构。在不同的编程语言中,TreeNode可能有不同的实现方式和用法,通常用于表示树的节点信息。更多关于treenode相关问题详情请看本专题下面的文章。php中文网欢迎大家前来学习。

549

2023.12.01

C++ 高效算法与数据结构
C++ 高效算法与数据结构

本专题讲解 C++ 中常用算法与数据结构的实现与优化,涵盖排序算法(快速排序、归并排序)、查找算法、图算法、动态规划、贪心算法等,并结合实际案例分析如何选择最优算法来提高程序效率。通过深入理解数据结构(链表、树、堆、哈希表等),帮助开发者提升 在复杂应用中的算法设计与性能优化能力。

30

2025.12.22

深入理解算法:高效算法与数据结构专题
深入理解算法:高效算法与数据结构专题

本专题专注于算法与数据结构的核心概念,适合想深入理解并提升编程能力的开发者。专题内容包括常见数据结构的实现与应用,如数组、链表、栈、队列、哈希表、树、图等;以及高效的排序算法、搜索算法、动态规划等经典算法。通过详细的讲解与复杂度分析,帮助开发者不仅能熟练运用这些基础知识,还能在实际编程中优化性能,提高代码的执行效率。本专题适合准备面试的开发者,也适合希望提高算法思维的编程爱好者。

44

2026.01.06

append用法
append用法

append是一个常用的命令行工具,用于将一个文件的内容追加到另一个文件的末尾。想了解更多append用法相关内容,可以阅读本专题下面的文章。

349

2023.10.25

python中append的用法
python中append的用法

在Python中,append()是列表对象的一个方法,用于向列表末尾添加一个元素。想了解更多append的更多内容,可以阅读本专题下面的文章。

1080

2023.11.14

python中append的含义
python中append的含义

本专题整合了python中append的相关内容,阅读专题下面的文章了解更多详细内容。

186

2025.09.12

页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

497

2023.08.14

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

76

2026.03.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.5万人学习

Django 教程
Django 教程

共28课时 | 5万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号