0

0

# 并行执行 Jupyter Notebook 中的任务队列

花韻仙語

花韻仙語

发布时间:2025-08-17 22:44:28

|

482人浏览过

|

来源于php中文网

原创

# 并行执行 Jupyter Notebook 中的任务队列

在 Jupyter Notebook 中实现并行任务队列,以在不阻塞 Notebook 界面的情况下执行耗时较长的函数。通过使用 `concurrent.futures.ThreadPoolExecutor` 和 `ipywidgets.Output`,可以实现任务的异步执行和结果的实时显示,同时避免了常见的序列化和作用域问题。 ## 使用 ThreadPoolExecutor 实现并行任务 在 Jupyter Notebook 中并行执行任务,同时保持 Notebook 的响应性,是一个常见的需求。`concurrent.futures.ThreadPoolExecutor` 提供了一种简单有效的方法来实现这一点。结合 `ipywidgets.Output`,我们可以将任务的输出实时显示在 Notebook 中。 ### 核心代码 以下代码展示了如何使用 `ThreadPoolExecutor` 和 `ipywidgets.Output` 来实现并行任务队列: ```python import sys import asyncio import concurrent.futures import ipywidgets threadpool = concurrent.futures.ThreadPoolExecutor(4) def run(fn, *args, **kwds): "run fn in threadpool" out = ipywidgets.Output() def print(*args, file=sys.stdout): line = ' '.join(map(str, args)) + '\n' if file is sys.stderr: out.append_stderr(line) else: out.append_stdout(line) def done(fut: asyncio.Future): try: result = fut.result() except asyncio.CancelledError: print("cancelled", fut, file=sys.stderr) except Exception: print("failed", fut, file=sys.stderr) else: print("completed", fut) async def go(): loop = asyncio.get_running_loop() return await loop.run_in_executor( threadpool, lambda: fn(print, *args, **kwds), ) task = asyncio.create_task(go()) task.add_done_callback(done) return out

代码解释

  1. 导入必要的库:

    • sys: 用于访问系统相关的参数和函数。
    • asyncio: 用于编写并发代码。
    • concurrent.futures: 用于异步执行任务。
    • ipywidgets: 用于在 Jupyter Notebook 中创建交互式控件。
  2. 创建 ThreadPoolExecutor:

    threadpool = concurrent.futures.ThreadPoolExecutor(4)

    这行代码创建了一个包含 4 个线程的线程池。可以根据实际需求调整线程数量。

  3. run 函数:

    run 函数是核心,它负责将任务提交到线程池并处理输出。

    • out = ipywidgets.Output(): 创建一个 Output 控件,用于显示任务的输出。
    • print 函数重定向: 重新定义 print 函数,使其将输出发送到 Output 控件。
    • done 函数: 定义一个回调函数,在任务完成后执行,用于处理任务的结果或异常。
    • go 协程: 创建一个异步协程,使用 loop.run_in_executor 将任务提交到线程池。
    • asyncio.create_task: 创建一个 asyncio 任务来运行 go 协程。
    • task.add_done_callback: 将 done 函数添加到任务的回调列表中,以便在任务完成后执行。

示例用法

以下代码展示了如何使用 run 函数来执行一个耗时的函数:

MusicAI
MusicAI

AI音乐生成工具

下载
import time

def cpu_bound(print, dt, fail=False):
    for i in range(10):
        time.sleep(dt)
        print(i, time.time())
    if fail:
        1 / 0
    return "done"

run(cpu_bound, 0.1)

示例代码解释

  • cpu_bound 函数模拟一个耗时的 CPU 密集型任务。它接受一个 print 函数作为参数,用于将输出发送到 Output 控件。
  • run(cpu_bound, 0.1) 将 cpu_bound 函数提交到线程池,并传递 0.1 作为 dt 参数,表示每次循环暂停 0.1 秒。

错误处理

done 函数中包含了错误处理逻辑,可以捕获任务执行过程中发生的异常,并将错误信息输出到 Output 控件。

run(cpu_bound, 0.5, fail=True)

在这个例子中,fail=True 会导致 cpu_bound 函数抛出一个 ZeroDivisionError 异常,done 函数会捕获这个异常并将错误信息输出到 Output 控件。

注意事项

  • 避免共享可变状态: 在多线程环境中,共享可变状态可能会导致数据竞争和死锁。尽量避免在任务之间共享可变状态。如果必须共享,请使用适当的同步机制,例如锁。
  • 选择合适的线程池大小: 线程池的大小应该根据实际情况进行调整。如果任务是 CPU 密集型的,线程池的大小应该接近 CPU 的核心数量。如果任务是 IO 密集型的,线程池的大小可以大于 CPU 的核心数量。
  • 序列化问题: 由于 multiprocessing 模块使用 pickle 进行序列化,因此某些对象可能无法被序列化。concurrent.futures.ThreadPoolExecutor 不存在此问题。

总结

通过使用 concurrent.futures.ThreadPoolExecutor 和 ipywidgets.Output,可以在 Jupyter Notebook 中轻松实现并行任务队列,从而提高 Notebook 的响应性和执行效率。这种方法避免了使用 multiprocessing 模块时可能遇到的序列化问题,并且可以在 Notebook 中实时显示任务的输出。

					

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
python中print函数的用法
python中print函数的用法

python中print函数的语法是“print(value1, value2, ..., sep=' ', end=' ', file=sys.stdout, flush=False)”。本专题为大家提供print相关的文章、下载、课程内容,供大家免费下载体验。

193

2023.09.27

python print用法与作用
python print用法与作用

本专题整合了python print的用法、作用、函数功能相关内容,阅读专题下面的文章了解更多详细教程。

19

2026.02.03

if什么意思
if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词,用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章,供大家免费阅读。

847

2023.08.22

lambda表达式
lambda表达式

Lambda表达式是一种匿名函数的简洁表示方式,它可以在需要函数作为参数的地方使用,并提供了一种更简洁、更灵活的编码方式,其语法为“lambda 参数列表: 表达式”,参数列表是函数的参数,可以包含一个或多个参数,用逗号分隔,表达式是函数的执行体,用于定义函数的具体操作。本专题为大家提供lambda表达式相关的文章、下载、课程内容,供大家免费下载体验。

215

2023.09.15

python lambda函数
python lambda函数

本专题整合了python lambda函数用法详解,阅读专题下面的文章了解更多详细内容。

193

2025.11.08

Python lambda详解
Python lambda详解

本专题整合了Python lambda函数相关教程,阅读下面的文章了解更多详细内容。

61

2026.01.05

线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

766

2023.08.10

Python 多线程与异步编程实战
Python 多线程与异步编程实战

本专题系统讲解 Python 多线程与异步编程的核心概念与实战技巧,包括 threading 模块基础、线程同步机制、GIL 原理、asyncio 异步任务管理、协程与事件循环、任务调度与异常处理。通过实战示例,帮助学习者掌握 如何构建高性能、多任务并发的 Python 应用。

377

2025.12.24

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

49

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.5万人学习

Django 教程
Django 教程

共28课时 | 5万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号