0

0

Python I/O 密集与 CPU 密集任务选择

冷漠man

冷漠man

发布时间:2026-01-26 19:35:02

|

824人浏览过

|

来源于php中文网

原创

CPU密集任务勿用asyncio,因GIL限制且事件循环反增开销;应改用multiprocessing或run_in_executor;I/O密集任务才适合asyncio,可显著提升并发吞吐。

python i/o 密集与 cpu 密集任务选择

CPU 密集任务别用 asyncio,会白忙活

Python 的 asyncio 本质是单线程协程调度,靠让出控制权实现并发,但无法绕过 GIL。一旦任务进入纯计算(比如矩阵乘法、加密哈希、递归斐波那契),asyncio 不仅不加速,反而因事件循环开销拖慢整体速度。

常见错误现象:async def cpu_bound(): 里调用 sum(range(10**8)),耗时比同步还长;监控显示 CPU 占用率没上去,但线程卡死不动。

  • 正确做法:用 multiprocessingconcurrent.futures.ProcessPoolExecutor
  • 若必须从异步上下文调用 CPU 密集逻辑,用 loop.run_in_executor(None, cpu_func, *args)None 表示使用默认进程池)
  • 注意:进程间数据传递有序列化成本,别传大对象(如未压缩的 numpy.ndarray

I/O 密集任务优先选 asyncio + aiohttp/aiomysql

网络请求、数据库查询、文件读写(尤其带网络存储如 S3)这类操作大部分时间在等响应,asyncio 能在等待期间切走执行其他协程,显著提升吞吐。

典型场景:并发拉取 100 个 API 接口,同步写法要 100×平均延迟,asyncio.gather() 可压缩到接近单次延迟。

立即学习Python免费学习笔记(深入)”;

ChatDOC
ChatDOC

ChatDOC是一款基于chatgpt的文件阅读助手,可以快速从pdf中提取、定位和总结信息

下载
  • 关键参数:设好 timeout 和连接池大小(如 aiohttp.TCPConnector(limit=100)),否则默认限制太紧反成瓶颈
  • 避免混用阻塞调用:不要在 async 函数里直接调 requests.get()time.sleep(),改用 aiohttp.ClientSession.get()asyncio.sleep()
  • 文件 I/O 需注意:open() 是阻塞的,要用 aiofiles 库或把 os.read() 扔进 run_in_executor

怎么快速判断一个任务属于哪一类?看它“卡在哪”

不是看代码行数或函数名,而是观察运行时行为:

  • CPU 密集:top 或任务管理器里 Python 进程持续占满 100% 单核,且无明显系统调用(strace -e trace=network,io 几乎不输出)
  • I/O 密集:Python 进程 CPU 占用低(strace 显示大量 epoll_waitrecvfromread 等系统调用阻塞
  • 混合型(最常见):比如解析 JSON 响应体——网络等待是 I/O,json.loads() 是 CPU。这时应拆开:异步拿响应,再用 run_in_executor 解析

threadingasyncio 别乱混,GIL 下线程对 CPU 密集无效

有人以为“开线程就能并行”,但在 CPython 中,threading 对纯计算毫无帮助,因为所有线程共用 GIL。唯一价值是释放 GIL 的操作(如 time.sleep()requests.get()sqlite3 查询),此时线程和 asyncio 效果接近,但线程更重、难调试。

  • 简单 I/O 并发(≤20 个请求):用 ThreadPoolExecutor 也够用,代码更直白
  • 高并发(≥100)、低延迟要求、需精细控制生命周期(如长连接保活):必须上 asyncio
  • 绝对不要在 async 函数里 thread.start() 后直接 join(),这等于变相同步阻塞

真正容易被忽略的是混合场景下的资源错配:比如用 asyncio 并发拉取 1000 个网页,结果在内存里用 pandas.DataFrame 逐个解析,解析阶段锁死整个事件循环。这时候,I/O 层面的并发优势全被 CPU 阻塞吃掉了。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
硬盘接口类型介绍
硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍:1、IDE接口是一种并行接口,主要用于连接硬盘和光驱等设备,它主要有两种类型:ATA和ATAPI,IDE接口已经逐渐被SATA接口;2、SATA接口是一种串行接口,相较于IDE接口,它具有更高的传输速度、更低的功耗和更小的体积;3、SCSI接口等等。

1974

2023.10.19

PHP接口编写教程
PHP接口编写教程

本专题整合了PHP接口编写教程,阅读专题下面的文章了解更多详细内容。

679

2025.10.17

php8.4实现接口限流的教程
php8.4实现接口限流的教程

PHP8.4本身不内置限流功能,需借助Redis(令牌桶)或Swoole(漏桶)实现;文件锁因I/O瓶颈、无跨机共享、秒级精度等缺陷不适用高并发场景。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2406

2025.12.29

java接口相关教程
java接口相关教程

本专题整合了java接口相关内容,阅读专题下面的文章了解更多详细内容。

49

2026.01.19

线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

766

2023.08.10

数据库三范式
数据库三范式

数据库三范式是一种设计规范,用于规范化关系型数据库中的数据结构,它通过消除冗余数据、提高数据库性能和数据一致性,提供了一种有效的数据库设计方法。本专题提供数据库三范式相关的文章、下载和课程。

390

2023.06.29

如何删除数据库
如何删除数据库

删除数据库是指在MySQL中完全移除一个数据库及其所包含的所有数据和结构,作用包括:1、释放存储空间;2、确保数据的安全性;3、提高数据库的整体性能,加速查询和操作的执行速度。尽管删除数据库具有一些好处,但在执行任何删除操作之前,务必谨慎操作,并备份重要的数据。删除数据库将永久性地删除所有相关数据和结构,无法回滚。

2112

2023.08.14

vb怎么连接数据库
vb怎么连接数据库

在VB中,连接数据库通常使用ADO(ActiveX 数据对象)或 DAO(Data Access Objects)这两个技术来实现:1、引入ADO库;2、创建ADO连接对象;3、配置连接字符串;4、打开连接;5、执行SQL语句;6、处理查询结果;7、关闭连接即可。

359

2023.08.31

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

69

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
MySQL 教程
MySQL 教程

共48课时 | 2.6万人学习

MySQL 初学入门(mosh老师)
MySQL 初学入门(mosh老师)

共3课时 | 0.3万人学习

简单聊聊mysql8与网络通信
简单聊聊mysql8与网络通信

共1课时 | 850人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号