0

0

Python 线程池与进程池的使用取舍

冰川箭仙

冰川箭仙

发布时间:2026-01-29 12:11:10

|

713人浏览过

|

来源于php中文网

原创

CPU密集型任务用ProcessPoolExecutor,I/O密集型用ThreadPoolExecutor;max_workers需按负载类型调优;线程共享内存需锁保护,进程间不共享需Manager;异常在result()才抛出,cancel()对进程基本无效。

python 线程池与进程池的使用取舍

什么时候该用 ThreadPoolExecutor 而不是 ProcessPoolExecutor

CPU 密集型任务(如数值计算、图像处理)用 ProcessPoolExecutor,I/O 密集型任务(如 HTTP 请求、文件读写)用 ThreadPoolExecutor。Python 的 GIL 会让多线程在 CPU 密集场景下几乎不提速,而多进程能真正并行。

常见误判点:

  • 误把“耗时长”等同于“CPU 密集”——比如压缩一个大文件看似耗时,但实际是 I/O + 少量 CPU,ThreadPoolExecutor 可能更轻量;
  • 在 Web 爬虫中混用同步阻塞库(如 requests)和 ProcessPoolExecutor,反而因进程启动开销和序列化成本变慢;
  • 未考虑对象可序列化性:传给 ProcessPoolExecutor 的函数和参数必须能被 pickle,闭包、lambda、类实例方法常直接报 AttributeError: Can't pickle local object

max_workers 设多少才合理

ThreadPoolExecutormax_workers 默认是 min(32, (os.cpu_count() or 1) + 4),但这个值对 I/O 任务往往偏小;ProcessPoolExecutor 默认是 os.cpu_count(),对 CPU 密集任务通常够用。

调优建议:

立即学习Python免费学习笔记(深入)”;

  • I/O 密集:从 10–100 开始试,观察系统连接数、线程上下文切换频率(pidstat -t)、目标服务限流响应;
  • CPU 密集:一般不超过 os.cpu_count(),超了反而因调度竞争降低吞吐;
  • 混合负载(如先请求再计算):优先拆成两层——用线程池做 I/O,结果交给进程池计算,避免单池承担两类压力。

共享状态与资源竞争怎么避坑

线程间共享内存,进程间默认不共享——这是最易出错的分水岭。

Draft&Goal-Detector
Draft&Goal-Detector

检测文本是由 AI 还是人类编写的

下载

典型陷阱:

  • 在线程池里修改全局变量或类属性,可能引发竞态,需加 threading.Lock
  • 在进程池里试图修改主进程的列表、字典,修改不会回传(每个进程有独立内存副本),要用 multiprocessing.Manager 或显式返回+合并;
  • 数据库连接、文件句柄不能跨进程复用:ProcessPoolExecutor 中每个子进程需自行初始化连接,否则报 sqlite3.ProgrammingError: SQLite objects created in a thread can only be used in that same thread 类错误;
  • 日志写入冲突:多个线程/进程同时写同一文件,需用 logging.handlers.RotatingFileHandler 配合 delay=True,或改用支持并发的日志库(如 concurrent-log-handler)。

异常传播与任务取消的实际表现

submit() 返回的 Future 对象,在调用 result() 时才会抛出子线程/子进程里的异常——这点常被忽略,导致错误静默丢失。

关键差异:

  • 线程池中未捕获异常会终止该线程,但不影响其他任务;
  • 进程池中子进程崩溃(如段错误、SystemExit)会导致 Future.result() 抛出 BrokenProcessPool,整个池不可再用;
  • Future.cancel() 在线程池中成功率高,在进程池中基本无效——因为 Python 无法强制终止 OS 进程,只能标记“不执行”,若任务已开始,会继续跑完;
  • 想实现超时控制,统一用 future.result(timeout=5),别依赖 cancel()

真正难处理的是子进程内发生的 C 扩展崩溃、死循环或阻塞系统调用,这类问题没有银弹,得靠外部监控或封装为带信号超时的子进程(如 subprocess.run(..., timeout=...))来兜底。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
全局变量怎么定义
全局变量怎么定义

本专题整合了全局变量相关内容,阅读专题下面的文章了解更多详细内容。

78

2025.09.18

python 全局变量
python 全局变量

本专题整合了python中全局变量定义相关教程,阅读专题下面的文章了解更多详细内容。

96

2025.09.18

lambda表达式
lambda表达式

Lambda表达式是一种匿名函数的简洁表示方式,它可以在需要函数作为参数的地方使用,并提供了一种更简洁、更灵活的编码方式,其语法为“lambda 参数列表: 表达式”,参数列表是函数的参数,可以包含一个或多个参数,用逗号分隔,表达式是函数的执行体,用于定义函数的具体操作。本专题为大家提供lambda表达式相关的文章、下载、课程内容,供大家免费下载体验。

207

2023.09.15

python lambda函数
python lambda函数

本专题整合了python lambda函数用法详解,阅读专题下面的文章了解更多详细内容。

191

2025.11.08

Python lambda详解
Python lambda详解

本专题整合了Python lambda函数相关教程,阅读下面的文章了解更多详细内容。

53

2026.01.05

线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

503

2023.08.10

Python 多线程与异步编程实战
Python 多线程与异步编程实战

本专题系统讲解 Python 多线程与异步编程的核心概念与实战技巧,包括 threading 模块基础、线程同步机制、GIL 原理、asyncio 异步任务管理、协程与事件循环、任务调度与异常处理。通过实战示例,帮助学习者掌握 如何构建高性能、多任务并发的 Python 应用。

166

2025.12.24

java多线程相关教程合集
java多线程相关教程合集

本专题整合了java多线程相关教程,阅读专题下面的文章了解更多详细内容。

14

2026.01.21

Golang 网络安全与加密实战
Golang 网络安全与加密实战

本专题系统讲解 Golang 在网络安全与加密技术中的应用,包括对称加密与非对称加密(AES、RSA)、哈希与数字签名、JWT身份认证、SSL/TLS 安全通信、常见网络攻击防范(如SQL注入、XSS、CSRF)及其防护措施。通过实战案例,帮助学习者掌握 如何使用 Go 语言保障网络通信的安全性,保护用户数据与隐私。

2

2026.01.29

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.3万人学习

Django 教程
Django 教程

共28课时 | 3.6万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号