初始化multiprocessing.Pool时可指定进程数、初始化函数及参数等,建议使用with语句确保资源正确释放。

在 Python 中使用 multiprocessing.Pool 可以方便地实现进程池,用于并行执行多个任务。初始化进程池的关键是理解其参数和工作原理。
基本用法
最简单的进程池初始化方式是调用 Pool() 构造函数,不传参数或指定进程数量:
from multiprocessing import Pool创建一个包含4个进程的进程池
with Pool(4) as pool: result = pool.map(my_function, data)
如果不指定进程数,Pool 会自动根据 CPU 核心数决定,默认值由 os.cpu_count() 提供。
常用初始化参数
Pool 支持多个参数来控制行为:
立即学习“Python免费学习笔记(深入)”;
- processes:要创建的进程数量。建议设为 CPU 核心数或略多一点。
- initializer:每个工作进程启动时调用的初始化函数。
- initargs:传递给 initializer 的参数(元组形式)。
- maxtasksperchild:每个进程最多执行多少个任务后重启,有助于防止内存泄漏。
def init_worker():
print(f"Worker {os.getpid()} starting...")
with Pool(
processes=4,
initializer=init_worker,
maxtasksperchild=10
) as pool:
results = pool.map(task_func, data)
上下文管理与资源释放
推荐使用 with 语句初始化 Pool,这样能确保进程池在使用后正确关闭和清理资源。
如果不用 with,需手动调用 close() 和 join():
pool = Pool(4)
try:
result = pool.map(func, data)
finally:
pool.close() # 不再接收新任务
pool.join() // 等待所有任务完成
直接初始化 Pool 并不立即创建进程,只有在提交任务或显式启动时才会派生子进程。
基本上就这些。初始化 Pool 时不复杂,但要注意进程数设置、资源管理和异常处理。











