0

0

如何在 MPI 中高效传输大型 dtype=object NumPy 数组

心靈之曲

心靈之曲

发布时间:2026-02-02 12:30:02

|

798人浏览过

|

来源于php中文网

原创

如何在 MPI 中高效传输大型 dtype=object NumPy 数组

当使用 mpi4py 的默认通信器发送超大 object 类型 numpy 数组(如包含数十亿元素的浮点数组)时,会因 python pickle 协议限制触发 `overflowerror: integer does not fit in 'int'`;解决方案是启用支持 64 位长度的 `pkl5` 序列化工具

在 MPI 并行计算中,通过 comm.send() / comm.recv() 传输 dtype=object 的 NumPy 数组是一种常见需求——例如,将多个不规则尺寸的子数组打包为一个容器结构分发给工作进程。然而,mpi4py 默认使用基于 Python 3.8 之前 pickle 协议(pkl3)的序列化机制,其消息长度字段采用 C int 类型(通常为 32 位),最大仅支持约 2 GB 的序列化数据(精确上限为 2³¹−1 ≈ 2.15 GB)。一旦待发送对象(含嵌套数组、元数据及序列化开销)总大小超过该阈值,就会抛出 OverflowError: integer XXX does not fit in 'int'。

上述错误在你的示例中明确体现:两个分别占用约 4 GB(500M × 8B)和 8 GB(1000M × 8B)内存的 float64 数组被封装进 object 数组后,序列化体积远超 2 GB,导致底层 MPI 消息长度字段溢出。

推荐解决方案:启用 mpi4py.util.pkl5

pkl5 是 mpi4py 自 3.1.0 版本起提供的增强型序列化模块,它基于 Python 的 PEP 574(pickle protocol 5),原生支持带外(out-of-band)数据与 64 位长度编码,彻底绕过 int 长度限制,可安全传输 TB 级对象。

BlackBox AI
BlackBox AI

AI编程助手,智能对话问答助手

下载

只需两步改造即可修复原代码:

  1. 导入 pkl5 模块;
  2. 将 MPI.COMM_WORLD 包装为 pkl5.Intracomm 实例(保持接口完全兼容)。
import numpy as np
from mpi4py import MPI
from mpi4py.util import pkl5  # ✅ 启用高容量序列化

# 使用 pkl5 包装通信器(API 完全兼容)
comm = pkl5.Intracomm(MPI.COMM_WORLD)
rank = comm.Get_rank()

if rank == 0:
    # 构造超大 object 数组(总内存 >10 GB)
    arr = np.empty(2, dtype=object)
    arr[0] = 1.5 * np.ones(500_000_000, dtype='float64')  # ~4 GB
    arr[1] = 2.5 * np.ones(1_000_000_000, dtype='float64') # ~8 GB

    comm.send(arr, dest=1)
    print(f"[Rank 0] Sent {arr.nbytes} bytes (approx.)")

else:
    received = comm.recv(source=0)  # ✅ 自动使用 pkl5 反序列化
    print(f"[Rank 1] Received {len(received)} objects; "
          f"first array shape: {received[0].shape}, "
          f"second: {received[1].shape}")

⚠️ 重要注意事项:

  • pkl5.Intracomm 仅影响序列化行为,不改变 MPI 通信语义或性能模型;底层仍调用标准 MPI_Send/MPI_Recv,但 payload 编码方式升级。
  • 所有参与通信的进程必须统一使用 pkl5.Intracomm,否则会出现协议不匹配错误。
  • 虽然 pkl5 解决了长度溢出问题,但超大对象传输仍受物理内存与网络带宽制约。生产环境中建议:
    • 优先考虑 零拷贝共享内存(如 mpi4py.util.win 或 SharedMemory)
    • 对真正海量数据,改用 分块发送 + MPI.Sendrecv() 或 Isend/Irecv 非阻塞通信
    • 避免 object 数组,尽可能使用 结构化 dtype 或连续内存布局的多维数组,以获得 MPI 原生支持(如 MPI.DOUBLE 直接传输)。

总结:mpi4py.util.pkl5 是解决大型 dtype=object 数组 MPI 传输瓶颈的标准化、向后兼容方案。它无需修改业务逻辑,仅需一行导入与通信器包装,即可突破传统 pickle 的 2 GB 瓶颈,是科学计算中处理异构大数据集的必备实践。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

523

2023.08.02

int占多少字节
int占多少字节

int占4个字节,意味着一个int变量可以存储范围在-2,147,483,648到2,147,483,647之间的整数值,在某些情况下也可能是2个字节或8个字节,int是一种常用的数据类型,用于表示整数,需要根据具体情况选择合适的数据类型,以确保程序的正确性和性能。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

546

2024.08.29

c++怎么把double转成int
c++怎么把double转成int

本专题整合了 c++ double相关教程,阅读专题下面的文章了解更多详细内容。

133

2025.08.29

C++中int的含义
C++中int的含义

本专题整合了C++中int相关内容,阅读专题下面的文章了解更多详细内容。

200

2025.08.29

c++怎么把double转成int
c++怎么把double转成int

本专题整合了 c++ double相关教程,阅读专题下面的文章了解更多详细内容。

133

2025.08.29

C++中int、float和double的区别
C++中int、float和double的区别

本专题整合了c++中int和double的区别,阅读专题下面的文章了解更多详细内容。

103

2025.10.23

硬盘接口类型介绍
硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍:1、IDE接口是一种并行接口,主要用于连接硬盘和光驱等设备,它主要有两种类型:ATA和ATAPI,IDE接口已经逐渐被SATA接口;2、SATA接口是一种串行接口,相较于IDE接口,它具有更高的传输速度、更低的功耗和更小的体积;3、SCSI接口等等。

1206

2023.10.19

PHP接口编写教程
PHP接口编写教程

本专题整合了PHP接口编写教程,阅读专题下面的文章了解更多详细内容。

235

2025.10.17

AO3官网入口与中文阅读设置 AO3网页版使用与访问
AO3官网入口与中文阅读设置 AO3网页版使用与访问

本专题围绕 Archive of Our Own(AO3)官网入口展开,系统整理 AO3 最新可用官网地址、网页版访问方式、正确打开链接的方法,并详细讲解 AO3 中文界面设置、阅读语言切换及基础使用流程,帮助用户稳定访问 AO3 官网,高效完成中文阅读与作品浏览。

10

2026.02.02

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.4万人学习

Django 教程
Django 教程

共28课时 | 3.8万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号