0

0

mongodb如何存numpy数组

舞姬之光

舞姬之光

发布时间:2025-11-13 18:44:04

|

284人浏览过

|

来源于php中文网

原创

答案:存储NumPy数组需转换格式,小数组可用tolist()转为列表,大数组推荐用np.save序列化为二进制并存dtype和shape,或通过自定义编码器处理类型。

mongodb如何存numpy数组

在使用 MongoDB 存储 NumPy 数组时,由于 MongoDB 原生不支持 NumPy 的 ndarray 类型,需要先将其转换为 MongoDB 可识别的格式。以下是几种常用方法。

1. 转换为 Python 列表存储

最简单的方式是将 NumPy 数组通过 .tolist() 方法转为 Python 列表,MongoDB 可以直接存储列表结构。

示例代码:

import numpy as np
from pymongo import MongoClient
<h1>创建 NumPy 数组</h1><p>arr = np.array([[1, 2], [3, 4]])</p><h1>转为列表并插入 MongoDB</h1><p>client = MongoClient("mongodb://localhost:27017/")
db = client["test_db"]
collection = db["arrays"]</p><p>collection.insert_one({"name": "matrix", "data": arr.tolist()})

读取时再用 np.array() 恢复:

doc = collection.find_one({"name": "matrix"})
restored_arr = np.array(doc["data"])
print(restored_arr)  # 输出: [[1 2] [3 4]]

2. 序列化为二进制(推荐用于大数组)

对于大型数组,转为列表可能效率低且占用空间大。可以使用 numpy.saveio.BytesIO 将数组序列化为二进制数据存储。

示例代码:

import numpy as np
import io
from pymongo import MongoClient
<p>arr = np.random.rand(1000, 1000)  # 大数组示例</p><div class="aritcle_card flexRow">
                                                        <div class="artcardd flexRow">
                                                                <a class="aritcle_card_img" href="/ai/1837" title="Mokker AI"><img
                                                                                src="https://img.php.cn/upload/ai_manual/000/969/633/68b6c9b25e117919.png" alt="Mokker AI"  onerror="this.onerror='';this.src='/static/lhimages/moren/morentu.png'" ></a>
                                                                <div class="aritcle_card_info flexColumn">
                                                                        <a href="/ai/1837" title="Mokker AI">Mokker AI</a>
                                                                        <p>AI产品图添加背景</p>
                                                                </div>
                                                                <a href="/ai/1837" title="Mokker AI" class="aritcle_card_btn flexRow flexcenter"><b></b><span>下载</span> </a>
                                                        </div>
                                                </div><h1>转为二进制</h1><p>buffer = io.BytesIO()
np.save(buffer, arr)
binary_data = buffer.getvalue()</p><h1>存入 MongoDB</h1><p>collection.insert_one({
"name": "large_array",
"data": binary_data,
"dtype": str(arr.dtype),
"shape": arr.shape
})

读取时反序列化:

doc = collection.find_one({"name": "large_array"})
loaded_buffer = io.BytesIO(doc["data"])
restored_arr = np.load(loaded_buffer)

注意:需同时保存 dtypeshape 信息以便还原(虽然 np.save/np.load 自带这些信息,但显式保存便于调试)。

3. 使用 BSON 编码扩展(可选)

MongoDB 使用 BSON 格式,可通过自定义编码器支持 NumPy 类型。例如使用 bson 模块配合类型转换。

常见做法是在插入前统一处理 NumPy 类型:

def convert_numpy_types(obj):
    if isinstance(obj, np.ndarray):
        return obj.tolist()
    elif isinstance(obj, (np.int64, np.int32)):
        return int(obj)
    elif isinstance(obj, (np.float64, np.float32)):
        return float(obj)
    return obj

然后在插入前递归处理字典数据。

总结建议

小数组用 tolist() 最方便;大数组推荐二进制存储,节省空间且保留精度;生产环境注意字段命名清晰,并考虑查询需求。读写时做好类型恢复逻辑。

基本上就这些,按实际场景选择合适方式即可。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
C++类型转换方式
C++类型转换方式

本专题整合了C++类型转换相关内容,想了解更多相关内容,请阅读专题下面的文章。

320

2025.07.15

mongodb和mysql的区别
mongodb和mysql的区别

mongodb和mysql的区别:1、数据模型;2、查询语言;3、扩展性和性能;4、可靠性。本专题为大家提供mongodb和mysql的区别的相关的文章、下载、课程内容,供大家免费下载体验。

287

2023.07.18

mongodb启动命令
mongodb启动命令

MongoDB 是一种开源的、基于文档的 NoSQL 数据库管理系统。本专题提供mongodb启动命令的文章,希望可以帮到大家。

267

2023.08.08

MongoDB删除数据的方法
MongoDB删除数据的方法

MongoDB删除数据的方法有删除集合中的文档、删除整个集合、删除数据库和删除指定字段等。本专题为大家提供MongoDB相关的文章、下载、课程内容,供大家免费下载体验。

161

2023.09.19

常用的数据库软件
常用的数据库软件

常用的数据库软件有MySQL、Oracle、SQL Server、PostgreSQL、MongoDB、Redis、Cassandra、Hadoop、Spark和Amazon DynamoDB。更多关于数据库软件的内容详情请看本专题下面的文章。php中文网欢迎大家前来学习。

1007

2023.11.02

mongodb有哪些应用领域
mongodb有哪些应用领域

mongodb 的应用领域涵盖广泛,包括内容管理系统、社交媒体、分析、移动应用、物联网、金融科技、医疗保健和广告技术等领域,因其灵活性、可扩展性和易用性而广受欢迎。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

345

2024.04.02

mongodb和redis哪个读取速度快
mongodb和redis哪个读取速度快

redis 的读取速度比 mongodb 更快。原因包括:1. redis 使用简单的键值存储,而 mongodb 存储 json 格式的数据,需要解析和反序列化。2. redis 使用哈希表快速查找数据,而 mongodb 使用 b-tree 索引。因此,redis 在需要高性能读取操作的应用程序中是一个更好的选择。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

501

2024.04.02

mongodb安装失败如何彻底删除
mongodb安装失败如何彻底删除

彻底删除 mongodb 安装失败的步骤:1、停止和禁用 mongodb 服务;2、删除配置文件、数据目录和日志文件;3、删除 mongodb 二进制文件;4、卸载 mongodb 套件(如果通过软件包管理器安装);5、删除 mongodb 用户、组和目录;6、重启系统。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

381

2024.04.02

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

3

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.5万人学习

Django 教程
Django 教程

共28课时 | 5万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号