0

0

如何在 Qdrant 中安全地向现有图像集合追加新数据而不清空旧数据

碧海醫心

碧海醫心

发布时间:2026-02-01 10:08:01

|

162人浏览过

|

来源于php中文网

原创

如何在 Qdrant 中安全地向现有图像集合追加新数据而不清空旧数据

qdrant 支持动态扩展现有集合,无需重建数据库;关键在于避免使用 recreate_collection,改用 create_collection(仅首次调用),并确保新增记录使用唯一 id。

在使用 Qdrant 进行图像相似性搜索时,一个常见误区是误将 recreate_collection() 当作“初始化或更新集合”的通用方法。实际上,recreate_collection 会无条件删除已有同名集合及其全部数据,再新建空集合——这正是您每次运行脚本时旧图像丢失的根本原因。

✅ 正确做法:创建一次,持续追加

您应当将集合创建与数据插入逻辑分离:

  • 首次运行:调用 create_collection() 创建集合(需确保集合尚不存在);
  • 后续运行:跳过创建步骤,直接调用 upload_records() 或 upsert_points() 追加新向量与元数据;
  • 关键保障:所有插入记录的 id 必须全局唯一(例如使用 UUID、哈希文件路径或自增序列),避免因 ID 冲突导致覆盖或报错。

以下是修正后的核心逻辑片段(适配您的 image_to_database 方法):

ClipDrop Relight
ClipDrop Relight

ClipDrop推出的AI图片图像打光工具

下载
# ✅ 替换原来的 recreate_collection 调用
if not qclient.collection_exists(collection_name):
    qclient.create_collection(
        collection_name=collection_name,
        vectors_config=VectorParams(
            size=embedding_length,
            distance=Distance.COSINE
        )
    )
    print(f"✅ Collection '{collection_name}' created.")
else:
    print(f"ℹ️ Collection '{collection_name}' already exists. Skipping creation.")

# ✅ 为每条新记录生成唯一 ID(推荐使用 UUID)
import uuid
records = [
    models.Record(
        id=str(uuid.uuid4()),  # ← 关键:确保每次插入 ID 唯一
        payload=payload_dicts[idx],
        vector=embeddings[idx].tolist()  # 注意:.tolist() 确保为 Python list,非 torch.Tensor
    )
    for idx in range(len(payload_dicts))
]

# ✅ 使用 upload_records 追加(自动去重 ID,不覆盖已有数据)
qclient.upload_records(
    collection_name=collection_name,
    records=records
)

⚠️ 注意事项与最佳实践

  • 向量类型兼容性:确保新增向量维度(size)与原始集合完全一致,否则 upload_records 将报错;
  • ID 冲突风险:若重复使用相同整数 ID(如 idx),新记录将覆盖旧记录——务必使用不可预测/全局唯一的 ID;
  • 批量性能优化:单次 upload_records 可处理数千条记录;如需高频小批量插入,可改用 upsert_points;
  • 生产环境建议:将集合初始化逻辑抽离为独立脚本或增加幂等检查(如 collection_exists),避免部署时误删数据。

通过以上调整,您即可实现图像库的平滑演进:无论何时新增图片,只需运行同一段代码,历史数据毫发无损,真正发挥 Qdrant 作为向量数据库的持久化与扩展能力。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
数据库三范式
数据库三范式

数据库三范式是一种设计规范,用于规范化关系型数据库中的数据结构,它通过消除冗余数据、提高数据库性能和数据一致性,提供了一种有效的数据库设计方法。本专题提供数据库三范式相关的文章、下载和课程。

360

2023.06.29

如何删除数据库
如何删除数据库

删除数据库是指在MySQL中完全移除一个数据库及其所包含的所有数据和结构,作用包括:1、释放存储空间;2、确保数据的安全性;3、提高数据库的整体性能,加速查询和操作的执行速度。尽管删除数据库具有一些好处,但在执行任何删除操作之前,务必谨慎操作,并备份重要的数据。删除数据库将永久性地删除所有相关数据和结构,无法回滚。

2083

2023.08.14

vb怎么连接数据库
vb怎么连接数据库

在VB中,连接数据库通常使用ADO(ActiveX 数据对象)或 DAO(Data Access Objects)这两个技术来实现:1、引入ADO库;2、创建ADO连接对象;3、配置连接字符串;4、打开连接;5、执行SQL语句;6、处理查询结果;7、关闭连接即可。

349

2023.08.31

MySQL恢复数据库
MySQL恢复数据库

MySQL恢复数据库的方法有使用物理备份恢复、使用逻辑备份恢复、使用二进制日志恢复和使用数据库复制进行恢复等。本专题为大家提供MySQL数据库相关的文章、下载、课程内容,供大家免费下载体验。

256

2023.09.05

vb中怎么连接access数据库
vb中怎么连接access数据库

vb中连接access数据库的步骤包括引用必要的命名空间、创建连接字符串、创建连接对象、打开连接、执行SQL语句和关闭连接。本专题为大家提供连接access数据库相关的文章、下载、课程内容,供大家免费下载体验。

326

2023.10.09

数据库对象名无效怎么解决
数据库对象名无效怎么解决

数据库对象名无效解决办法:1、检查使用的对象名是否正确,确保没有拼写错误;2、检查数据库中是否已存在具有相同名称的对象,如果是,请更改对象名为一个不同的名称,然后重新创建;3、确保在连接数据库时使用了正确的用户名、密码和数据库名称;4、尝试重启数据库服务,然后再次尝试创建或使用对象;5、尝试更新驱动程序,然后再次尝试创建或使用对象。

413

2023.10.16

vb连接access数据库的方法
vb连接access数据库的方法

vb连接access数据库方法:1、使用ADO连接,首先导入System.Data.OleDb模块,然后定义一个连接字符串,接着创建一个OleDbConnection对象并使用Open() 方法打开连接;2、使用DAO连接,首先导入 Microsoft.Jet.OLEDB模块,然后定义一个连接字符串,接着创建一个JetConnection对象并使用Open()方法打开连接即可。

411

2023.10.16

vb连接数据库的方法
vb连接数据库的方法

vb连接数据库的方法有使用ADO对象库、使用OLEDB数据提供程序、使用ODBC数据源等。详细介绍:1、使用ADO对象库方法,ADO是一种用于访问数据库的COM组件,可以通过ADO连接数据库并执行SQL语句。可以使用ADODB.Connection对象来建立与数据库的连接,然后使用ADODB.Recordset对象来执行查询和操作数据;2、使用OLEDB数据提供程序方法等等。

223

2023.10.19

2026赚钱平台入口大全
2026赚钱平台入口大全

2026年最新赚钱平台入口汇总,涵盖任务众包、内容创作、电商运营、技能变现等多类正规渠道,助你轻松开启副业增收之路。阅读专题下面的文章了解更多详细内容。

54

2026.01.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.4万人学习

Django 教程
Django 教程

共28课时 | 3.7万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号