Python 向量数据库的 Milvus / Qdrant / Weaviate 对比

舞夢輝影

发布时间：2026-02-19 17:20:03

393人浏览过

来源于php中文网

原创

选qdrant写入更快（单节点upsert快1.5–2倍），但需nvme磁盘；milvus对cpu/内存要求高，高并发易阻塞；weaviate居中，batch_size需≥100才提速。

python 向量数据库的 milvus / qdrant / weaviate 对比

选 Milvus 还是 Qdrant？看写入吞吐和硬件限制

Milvus 对 CPU 和内存更“贪”，尤其在高并发写入时容易卡在 insert 阻塞，背后是它默认启用同步刷盘 + 多层缓存协调；Qdrant 用 RocksDB 做底层，写入路径更直，upsert 在单节点上压测常比 Milvus 快 1.5–2 倍，但要求磁盘随机读写强（NVMe 推荐）。Weaviate 则夹在中间——它用倒排+向量混合索引，写入快于 Milvus 但慢于 Qdrant，且对 batch_size 敏感：设成 100 以上才明显提速，设太小会触发大量 HTTP 小包。

实操建议：

立即学习“Python免费学习笔记（深入）”；

橙篇

百度文库发布的一款综合性AI创作工具

下载

日均新增向量 qdrant，开 sync=true 保一致性，别碰 consistency_level
需要实时更新+删除大量旧向量（比如推荐系统冷热切换）→ Milvus 的 delete 接口语义最清晰，Weaviate 的 delete_objects 实际是逻辑标记，得靠定期 compaction
用 Kubernetes 编排 → Qdrant 的单进程模型更易水平扩缩，Milvus v2.4+ 虽支持 standalone 模式，但 dataNode 和 queryNode 分离后，search 延迟抖动变大

Weaviate 的 `vectorIndexConfig` 怎么调才不翻车

很多人一上来就改 maxConnections 或 efConstruction，结果搜索精度掉点、内存暴涨。根本原因是 Weaviate 默认用 HNSW，而 HNSW 的性能拐点不在参数本身，而在数据分布是否满足“局部密度均匀”——比如商品 Embedding 经常集中在某几个语义簇，强行调高 ef 只会让 top-k 返回更不准。

实操建议：

立即学习“Python免费学习笔记（深入）”；

vectorIndexType: "hnsw" 下，先跑 GET /v1/objects/{className}/aggregate 看向量维度分布，如果 stddev > 0.3 × mean，说明嵌入质量差，调参前先换模型
ef 别超 2 × k（k 是你 search 时的 limit），否则召回率不升反降；maxConnections 设成 min(64, 2 × CPU核心数) 更稳
想关掉向量索引做纯属性过滤？不能只删 vectorIndexConfig，得显式设 vectorIndexType: "none"，否则 Weaviate 仍会默默建空 HNSW

Milvus 的 `search` 耗时突然飙升，先查这三处

不是所有慢搜都怪索引或硬件。Milvus v2.3+ 的 search 请求实际走两跳：先由 proxy 解析 expr，再发给 queryNode 执行。中间任一环节卡住，time_cost 就会虚高。

常见错误现象：

日志里反复出现 "timeout to get query result from QueryNode" → 八成是 queryNode 的 cache.memory_limit 不够，导致频繁驱逐索引页
加了 output_fields 后延迟翻倍 → Milvus 默认把非主键字段存在 delta_log，查时要合并 base + delta，建议把高频返回字段全设为 primary_key 或提前 load_collection
search 返回空但没报错 → 检查 anns_field 是否拼错，Milvus 不校验字段是否存在，错写成 "vector_filed" 会静默退化为全表扫描

Qdrant 的 `scroll` 和 `search` 什么时候该选谁

scroll 不是分页替代品，它是为“导出全量”设计的流式接口；search 才是真·检索。但很多人用 scroll 做分页，结果发现 offset 越大越慢——因为 Qdrant 底层按 ID 排序，scroll 每次都从头扫，O(n) 时间复杂度。

使用场景区分：

要拉取全部向量做离线聚类 → 用 scroll，配合 limit=10000 和 with_vectors=true
用户搜“蓝牙耳机”，想分页看结果 → 必须用 search，offset 改成游标式 scroll_id（Qdrant v1.7+ 支持），否则第 100 页耗时可能超 3s
需要按时间范围 + 向量相似度混合排序 → Weaviate 的 nearVector + where 更自然，Qdrant 得先 search 出 ID，再用 get 查元数据二次过滤

向量数据库没有银弹，Milvus 强在生态和运维工具链，Qdrant 胜在轻量和写入确定性，Weaviate 黏性来自 schema + 向量一体化。但所有这些优势，都会在你第一次忽略 consistency_level、search_params 或 auto_compaction 的默认值时消失。

Python 3 类型提示：为参数类型转换装饰器编写精准的类型签名

Python 异步异常传播的常见陷阱

Python 模块化设计的边界判断

Python Trace ID 在日志中的强制透传

Python 异步任务的失败重试机制

相关标签:

python 接口 delete 并发数据库 milvus kubernetes http embedding

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何在 Tkinter 中实现按钮间安全传递图像路径并调用 OpenCV 显示下一篇：暂无

作者最新文章

Linux kubeadm join 的 token / certificate-key 有效期与续期策略

2026-02-19 12:17

GitHub 上的文件如何下载？单个文件与整包下载方法

2026-02-19 12:30

edge浏览器同步密码 Edge密码管理器与加密同步机制解析

2026-02-19 12:43

Python GIL 对多线程性能的影响

2026-02-19 12:52

Python 使用 slots 控制对象内存占用

2026-02-19 13:32

Python Parca 的持续性能剖析

2026-02-19 13:49

GitHub 怎么稳定打开？GitHub 加速访问与网络设置教程

2026-02-19 13:54

Python asyncio.wait 的返回结果分析

2026-02-19 14:16

Linux Harbor 的镜像仓库安全扫描与 RBAC 配置模板

2026-02-19 14:21

拼多多直播怎么上秒拍链接？拼多多秒拍怎么抢

2026-02-19 14:25

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

AI 图片处理图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍：1、IDE接口是一种并行接口，主要用于连接硬盘和光驱等设备，它主要有两种类型：ATA和ATAPI，IDE接口已经逐渐被SATA接口；2、SATA接口是一种串行接口，相较于IDE接口，它具有更高的传输速度、更低的功耗和更小的体积；3、SCSI接口等等。

1529

2023.10.19

PHP接口编写教程

本专题整合了PHP接口编写教程，阅读专题下面的文章了解更多详细内容。

423

2025.10.17

php8.4实现接口限流的教程

PHP8.4本身不内置限流功能，需借助Redis（令牌桶）或Swoole（漏桶）实现；文件锁因I/O瓶颈、无跨机共享、秒级精度等缺陷不适用高并发场景。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

2260

2025.12.29

java接口相关教程

本专题整合了java接口相关内容，阅读专题下面的文章了解更多详细内容。

2026.01.19

数据库Delete用法

数据库Delete用法：1、删除单条记录；2、删除多条记录；3、删除所有记录；4、删除特定条件的记录。更多关于数据库Delete的内容，大家可以访问下面的文章。

287

2023.11.13

drop和delete的区别

drop和delete的区别：1、功能与用途；2、操作对象；3、可逆性；4、空间释放；5、执行速度与效率；6、与其他命令的交互；7、影响的持久性；8、语法和执行；9、触发器与约束；10、事务处理。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

220

2023.12.29

数据库三范式

数据库三范式是一种设计规范，用于规范化关系型数据库中的数据结构，它通过消除冗余数据、提高数据库性能和数据一致性，提供了一种有效的数据库设计方法。本专题提供数据库三范式相关的文章、下载和课程。

374

2023.06.29

如何删除数据库

删除数据库是指在MySQL中完全移除一个数据库及其所包含的所有数据和结构，作用包括：1、释放存储空间；2、确保数据的安全性；3、提高数据库的整体性能，加速查询和操作的执行速度。尽管删除数据库具有一些好处，但在执行任何删除操作之前，务必谨慎操作，并备份重要的数据。删除数据库将永久性地删除所有相关数据和结构，无法回滚。

2093

2023.08.14