现在开源的向量数据库能做到支持千万级的数据吗

3 天前
 pureGirl
2274 次点击
所在节点    程序员
15 条回复
summerwar
3 天前
能,千万级要是不支持,那还怎么开源
5261
3 天前
啥业务场景会需要用到向量数据库呢?
fFeeOps
3 天前
用 ES 也能平替一把吧,ES 到千万还是轻松的
soulflysimple123
3 天前
Milvus 、Qdrant 、Weaviate 这些主流的开源向量数据库都可以
hackpro
3 天前
小意思
w568w
3 天前
可以啊,之前尝试过 pg_vector 单机千万数据,单次查询 100ms
crackidz
3 天前
可以的
bbbblue
3 天前
直接用服务 zilliz serverless 千万很容易 存储成本也低
就是用 serverless 查询量上来了很烧钱。。
Codishek2005
2 天前
> @5261
> 啥业务场景会需要用到向量数据库呢?

较常见的用途是语义搜索。比如开源图片库 Immich 可以用机器学习实现语义搜索(原理是预先用图片跑嵌入模型,生成向量存到数据库里。搜索的时候用文本也跑一遍得到向量,再从数据库里查询最接近的记录,向量方向越接近语义越接近)

除了语义搜索之外的其他用途我不清楚
pureGirl
1 天前
@fFeeOps 但是 es 不是语义检索
fFeeOps
1 天前
@pureGirl #10 7.3 版本开始就支持向量检索了,8.0 支持 HNSW
WithoutSugarMiao
1 天前
千万级其实都没必要特意问一下,常用的两个 pgvector 、milvus 随随便便做到。
dorothyREN
1 天前
啥时候千万级也成了门槛了
icy37785
1 天前
千万级的数据很少啊。怎么会有不支持的。
igeeky
20 小时 46 分钟前
我们用 postgresql + citus + pgvector 可以扩展到几亿, 十亿级别都没什么问题.

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1157499

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX