Zilliz 持续为 AI 应用开发者赋能!7 R5 D/ }7 `+ S9 w; A
- \- ~, f3 M: @5 \% p k- |
; m+ `4 T! n" |0 w: Y* q6 d: ? 近期,Zilliz 与智源研究院达成合作,将多种 BGE(BAAI General Embedding) 开源模型与开源向量数据库 Milvus 集成。得益于 Milvus 2.4 最新推出的 Sparse Vector(稀疏向量)和 Multi-vector(多向量)支持,开发者获得了多种选择,不仅有业界广泛采用的 Dense Embedding(稠密向量模型),还能使用 BGE 最新推出的 Sparse Embedding(稀疏检索模型)、Reranker(重排序) 模型。开发者可以轻松组合这些工具构建更加强大的召回方案,覆盖语义检索、全文检索和精排的能力。
. C- u% V1 {' Q3 E! B' Y3 G0 R1 o$ t" J) \. F' r
& I* l3 n1 z0 O8 [8 `, G BGE 与 Milvus 的集成在全面提升 RAG 质量的同时兼具灵活性,国产向量数据库有哪些可以更好地为 AI 应用开发者服务。
# s% Y: u. [; y+ M0 G6 O( k3 Y: q3 f6 Z8 i5 T! Z8 a) f5 {) ^
# h' G: E3 n% o 01.Sparse Embedding 和 Reranker:提升 RAG 的新趋势
% M* B! |2 r. w# ?2 V1 K; @4 s9 ~2 w# \! v) f# I5 h" ^, W1 ?
& W/ }0 |7 r& E. q RAG(Retrieval Augmented Generation,检索增强生成)是一种利用检索外部知识库的信息来增强大语言模型准确性和可靠性的技术。RAG 已经被证明能够有效解决一系列阻碍大模型应用的核心问题(例如出现幻觉、时效性差、专业领域知识不足、数据安全问题等)。而 Embedding 模型和向量数据库是实现这一方案的关键,更好的模型、功能更丰富的向量数据库,能够有效提升 RAG 的回复质量,帮助大语言模型实现更好的终端问答体验。
' r! a/ n/ z4 W- U, @! f' i4 y3 x5 a6 E( W4 u
( r5 {/ I$ [7 p, v
然而,由于基础 Dense Embedding 和向量召回方案的限制,一些场景下RAG 最终所呈现的效果还不尽如人意。目前,业界倾向于采取两种方案来提升 RAG 的问答质量:+ d- z: L! I2 H: o4 t8 ~
1 y1 _/ S9 n3 g/ ]8 x" N( b
: x$ E b2 s+ |( t- ?4 { 方案一,使用 Sparse Vector 配合 Dense Vector 进行两路召回的方式。其中,Sparse Vector 可以覆盖传统全文检索的能力,帮助识别和捕捉特定的关键词,而 Dense Vector 则可以更有效地抓住文本中的整体语义信息。通过将这两种向量召回的结果整合,可以获得更丰富、更全面的信息,从而提升 RAG 的效果。
5 T7 x+ s) M$ x
" c3 [/ j9 m" i! F# [9 u
: z7 E8 \# a& A0 D* [ 方案二,使用 Cross-Encoder Reranker(交叉编码重排序) 作为第二层的精排。首先使用 Dense Vector、Sparse Vector 或二者的组合进行粗排;随后通过使用 Reranker 模型对第一阶段的结果进行进一步的筛选和排序,以提高最终结果的质量。( @; c( l& s; f; x. x
{) S- Z7 b) k$ h5 k! ]: Y
6 A" q8 X0 \0 I+ c; U( ^$ [+ B# @! D% c 值得注意的是,方案一既可以独立使用,即采用基于规则的算法来合并两路召回的结果,例如常用的 RRF Reciprocal Rank Fusion (RRF),也可以叠加方案二使用,即采用 Cross-Encoder Reranker 对两路结果合并重新排序。
0 u- E/ O/ E7 G/ s6 i% A: {
# A$ \& f) J v2 s6 G. O" a* r2 d3 Z* @ u/ n; J
02.Milvus 携手 BGE:灵活解决 RAG 的质量难题
' e" c" M- V4 K* d5 F$ b( J- Q9 l, t( Q$ D9 T1 Q# \. Q
- Y" {7 | b i2 H
Milvus 是一款面向 AI 应用,服务向量搜索和非结构化数据管理的开源向量数据库。它最初由 Zilliz 公司发起,并在 2019 年开源。自推出以来,Milvus 在 AI 开发者社区和企业用户中大受欢迎并被广泛采用,在 GitHub 上拥有超过 26,000 个星标和 260 多位贡献者,全球下载和安装量超过 2000 万次,已成为全球使用最广泛的向量数据库之一。
9 P, ?% Z$ m2 V1 E2 j% ?
( c) Y/ ^: e6 U6 L5 l9 y& y Y+ C' _) d- J6 i9 x9 F3 V, O
不久前,Zilliz 创始人兼 CEO 星爵在 NVIDIA GTC 大会上正式发布了 Milvus 2.4 版本,堪称业界的革命性升级。除了被热烈讨论的基于 GPU 的向量索引和搜索加速能力,对 Sparse Vector 和 Multi-Vector 的支持也是一大亮点。Milvus 与智源 BGE 的集成不仅一次性聚集了提升 RAG 质量所需的 Sparse Embedding、多路召回、Reranker 能力,更是为开发者提供了多种类、多层次的召回方案,帮助开发者根据实际需求灵活地构建AI应用。3 O' J/ f) a( s9 k
: n' B4 W* N- J8 @' f
( L" a9 |5 p6 G2 X 此次与 Milvus 携手的 BGE 是由智源研究院打造的通用语义模型。自 2023 年 8 月首次发布以来,智源团队陆续推出了中英文模型 BGE v1.0、v1.5、以及支持多达 100 多种语言和多种召回方式的 BGE-M3 模型。截至目前,BGE 系列模型全球下载量已经超过 1500万,位居国内开源 AI 模型首位。BGE-M3 模型更是一度跃居 Hugging Face 热门模型前三名。在最新推出的 Milvus 2.4 客户端中,为 BGE 模型提供了简单易用的函数封装。开发者可以更加方便地使用多种 BGE 开源模型,配合 Milvus 向量数据库构建多路、多级的召回方案,全面提升 RAG 质量。
2 m" H7 ~1 A: ] p! @1 ]3 q" [6 ~+ P
|