分布式RAG系统
分布式RAG系统,是指将RAG的各个模块(文档处理、Embedding、向量存储、检索、生成)部
署在多个节点,实现负载均衡和高可用,适配大数据量、高并发场景;文档增量更新指新增、修改、删除
文档时,无需重建整个向量索引,仅更新相关向量;实时检索指用户查询后,能在500ms内返回检索结
果;多节点部署的核心问题是向量一致性(各节点的向量数据同步)和检索延迟(节点间通信耗时)。
一、为什么需要分布式
百万级以上文档的RAG系统,单机部署无法满足高并发、大数据量的需求,必须采用分布式部
署;若无法实现增量更新,每次文档变更都需重建索引,耗时极长(数小时甚至数天),影响系统可用
性;若向量不一致,会导致不同节点检索结果不同,影响用户体验;若检索延迟过高,无法满足高并发场
景的响应需求。
...About 5 min