LlamaIndex 中最具借鉴价值的五点

LlamaIndex 中最具借鉴价值的五点

这是AI帮我总结出来LlamaIndex 中最具借鉴价值的五点

✅ 亮点 1：分层索引（Hierarchical Indexing） + 父子文档检索（Parent-Child Chunking）

🔍 LlamaIndex 做法：

将文档切分为 小块（child nodes） 用于精确检索；
同时保留 大块（parent nodes，如整段/整页） 作为上下文容器；
检索时先找最相关的 child，再返回其 parent 作为上下文，避免信息碎片化。

Y-aong...About 3 min

RAG存在的问题和解决思路

RAG存在的问题和解决思路

一、文档层（Document Layer）问题

1. PDF / Office 文档格式混乱

问题：PDF 结构丢失、段落断裂、表格识别错误、图像关联中断。

解决方案：文档结构化解析（Document Normalization），多模态解析。

文字/图像/表格之间的关联关系丢失

表格 + 解释性文本绑定为一个 chunk

图像 + caption + 引用段落绑定为一个 multimodal block

采用 多模态 embedding（CLIP / siglip / Voyage-multimodal）
Chunk 边界断裂（Chunking 不感知结构）
滑动窗口分块
表格、图像不切碎，保持单独 chunk
基于标题层级/段落
多文档版本混乱（旧版手册与新版矛盾）
- 元数据过滤
- 检索时指定版本
- 生成时表明冲突
多语言文档混合（中英并存）
- 索引时多语言
- 检索时中英结合
专业领域知识
- Embedding微调

Y-aong...About 2 min

线上 RAG 系统零停机重建向量库

线上 RAG 系统零停机重建向量库

线上RAG系统绝对不能直接删除/覆盖正在使用的向量库，否则会导致服务报错、查询失败、业务中断。核心思路是：双库切换 + 流量无缝迁移，全程不影响线上服务。

我给你一套生产环境可直接落地的标准方案，步骤清晰、无风险、零停机。

核心原理

线上始终有一个可用的「活跃向量库」 提供服务
后台静默重建一个「新向量库」
重建完成后，原子切换配置/路由，让流量切到新库
验证无误后，再删除旧库（安全兜底）

Y-aong...About 4 min