Skip to main content
LlamaIndex 中最具借鉴价值的五点

LlamaIndex 中最具借鉴价值的五点

这是AI帮我总结出来LlamaIndex 中最具借鉴价值的五点

✅ 亮点 1:分层索引(Hierarchical Indexing) + 父子文档检索(Parent-Child Chunking)

🔍 LlamaIndex 做法:

  • 将文档切分为 小块(child nodes) 用于精确检索;
  • 同时保留 大块(parent nodes,如整段/整页) 作为上下文容器;
  • 检索时先找最相关的 child,再返回其 parent 作为上下文,避免信息碎片化。

Y-aong...About 3 minAgentRAG
RAG存在的问题和解决思路

RAG存在的问题和解决思路

一、文档层(Document Layer)问题

  • 1. PDF / Office 文档格式混乱

问题:PDF 结构丢失、段落断裂、表格识别错误、图像关联中断。

解决方案:文档结构化解析(Document Normalization),多模态解析。

  • 文字/图像/表格之间的关联关系丢失

    表格 + 解释性文本 绑定为一个 chunk

    图像 + caption + 引用段落 绑定为一个 multimodal block

    采用 多模态 embedding(CLIP / siglip / Voyage-multimodal)

  • Chunk 边界断裂(Chunking 不感知结构)

  • 滑动窗口分块

  • 表格、图像不切碎,保持单独 chunk

  • 基于标题层级/段落

  • 多文档版本混乱(旧版手册与新版矛盾)

    • 元数据过滤
    • 检索时指定版本
    • 生成时表明冲突
  • 多语言文档混合(中英并存)

    • 索引时多语言
    • 检索时中英结合
  • 专业领域知识

    • Embedding微调

Y-aong...About 2 minpythonRAG
线上 RAG 系统零停机重建向量库

线上 RAG 系统零停机重建向量库

线上RAG系统绝对不能直接删除/覆盖正在使用的向量库,否则会导致服务报错、查询失败、业务中断。核心思路是:双库切换 + 流量无缝迁移,全程不影响线上服务。

我给你一套生产环境可直接落地的标准方案,步骤清晰、无风险、零停机。

核心原理

  1. 线上始终有一个可用的「活跃向量库」 提供服务
  2. 后台静默重建一个「新向量库」
  3. 重建完成后,原子切换配置/路由,让流量切到新库
  4. 验证无误后,再删除旧库(安全兜底)

Y-aong...About 4 minRAGRAG