Skip to main content
向量数据库(Faiss、Milvus、Chroma)的索引机制

向量数据库(Faiss、Milvus、Chroma)的索引机制

向量数据库的索引机制,是用于快速检索相似向量的核心技术,本质是通过对向量进行组织、排
序,减少检索时的计算量,提升检索速度;HNSW、IVF_FLAT、IVF_PQ是三种主流索引,Faiss、Milvus、
Chroma均支持这三种索引,但适配场景不同;高并发、大数据量(百万级以上)RAG场景,核心需求是
“检索速度快(响应时间<500ms)、准确率高(召回率>85%)”,需结合索引特性设计策略。

一、为什么很重要

百万级以上文档对应的向量数量庞大(百万级甚至千万级),若采用无索引或不合适的索引,检
索时需遍历所有向量,计算量极大,导致检索延迟过高(>1s),无法满足高并发需求;若仅追求速度,
选用精度较低的索引,会导致检索召回率下降,影响RAG生成效果。因此,需明确三种索引的差异,结合
场景设计策略,平衡速度和准确率。


Y-aong...About 3 minAgent多Agent
多Agent调用调度策略

多Agent调用调度策略

一、多工具调用调度策略设计

  • 意图路由调度: 基于意图理解结果,匹配工具库中的工具类型,过滤无关工具,缩小候选范围(如查
    询任务匹配检索工具,计算任务匹配计算器工具)。
  • **工具的拓扑排序:**分析工具间的依赖关系(如先检索数据、再计算、最后生成),构建有向无环图
    (DAG),按拓扑顺序串行执行依赖工具,无依赖工具并行执行,降低延迟。
  • **工具的优先级:**划分工具优先级:核心工具(必选)优先调用,辅助工具(可选)延后调用;高优先级
    任务抢占资源,保证核心任务执行。
  • **参数的提前校验:**调用前校验工具入参是否完整、合法,提前拦截无效调用,避免资源浪费;缺失参数
    则主动反问用户补充。
  • **动态并发控制:**根据系统负载、工具QPS限制,动态调整并发调用数量,防止超出工具接口限流阈
    值。

Y-aong...About 4 minAgent多Agent
Embedding模型微调

Embedding模型微调

基本步骤

  1. 数据准备:采集半导体领域的生僻术语相关数据,构建样本集:
  • 正样本对:生僻术语与对应的解释(如“晶圆键合工艺-通过高温高压将两片晶圆连接的工艺”)、生僻术语的不同表述(如“晶圆键合-晶圆贴合”);
  • 负样本对:生僻术语与无关术语(如“晶圆键合工艺-芯片封装”)、生僻术语与错误解释;样本量:至少采集1000组正样本对、500组负样本对,确保样本的多样性和有效性。
  1. 数据预处理:对样本进行清洗、标注,将生僻术语和解释进行分块,归一化处理适配模型输入,同
    时标注术语的领域标签。
  2. 微调训练:基于开源Embedding模型(如BGE-large),采用对比损失函数(Contrastive Loss),冻结模型底层基础层(前8层),仅训练顶层适配层(后4层),减少训练成本和过拟合;训练参数:学习率1e-5,批次大小32,训练轮次10-15轮。
  3. 效果验证:通过“语义相似度计算、RAG检索召回率”验证,若生僻术语的检索召回率低于80%,则增加样本量、调整训练参数,重新微调。

Y-aong...About 10 minAgentRAG,Embedding微调
LlamaIndex 中最具借鉴价值的五点

LlamaIndex 中最具借鉴价值的五点

这是AI帮我总结出来LlamaIndex 中最具借鉴价值的五点

✅ 亮点 1:分层索引(Hierarchical Indexing) + 父子文档检索(Parent-Child Chunking)

🔍 LlamaIndex 做法:

  • 将文档切分为 小块(child nodes) 用于精确检索;
  • 同时保留 大块(parent nodes,如整段/整页) 作为上下文容器;
  • 检索时先找最相关的 child,再返回其 parent 作为上下文,避免信息碎片化。

Y-aong...About 3 minAgentRAG
Agent的五种设计模式

Agent的五种设计模式

前言:当 AI 需要“三思而后行”

现在的 AI 已经不仅仅是聊天机器人了。当我们让 AI 去订机票、分析财报或者修 Bug 时,我们其实在要求它像人一样工作。

人类解决问题通常不是靠“灵光一现”(虽然有时候是),而是靠逻辑推演、工具使用、自我反省和分工合作。这就是 Agentic Design Patterns(智能体设计模式)的由来。

在 LangChain 生态中,构建 Agent 早已不是简单的 LLMChain,而是进入了 LangGraph 的时代。今天我们用最通俗的方式,聊聊构建稳健 AI Agent 的 5 种核心设计模式。


Y-aong...About 5 minAgentAgent