RAG系统的幻觉如何解决
...About 3 min
RAG系统的幻觉如何解决
RAG系统的幻觉,指大模型生成的答案包含检索结果中没有的信息、与检索结果不符的信息,或虚构专业知识;除了优化检索结果(提升检索精准度),核心优化手段还包括提示词工程、答案校验机****制,以及大模型调用优化、数据质量优化等,其中提示词工程和答案校验机制是最直接、可落地的手段。
即使检索结果精准,大模型也可能因提示词不规范、缺乏约束,或对检索结果的理解偏差,生成幻觉内容;尤其是专业领域RAG(如半导体、电力),幻觉会导致答案错误,影响系统可用性,甚至造成业务损失。因此,需通过提示词工程约束大模型行为,通过答案校验机制过滤幻觉内容,进一步降低幻觉率。
一、提示词工程优化
**模板设计:**制定领域专属的提示词模板,包含4个核心模块:
- 角色定义:“你是XX领域的专业问答助手,仅基于提供的检索结果回答问题,不使用任何检索结果外的信息”;
- 检索结果输入:明确检索结果的格式(如“检索结果1:XXX;检索结果2:XXX”),要求大模型优先参考检索结果;
- 生成规则:“答案需准确、简洁,专业术语规范,若检索结果中没有相关信息,直接回复‘暂无相关信息’,不得虚构;若检索结果有多个观点,需全部呈现并说明”
- 格式要求:明确答案的结构(如“核心结论+详细说明+参考检索结果”),提升可读性
**提示词优化迭代:**根据生成结果,持续调整提示词,比如增加“专业术语必须与检索结果一致”“禁止添加检索结果外的补充说明”等约束
二、答案校验机制
核心思路:生成答案后,通过“语义校验+知识校验+格式校验”三重校验,过滤幻觉内容,具体步骤:
- 语义校验:用Embedding模型计算“生成答案”与“检索结果”的语义相似度,若相似度低于阈值(如70%),判定为可能存在幻觉,触发重新生成;
- 知识校验:结合领域知识图谱,提取生成答案中的核心实体和知识点,与知识图谱中的信息进行比对,若存在虚构实体、错误知识点,判定为幻觉,拒绝输出并提示重新生成;
- 格式校验:检查答案的格式、专业术语是否规范,是否存在“模糊表述”(如“可能”“大概”,非必要不允许),若不符合要求,触发格式优化。
- 人工介入:对于语义相似度处于阈值附近(70%-80%)的答案,触发人工介入审核,确认是否存在幻觉,同时将审核结果作为样本,用于提示词优化和模型微调。
三、辅助优化手段
- 大模型选型:优先选用专业领域微调后的大模型(如Llama 2领域微调版),避免通用大模型的领域语义模糊问题;
- 检索结果优化:确保检索结果的精准度,避免无关结果输入大模型,从源头减少幻觉;
- 数据质量优化:定期清洗知识库数据,删除错误、过时的信息,避免大模型基于错误数据生成幻觉。
- 提示词模板不宜过于繁琐,否则会导致大模型注意力分散,反而增加幻觉;
- 语义校验的阈值需根据领域调整,专业领域可适当提高阈值(如75%),通用领域可降低(如65%);
- 知识校验需保证知识图谱的实时更新,避免知识图谱过时导致的误判;
- 人工介入需明确审核标准,避免审核人员主观判断偏差。
Powered by Waline v2.15.8