RAG系统的幻觉如何解决

Y-aong...About 3 min

RAG系统的幻觉如何解决

RAG系统的幻觉，指大模型生成的答案包含检索结果中没有的信息、与检索结果不符的信息，或虚构专业知识；除了优化检索结果（提升检索精准度），核心优化手段还包括提示词工程、答案校验机****制，以及大模型调用优化、数据质量优化等，其中提示词工程和答案校验机制是最直接、可落地的手段。

即使检索结果精准，大模型也可能因提示词不规范、缺乏约束，或对检索结果的理解偏差，生成幻觉内容；尤其是专业领域RAG（如半导体、电力），幻觉会导致答案错误，影响系统可用性，甚至造成业务损失。因此，需通过提示词工程约束大模型行为，通过答案校验机制过滤幻觉内容，进一步降低幻觉率。

一、提示词工程优化

**模板设计：**制定领域专属的提示词模板，包含4个核心模块：

角色定义：“你是XX领域的专业问答助手，仅基于提供的检索结果回答问题，不使用任何检索结果外的信息”；
检索结果输入：明确检索结果的格式（如“检索结果1：XXX；检索结果2：XXX”），要求大模型优先参考检索结果；
生成规则：“答案需准确、简洁，专业术语规范，若检索结果中没有相关信息，直接回复‘暂无相关信息’，不得虚构；若检索结果有多个观点，需全部呈现并说明”
格式要求：明确答案的结构（如“核心结论+详细说明+参考检索结果”），提升可读性

**提示词优化迭代：**根据生成结果，持续调整提示词，比如增加“专业术语必须与检索结果一致”“禁止添加检索结果外的补充说明”等约束

二、答案校验机制

核心思路：生成答案后，通过“语义校验+知识校验+格式校验”三重校验，过滤幻觉内容，具体步骤：

语义校验：用Embedding模型计算“生成答案”与“检索结果”的语义相似度，若相似度低于阈值（如70%），判定为可能存在幻觉，触发重新生成；
知识校验：结合领域知识图谱，提取生成答案中的核心实体和知识点，与知识图谱中的信息进行比对，若存在虚构实体、错误知识点，判定为幻觉，拒绝输出并提示重新生成；
格式校验：检查答案的格式、专业术语是否规范，是否存在“模糊表述”（如“可能”“大概”，非必要不允许），若不符合要求，触发格式优化。
人工介入：对于语义相似度处于阈值附近（70%-80%）的答案，触发人工介入审核，确认是否存在幻觉，同时将审核结果作为样本，用于提示词优化和模型微调。

三、辅助优化手段

大模型选型：优先选用专业领域微调后的大模型（如Llama 2领域微调版），避免通用大模型的领域语义模糊问题；
检索结果优化：确保检索结果的精准度，避免无关结果输入大模型，从源头减少幻觉；
数据质量优化：定期清洗知识库数据，删除错误、过时的信息，避免大模型基于错误数据生成幻觉。

提示词模板不宜过于繁琐，否则会导致大模型注意力分散，反而增加幻觉；
语义校验的阈值需根据领域调整，专业领域可适当提高阈值（如75%），通用领域可降低（如65%）；
知识校验需保证知识图谱的实时更新，避免知识图谱过时导致的误判；
人工介入需明确审核标准，避免审核人员主观判断偏差。

NickName

E-Mail

Website

Comments

Latest
Oldest
Hottest

Powered by Waline v2.15.8