RAG系统中答案无关片段对LLMs生成结果的影响分析

ewAU_zenRRan 2024-04-15 958

人工智能

643人已加入

RAG（检索增强生成）通过检索系统找到用户问题相关的信息片段，利用大模型综合生成一个答案，极大解决了大模型幻觉、信息更新不及时等问题，已经成为了大模型落地的重要手段。

但在检索过程中，往往会检索到与问题极度相似、但又不包含答案或包含干扰答案的片段，这些答案无关片段对大模型生成答案有何影响呢？

今天正好刷到一篇相关文章，带给大家《How Easily do Irrelevant Inputs Skew the Responses of Large Language Models?》

Paper: https://arxiv.org/abs/2404.03302
Github: https://github.com/Di-viner/LLM-Robustness-to-Irrelevant-Information

大模型

先放相关结论，后面补充相关细节。

与常见语义无关的答案无关片段相比，LLMs更容易受到高度语义相关的答案无关片段的影响；

随着答案无关片段的增加，LLMs更容易分心，识别正确信息的能力降低；

LLMs对答案无关片段的的识别能力随着问题格式的不同有所不同，自由式问答>是非性问答>多项选择式问答；

系统提示词中增加“忽略无关片段”等相关内容，对LLMs的识别能力有提升，但较小；

存在高度语义相关的答案无关片段时，COT或者ICL会导致LLMs过度思考，识别能力变差。

数据&片段构造

将答案无关片段，分成三类：

无关：与问题主题无关但相似性得分高的段落

部分相关：不仅在相似性度量上得分高，而且与问题的主题部分内容重叠

相关：不仅在相似性度量上得分高，而且与问题的主题内容重叠，但不包含正确答案。

大模型

数据构造：

无关：通过检索器直接检索Top10的段落；

部分相关：从检索Top10的段落中选择一个包含subj，但缺少obj的段落，作为前半段；然后找到一个包含错误答案obj'的片段作为后半段；

相关：与“部分相关”相比，“相关”片段与问题高度语义相关，但并不包含正确答案，主要涉及系误导性联类型、共同特征类型和虚构轶事类型。