PathRAG:利用关系路径修剪基于图的检索增强生成
Boyu Chen、Zirui Guo、Zidan Yang、Yuluo Chen、Junze Chen、Zhenghao Liu、Chuan Shi、Cheng Yang arXiv:2502.14902 [ cs.CL, cs.AI, cs.IR ] github:BUPT-GAMMA/PathRAG
作者: 摘要
检索增强生成(RAG)通过从外部数据库检索知识来提高大型语言模型(LLM)的响应质量。典型的 RAG 方法将文本数据库分成块,并以扁平结构组织它们以进行高效搜索。为了更好地捕获文本数据库中固有的依赖关系和结构化关系,研究人员提出将文本信息组织成索引图,即基于图的 RAG。然而,我们认为当前基于图的 RAG 方法的局限性在于检索到的信息冗余,而不是信息不足。此外,以前的方法使用扁平结构在提示中组织检索到的信息,导致性能不佳。为了克服这些限制,我们提出了 PathRAG,它从索引图中检索关键关系路径,并将这些路径转换为文本形式以提示 LLM。具体来说,PathRAG 通过基于流的修剪有效减少冗余信息,同时通过基于路径的提示引导 LLM 生成更具逻辑性和连贯性的响应。实验结果表明,PathRAG 在六个数据集和五个评估维度上始终优于最先进的基线。代码可从以下链接获取:https://github.com/BUPT-GAMMA/PathRAG