SimGRAG:利用相似子图进行知识图谱驱动的检索增强生成
Yuzheng Cai、Zhenyue Guo、Yiwen Pei、Wanrui Bian、Weiguo Zheng arXiv:2412.15272 [ cs.CL, cs.AI, cs.IR ] github:YZ-Cai/SimGRAG
作者:摘要
大型语言模型(LLMs)的最新进展在各种任务中展现出令人印象深刻的多功能性。为了消除它们的幻觉,检索增强生成(RAG)作为一种强大的方法应运而生,它利用知识图谱(KGs)等外部知识源。在本文中,我们研究了KG驱动的RAG任务,并提出了一种新颖的相似图增强检索增强生成(SimGRAG)方法。它通过两阶段过程有效地解决了查询文本和KG结构对齐的挑战:(1) 查询到模式,它使用LLM将查询转换为所需的图模式;(2) 模式到子图,它使用图语义距离(GSD)度量量化模式与候选子图之间的对齐程度。我们还开发了一种优化的检索算法,可以在1秒内从千万规模的KG中高效识别出Top-k子图。大量实验表明,SimGRAG在问答和事实验证方面均优于最先进的KG驱动RAG方法。我们的代码可在https://github.com/YZ-Cai/SimGRAG获取。