跳过内容

SimGRAG:利用相似子图进行知识图谱驱动的检索增强生成

作者:
arXiv:2412.15272 [ cs.CL, cs.AI, cs.IR ] github:YZ-Cai/SimGRAG

摘要

大型语言模型(LLMs)的最新进展在各种任务中展现出令人印象深刻的多功能性。为了消除它们的幻觉,检索增强生成(RAG)作为一种强大的方法应运而生,它利用知识图谱(KGs)等外部知识源。在本文中,我们研究了KG驱动的RAG任务,并提出了一种新颖的相似图增强检索增强生成(SimGRAG)方法。它通过两阶段过程有效地解决了查询文本和KG结构对齐的挑战:(1) 查询到模式,它使用LLM将查询转换为所需的图模式;(2) 模式到子图,它使用图语义距离(GSD)度量量化模式与候选子图之间的对齐程度。我们还开发了一种优化的检索算法,可以在1秒内从千万规模的KG中高效识别出Top-k子图。大量实验表明,SimGRAG在问答和事实验证方面均优于最先进的KG驱动RAG方法。我们的代码可在https://github.com/YZ-Cai/SimGRAG获取。

我在哪里?
© . This site is unofficial and not affiliated with Microsoft.