跳过内容

图增强向量搜索

别名

  • 图 + 向量
  • 增强型向量搜索

所需图结构

带有提取实体的词汇图

背景

基本 GraphRAG 模式最大的问题是找到回答问题所需的所有相关上下文。上下文可能分散在许多块中,无法通过搜索找到。将这些块中的真实世界实体相互关联,并与向量搜索一起检索这些关系,可以提供有关这些块所指实体的额外上下文。它们还可以通过实体网络将块相互关联。

描述

用户问题使用之前用于创建嵌入的相同嵌入器进行嵌入。在块嵌入上执行向量相似性搜索,以找到 k (用户/开发者先前配置的数量) 个最相似的块。从找到的块开始执行遍历,以检索更多上下文。

用法

与仅执行向量搜索(如基本检索器父子检索器)的结果相比,此模式对于检索更丰富的上下文非常有用。额外的遍历检索了所提供数据中实体的交互,这揭示了比检索特定文本块更丰富的信息。当然,这种 GraphRAG 模式的预处理是需要付出努力的。此外,图遍历返回的上下文量可能大得多,LLM 需要能够处理。

所需预处理

使用 LLM 对块执行实体和关系提取。将检索到的三元组导入图中。

检索查询

MATCH (node)-[:PART_OF]->(d:Document)
CALL { WITH node
MATCH (node)-[:HAS_ENTITY]->(e)
MATCH path=(e)(()-[rels:!HAS_ENTITY&!PART_OF]-()){0,2}(:!Chunk&!Document)
RETURN …}
RETURN

变体

此检索器有一些变体

延伸阅读

现有实现

示例实现

我在哪里?
© . This site is unofficial and not affiliated with Microsoft.