跳过内容

带有提取实体的词汇图谱

背景

向量搜索方法(例如基本检索器父子检索器)最大的问题是难以找到回答问题所需的所有相关上下文。上下文可能分散在许多块中,导致搜索无法找到。将块中的真实世界实体相互关联,并与向量搜索一起检索这些关系,可以提供关于这些实体在块中处理的额外上下文。

图模式

Graph

元素

节点

Document Node 文档节点包含文档名称及其来源。它们可能包含额外的元数据。 Chunk Node 块节点包含块的人类可读文本及其向量嵌入。它们可能包含额外的元数据。 Entity Node 实体节点包含实体的名称。此外,它们可能包含实体的描述和向量嵌入(名称和描述的)。它们可能包含额外的元数据。实体节点可以根据提取提示具有额外的标签。

关系

PART_OF Relationship PART_OF 关系不需要额外的属性。但是,它们可能包含额外的元数据。

HAS_ENTITY Relationship HAS_ENTITY 关系不需要额外的属性。但是,它们可能包含额外的元数据。

RELATES_TO Relationship RELATES_TO 关系在此处是示例性的。它们可以根据提取提示具有任何类型。它们也可能有一个描述。它们可能包含额外的元数据。

描述

使用 LLM 对块执行实体和关系提取。将检索到的三元组导入图中。

GraphRAG 模式

带有提取实体的词汇图用于图增强向量搜索中。

我在哪里?
© . This site is unofficial and not affiliated with Microsoft.