带有提取实体的词汇图谱
背景
向量搜索方法(例如基本检索器或父子检索器)最大的问题是难以找到回答问题所需的所有相关上下文。上下文可能分散在许多块中,导致搜索无法找到。将块中的真实世界实体相互关联,并与向量搜索一起检索这些关系,可以提供关于这些实体在块中处理的额外上下文。
图模式
元素
节点
文档节点包含文档名称及其来源。它们可能包含额外的元数据。
块节点包含块的人类可读文本及其向量嵌入。它们可能包含额外的元数据。
实体节点包含实体的名称。此外,它们可能包含实体的描述和向量嵌入(名称和描述的)。它们可能包含额外的元数据。实体节点可以根据提取提示具有额外的标签。
关系
PART_OF 关系不需要额外的属性。但是,它们可能包含额外的元数据。
HAS_ENTITY 关系不需要额外的属性。但是,它们可能包含额外的元数据。
RELATES_TO 关系在此处是示例性的。它们可以根据提取提示具有任何类型。它们也可能有一个描述。它们可能包含额外的元数据。
描述
使用 LLM 对块执行实体和关系提取。将检索到的三元组导入图中。
GraphRAG 模式
带有提取实体的词汇图用于图增强向量搜索中。