词汇图谱
背景
将大型文档分成较小的片段有助于创建嵌入。嵌入是文本的语义表示,捕捉文本的含义。如果给定文本过长且包含太多不同的主题,其嵌入的信息价值就会降低。
图模式
元素
节点
文档节点包含文档名称及其来源。它们可能包含额外的元数据。
分块节点包含分块的人类可读文本及其向量嵌入。它们可能包含额外的元数据。
关系
PART_OF 关系不需要额外的属性。但是,它们可能包含额外的元数据。
描述
将文档分成块,并使用嵌入模型嵌入这些块的文本内容。记录这些块所属的文档。
GraphRAG 模式
词汇图谱用于基本检索器。