基本检索器
别名
- 向量检索器
- 朴素检索器
- 基线RAG
- 基础RAG
- 典型RAG
所需图结构
背景
在创建嵌入时,将大型文档分块成小段非常有用。嵌入是文本的语义表示,捕捉文本的含义。如果给定文本太长且包含太多不同主题,其嵌入的信息价值会下降。
描述
用户问题使用与之前创建分块嵌入相同的嵌入器进行嵌入。对分块嵌入执行向量相似性搜索,以检索 k(开发者/用户之前配置的数量)个最相似的分块。
用法
如果用户询问一个存在于一个或多个(但不多)分块中的特定主题信息,这种模式很有用。问题不应需要复杂的聚合或关于整个数据集的知识。由于该模式只包含向量相似性搜索,因此易于理解、实现和开始使用。
所需预处理
将文档分成块,并使用嵌入模型嵌入块的文本内容。请参阅分块。
检索查询
由于 Neo4j 向量检索器默认检索相似的分块,因此无需额外的查询。
延伸阅读
- 改进 RAG 的高级检索器技术 (Damian Gil, 2024年4月)
- 使用 Neo4j 实现高级 RAG 策略 (2023年11月)