元数据过滤
别名
- 自查询检索器
所需图结构
无需特定的图结构。需要一个包含可用于过滤的属性或关系的图。
描述
从用户问题中检索底层数据库中存在的元数据信息。用户问题使用之前使用过的嵌入器进行嵌入。向量相似度搜索仅对符合过滤条件的节点的嵌入执行。
用法
拥有结构化数据始终有助于过滤数据集。如果应用得当,元数据过滤将减少答案中的幻觉。然而,如果只有没有元数据的非结构化数据,则首先需要执行元数据提取,例如通过LLM。这可能导致不一致性,并导致相关文档被排除在搜索之外。
元数据过滤可以在向量搜索之前或之后进行。过滤也可以基于模式进行,即节点不仅根据给定值进行过滤,还根据现有或不存在的模式进行过滤。
延伸阅读
- 使用 Neo4j 实现高级 RAG 策略 (2023年11月)
- 基于图的元数据过滤以改进RAG应用中的向量搜索 (Tomaz Bratanic, 2024年4月)