运行向量搜索查询

部署类型

嵌入

接口

MongoDB Vector Search查询采用聚合管道的形式，该管道使用 $vectorSearch作为第一阶段。本页介绍了$vectorSearch 阶段的语法、选项和行为。

$vectorSearch

支持的客户端

语法

字段

$vectorSearch 阶段采用包含以下字段的文档：

向量搜索类型

定义 $vectorSearch 阶段时，可以使用 exact 字段指定运行近似最近邻 (ANN) 搜索还是精确最近邻 (ENN) 搜索。

近似最近邻 (ANN) 搜索

近似最近邻 (ANN)搜索

对于近似最近邻 (ANN)搜索， MongoDB 向量搜索会根据向量嵌入在多维空间中的接近度以及所考虑的邻域数量，在您的数据中查找与查询中的向量嵌入最接近的向量嵌入。它使用Hierarchical Navigable Small Worlds算法，找到与查询中的向量嵌入最相似的向量嵌入，而无需扫描每个向量。因此，近似最近邻 (ANN) 搜索非常适合查询大型数据集，而无需进行大量过滤器。

注意

对于近似最近邻 (ANN) 搜索，通常认为最佳召回率是指结果与精确最近邻 (ENN) 搜索的结果重叠 90-95% 左右，但延迟要低得多。这在准确性和性能之间实现了良好的平衡。要使用 MongoDB 向量搜索实现这一目标，请在查询时间调整参数 numCandidates。

`numCandidates` 选择

您必须指定 numCandidates字段才能运行近似最近邻 (ANN)搜索。该字段确定 MongoDB 向量搜索在搜索过程中考虑的最近邻数量。

我们建议您指定的 numCandidates 数字至少比要返回的文档数量 (limit) 高 20 倍，以提高准确性并减少精确最近邻 (ENN) 和近似最近邻 (ANN) 查询结果之间的差异。示例，如果将 limit设立为 5 结果，则可以考虑将 numCandidates 设置为 100 作为点。要学习；了解详情，请参阅如何衡量查询结果的准确性。

这种过度请求模式是在近似最近邻 (ANN) 搜索中平衡延迟和召回的推荐方法。不过，我们建议根据特定数据集大小和查询要求调整 numCandidates 参数。为确保获得准确的结果，请考虑以下变量：

精确最近邻 (ENN) 搜索

精确最近邻 (ENN)搜索

对于精确最近邻 (ENN)搜索， MongoDB Vector Search 通过计算所有嵌入之间的距离来详尽搜索所有索引的向量嵌入，并为查询中的向量嵌入找到精确最近邻 (ENN)。此操作属于计算密集型任务，可能会对查询延迟负面影响。因此，我们建议对以下使用案例进行精确最近邻 (ENN) 搜索：

Considerations

$vectorSearch 必须是其所在的任何管道中的第一阶段。

限制

$vectorSearch不能用于视图定义和以下管道阶段：

$lookup 子管道 [1]
$facet 管道阶段

[1]	您可以将 `$vectorSearch` 的结果传递给此阶段。

MongoDB Vector Search 索引

要学习；了解有关这些MongoDB Vector Search字段类型的更多信息，请参阅如何为向量搜索的字段创建索引。

MongoDB Vector Search 评分

MongoDB Vector Search 为其返回的每个文档分配一个分数，该分数在 0 到 1 之间的固定范围内（其中 0 表示低相似度，1 表示高相似度）。

注意

对数据进行预过滤不会影响MongoDB Vector Search 使用 vectorSearchScore 进行$vectorSearch查询返回的分数。

MongoDB Vector Search 预过滤

重要

筛选后的查询通常比其他等效的未筛选查询慢。

过滤器注意事项

MongoDB Vector Search 支持 $eq 的简写形式。在简写形式中，您无需在查询中指定 $eq。

例如，考虑以下带有 $eq 的过滤器：
"filter": { "_id": { "$eq": ObjectId("5a9427648b0beebeb69537a5") }
这相当于以下过滤器，它使用 $eq 的简写形式：
"filter": { "_id": ObjectId("5a9427648b0beebeb69537a5") }
您可以使用 $and MQL 操作符在单个查询中指定过滤器数组。

例如，考虑以下预过滤器，用于 genres 字段等于 Action 和 year 字段值为 1999、2000 或 2001 的文档：
"filter": { "$and": [ { "genres": "Action" }, { "year": { "$in": [ 1999, 2000, 2001 ] } } ] }
对于模糊搜索、短语匹配、位置筛选和其他分析文本等高级筛选功能，请在阶段使用 vectorSearch $search操作符。

示例

先决条件

在运行这些示例之前，请执行以下操作：

将查询中使用的示例数据集添加到集群。
为集合创建MongoDB Vector 搜索索引。有关说明，请参阅“创建MongoDB Vector Search 索引”过程，并以所需的语言复制示例查询的配置。

查询

后退

索引参考

来年

解释查询结果