您可以使用vector 类型为向量索引索引。向量字段必须包含以下类型的 数字大量:
BSON
int32、int64或double数据类型BSON
double数据类型
您可以在 聚合管道中使用 vectorSearch操作符(类似于 $vectorSearch$search阶段)来查询索引为vector 类型的字段。
vector 类型限制
适用以下限制:
您无法将对象数组( MongoDB Search
embeddedDocuments类型)的字段索引为vector类型。您无法在包含 类型的索引定义中将 StoredSource设立为
truevector。相反,请使用include指定要存储在mongot上的字段,或使用excludevector从存储中排除 类型字段。您不能使用
$vectorSearch阶段来查询索引为vector类型的字段。
为 vector 类型定义索引
配置 vector 字段属性
配置 vector 字段属性
MongoDB Search vector 类型采用以下参数:
选项 | 类型 | 必要性 | 说明 |
|---|---|---|---|
|
| 必需 | 标识此字段类型的人类可读标签。值必须是 |
| Int | 必需 | MongoDB Search 在索引时和查询时实施的向量维度数。只能为 对于索引量化向量或 BinData,您可以指定以下值之一:
您选择的嵌入模型决定了向量嵌入的维数,某些模型对于输出的维数有多个选项。要学习;了解更多信息,请参阅选择创建嵌入的方法。 |
| 字符串 | 必需 | 用于搜索前 K 个最近邻域的向量相似度函数。只能为 您可以指定以下值之一:
|
| 字符串 | Optional | 向量的自动向量量化类型。仅当嵌入是 您可以指定以下值之一:
|
| 对象 | Optional | 用于构建 Hierarchical Navigable Small Worlds(分层可导航小世界) 图的参数。如果未指定,将使用 重要提示:这是作为“预览”功能提供的。修改默认值可能会对MongoDB Search索引和查询产生负面影响。 |
hnswOptions.maxEdges | Int | Optional | |
hnswOptions.numEdgeCandidates | Int | Optional | 类似于查询时的 较高的数字可为图表提供高质量的连接,从而提高搜索质量(召回率),但也会增加查询延迟。 |
尝试 vector 类型的示例
以下索引定义示例在示例数据中使用了sample_mflix.embedded_movies 集合。加载集合后,可以使用以下示例将 字段索引为 类型,以便使用plot_embedding_voyage_3_large vectorvectorSearch( MongoDB搜索操作符)运行查询。有关针对此索引运行的示例查询,请参阅示例。
此索引定义使用默认 typeSet自动为所有动态可索引字段编制索引,并使用以下设置将plot_embedding_voyage_3_large 字段索引为vector 类型:
2048维数dotProduct相似度函数scalar量化