knnVector 型を使用してベクトル埋め込みをインデックスできます。ベクトル フィールドは、次の型の 番号の配列として表すことができます。
BSON
int32knnBeta演算子を使用してクエリを実行するための、int64、またはdoubleデータ型。BSON
double$vectorSearchステージを使用してクエリを行うためのデータ型。
現在非推奨となっている knnBeta 演算子と、集計パイプラインの $vectorSearch ステージを使用して、 knnVector としてインデックスのフィールドをクエリできます。
注意
Atlas UIでMongoDB Search Visual Editor を使用して、knnVector 型のフィールドを設定することはできません。代わりに、 MongoDB Search JSON Editor を使用して、knnVector 型のフィールドを構成します。
MongoDB ベクトル検索 は、 Atlas CLI を使用して作成したローカル Atlas 配置で使用することもできます。詳細については、「Atlas 配置のローカル配置の作成」を参照してください。
knnVector 型の制限
ドキュメントの配列内のフィールド、またはオブジェクトの配列内のフィールド( MongoDB Search embeddedDocuments 型)を knnVector タイプとしてインデックスはできません。
knnVector 型のインデックスを定義する
以下は、knnVector 型の JSON 構文です。デフォルトのインデックス定義を以下のように置き換えます。フィールドの詳細については、「フィールド プロパティ」を参照してください。
1 { 2 "mappings": { 3 "dynamic": true|false, 4 "fields": { 5 "<field-name>": { 6 "type": "knnVector", 7 "dimensions": <number-of-dimensions>, 8 "similarity": "euclidean | cosine | dotProduct" 9 } 10 } 11 } 12 }
knnVector フィールド プロパティを構成する
knnVector 型には、次のオプションがあります。
オプション | タイプ | 必要性 | 目的 |
|---|---|---|---|
| string | 必須 | このフィールド型を識別する、人間が判読できるラベル。値は |
| 整数 | 必須 | MongoDB Search がインデックス時およびクエリ時に強制されるベクトル次元の数。この値は |
| string | 必須 | 上位 K 近傍の検索に使用するベクトル類似度関数。値は次のいずれかになります。
|
knnVector 型の例を試す
sample_mflix.embedded_movies コレクションの次のインデックス定義は、コレクション内のすべての動的にインデックス可能なフィールドを動的にインデックスされ、plot_embedding フィールドを knnVector 型として静的にインデックスされます。plot_embedding フィールドには、OpenAI の text-embedding-ada-002 埋め込みモデルを使用して作成された埋め込みが含まれます。インデックス定義では、1536 ベクトル次元を指定し、 euclidean を使用して類似性を測定します。
1 { 2 "mappings": { 3 "dynamic": true, 4 "fields": { 5 "plot_embedding": { 6 "type": "knnVector", 7 "dimensions": 1536, 8 "similarity": "euclidean" 9 } 10 } 11 } 12 }
サンプルデータを クラスターにロードし、このコレクションに対して前述のMongoDB Searchインデックスを作成すると、このコレクションに対して$vectorSearch クエリを実行できます。実行できるサンプルクエリの詳細については、$vectorSearch の例 を参照してください。