For AI agents: a documentation index is available at https://www.mongodb.com/ja-jp/docs/llms.txt — markdown versions of all pages are available by appending .md to any URL path.
Make the MongoDB docs better! We value your opinion. Share your feedback for a chance to win $100.
MongoDB Branding Shape
Click here >
Docs Menu

ベクトル検索のためのベクトル埋め込みのインデックス作成方法

knnVector 型を使用してベクトル埋め込みをインデックスできます。ベクトル フィールドは、次の型の番号の配列として表せます。

  • BSON int32knnBeta演算子を使用してクエリを実行するための、 int64 、またはdouble データ型。

  • BSON double $vectorSearch ステージを使用するクエリのデータ型

knnBeta 現在非推奨となっている演算子と、集計パイプラインの $vectorSearch ステージを使用して、knnVector としてインデックスのフィールドをクエリできます。

注意

Atlas UIのMongoDB Search Visual Editor を使用して、knnVector 型のフィールドを設定することはできません。代わりに、 MongoDB Search JSON Editor を使用して、knnVector 型のフィールドを構成します。

MongoDB ベクトル検索 は、 Atlas CLI を使用して作成したローカル Atlas 配置で使用することもできます。詳細については、「Atlas 配置のローカル配置の作成」を参照してください。

ドキュメントの配列内のフィールド、またはオブジェクトの配列内のフィールド( MongoDB Search embeddedDocuments 型)を knnVector タイプとしてインデックスはできません。

以下は、knnVector 型の JSON 構文です。デフォルトのインデックス定義を以下のように置き換えます。フィールドの詳細については、「フィールド プロパティ」を参照してください。

1{
2 "mappings": {
3 "dynamic": true|false,
4 "fields": {
5 "<field-name>": {
6 "type": "knnVector",
7 "dimensions": <number-of-dimensions>,
8 "similarity": "euclidean | cosine | dotProduct"
9 }
10 }
11 }
12}

knnVector 型には、次のオプションがあります。

オプション
タイプ
必要性
目的

type

string

必須

このフィールド型を識別する、人間が判読できるラベル。値はknnVectorでなければなりません。

dimensions

整数

必須

MongoDB Search がインデックス時およびクエリ時に強制されるベクトル次元の数。この値は 8192 より大きくすることはできません。

similarity

string

必須

上位 K 近傍の検索に使用するベクトル類似度関数。値は次のいずれかになります。

  • euclidean - ベクトルの両端間の距離を測定します。これにより、さまざまな次元に基づいて類似性を測定できます。詳しくは、「Euclidean.」を参照してください。

  • cosine - ベクトル間の角度に基づいて類似性を測定します。これにより、大きさでスケーリングされない類似性を測定できます。cosine では絶対値ゼロのベクトルは使用できません。コサイン類似度を測定するには、ベクトルを正規化し、代わりに dotProduct を使用することをお勧めします。詳しくは、「コサイン」を参照してください。

  • dotProduct - は cosine と同様の類似性を測定しますが、ベクトルの大きさを考慮します。これにより、角度と大きさの両方に基づいて類似性を効率的に測定できます。詳しくは、「 ドット積 」を参照してください。

    大きさを正規化すると、類似性の測定において cosinedotProduct はほぼ同じになります。

sample_mflix.embedded_movies コレクションの次のインデックス定義は、コレクション内のすべての動的にインデックス可能なフィールドを動的にインデックスされ、plot_embedding フィールドを knnVector 型として静的にインデックスされます。plot_embedding フィールドには、OpenAI の text-embedding-ada-002 埋め込みモデルを使用して作成された埋め込みが含まれます。インデックス定義では、1536 ベクトル次元を指定し、 euclidean を使用して類似性を測定します。

1{
2 "mappings": {
3 "dynamic": true,
4 "fields": {
5 "plot_embedding": {
6 "type": "knnVector",
7 "dimensions": 1536,
8 "similarity": "euclidean"
9 }
10 }
11 }
12}

If you load the sample data on your cluster and create the preceding MongoDB Search index for this collection, you can run $vectorSearch queries against this collection. To learn more about the sample queries that you can run, see $vectorSearch Examples.

MongoDB 検索インデックスをベクトル型に移行するには、ベクトルフィールドのインデックス定義内の knnVector 型を vector 型に置き換えます。

To use the vector type for the plot_embedding field in the sample index definition for the sample_mflix.embedded_movies collection, replace the index definition with the following:

1{
2 "mappings": {
3 "dynamic": true,
4 "fields": {
5 "plot_embedding": {
6 "type": "vector",
7 "dimensions": 1536,
8 "similarity": "euclidean"
9 }
10 }
11 }
12}

vector型フィールドに対してクエリを実行するには、 演算子の代わりに vectorSearch(MongoDB Search 演算子)を使用する必要があります。knnBeta

注意

既存のknnBeta 演算子クエリは、vector 型インデックスに対して引き続き実行できます。インデックスを移行した後、すぐに knnBeta 演算子クエリを vectorSearch(MongoDB 検索する 演算子) に移行することをお勧めします。