/ /

ベクトル検索のためのベクトル埋め込みのインデックス作成方法

knnVector 型を使用してベクトル埋め込みをインデックスできます。ベクトルフィールドは、次の型の番号の配列として表せます。

BSON int32knnBeta演算子を使用してクエリを実行するための、 int64 、またはdouble データ型。
BSON double $vectorSearch ステージを使用するクエリのデータ型

knnBeta 現在非推奨となっている演算子と、集計パイプラインの $vectorSearch ステージを使用して、knnVector としてインデックスのフィールドをクエリできます。

注意

Atlas UIのMongoDB Search Visual Editor を使用して、knnVector 型のフィールドを設定することはできません。代わりに、 MongoDB Search JSON Editor を使用して、knnVector 型のフィールドを構成します。

MongoDB ベクトル検索は、 Atlas CLI を使用して作成したローカル Atlas 配置で使用することもできます。詳細については、「Atlas 配置のローカル配置の作成」を参照してください。

`knnVector` 型の制限

ドキュメントの配列内のフィールド、またはオブジェクトの配列内のフィールド（ MongoDB Search embeddedDocuments 型）を knnVector タイプとしてインデックスはできません。

dateFacet 型のインデックスの定義

以下は、knnVector 型の JSON 構文です。デフォルトのインデックス定義を以下のように置き換えます。フィールドの詳細については、「フィールドプロパティ」を参照してください。

1 {
2   "mappings": {
3     "dynamic": true|false,
4     "fields": {
5       "<field-name>": {
6         "type": "knnVector",
7         "dimensions": <number-of-dimensions>,
8         "similarity": "euclidean | cosine | dotProduct"
9       }
10     }
11   }
12 }

dateFacet フィールドのプロパティを構成する

knnVector 型には、次のオプションがあります。

オプション	タイプ	必要性	目的
`type`	string	必須	このフィールド型を識別する、人間が判読できるラベル。値は`knnVector`でなければなりません。
`dimensions`	整数	必須	MongoDB Search がインデックス時およびクエリ時に強制されるベクトル次元の数。この値は `8192` より大きくすることはできません。
`similarity`	string	必須	上位 K 近傍の検索に使用するベクトル類似度関数。値は次のいずれかになります。 `euclidean` - ベクトルの両端間の距離を測定します。これにより、さまざまな次元に基づいて類似性を測定できます。詳しくは、「Euclidean.」を参照してください。 `cosine` - ベクトル間の角度に基づいて類似性を測定します。これにより、大きさでスケーリングされない類似性を測定できます。`cosine` では絶対値ゼロのベクトルは使用できません。コサイン類似度を測定するには、ベクトルを正規化し、代わりに `dotProduct` を使用することをお勧めします。詳しくは、「コサイン」を参照してください。 `dotProduct` - は `cosine` と同様の類似性を測定しますが、ベクトルの大きさを考慮します。これにより、角度と大きさの両方に基づいて類似性を効率的に測定できます。詳しくは、「ドット積」を参照してください。大きさを正規化すると、類似性の測定において `cosine` と `dotProduct` はほぼ同じになります。

dateFacet 型の例を試す

sample_mflix.embedded_movies コレクションの次のインデックス定義は、コレクション内のすべての動的にインデックス可能なフィールドを動的にインデックスされ、plot_embedding フィールドを knnVector 型として静的にインデックスされます。plot_embedding フィールドには、OpenAI の text-embedding-ada-002 埋め込みモデルを使用して作成された埋め込みが含まれます。インデックス定義では、1536 ベクトル次元を指定し、 euclidean を使用して類似性を測定します。

1 {
2   "mappings": {
3     "dynamic": true,
4     "fields": {
5       "plot_embedding": {
6         "type": "knnVector",
7         "dimensions": 1536,
8         "similarity": "euclidean"
9       }
10     }
11   }
12 }

If you load the sample data on your cluster and create the preceding MongoDB Search index for this collection, you can run $vectorSearch queries against this collection. To learn more about the sample queries that you can run, see $vectorSearch Examples.

Migrate to `vector` Type

MongoDB 検索インデックスをベクトル型に移行するには、ベクトルフィールドのインデックス定義内の knnVector 型を vector 型に置き換えます。

例

To use the vector type for the plot_embedding field in the sample index definition for the sample_mflix.embedded_movies collection, replace the index definition with the following:

1 {
2   "mappings": {
3     "dynamic": true,
4     "fields": {
5       "plot_embedding": {
6         "type": "vector",
7         "dimensions": 1536,
8         "similarity": "euclidean"
9       }
10     }
11   }
12 }

vector型フィールドに対してクエリを実行するには、演算子の代わりに vectorSearch（MongoDB Search 演算子）を使用する必要があります。knnBeta

注意

既存のknnBeta 演算子クエリは、vector 型インデックスに対して引き続き実行できます。インデックスを移行した後、すぐに knnBeta 演算子クエリを vectorSearch（MongoDB 検索する演算子）に移行することをお勧めします。

戻る

geo

数値

1	{
2	"mappings": {
3	"dynamic": true\|false,
4	"fields": {
5	"<field-name>": {
6	"type": "knnVector",
7	"dimensions": <number-of-dimensions>,
8	"similarity": "euclidean \| cosine \| dotProduct"
9	}
10	}
11	}
12	}

1	{
2	"mappings": {
3	"dynamic": true,
4	"fields": {
5	"plot_embedding": {
6	"type": "knnVector",
7	"dimensions": 1536,
8	"similarity": "euclidean"
9	}
10	}
11	}
12	}