Join us Sept 17 at .local NYC! Use code WEB50 to save 50% on tickets. Learn more >
MongoDB Event
Docs Menu
Docs Home
/
Atlas
/

Atlas Vector Search クイック スタート

このクイック スタートでは、ベクトル埋め込みを含むサンプルドキュメントを Atlas クラスターまたはローカル Atlas 配置にロードし、それらの埋め込みに Atlas Vector Search インデックスを作成し、セマンティック検索を実行してクエリに似たドキュメントを返す方法について説明します。

所要時間: 15 分

このクイック スタートでは、次の手順を完了します。

  1. plot_embedding_voyage_3_large フィールドを vector 型としてインデックスする sample_mflix.embedded_movies コレクションのインデックス定義を作成します。voyage-3-large フィールドには、Voyage AI の plot_embedding_voyage_3_large 埋め込みモデルを使用して作成された埋め込みが含まれます。インデックス定義では 2048 ベクトル次元を指定し、dotProduct を使用して類似性を測定します。

  2. サンプル sample_mflix.embedded_movies コレクションを検索する Atlas Vector Search クエリを実行します。クエリは、$vectorSearch ステージを使用して plot_embedding_voyage_3_large フィールドを検索します。このフィールドには Voyage AI の voyage-3-large 埋め込みモデルを使用して作成された埋め込みが含まれます。このクエリは、ベクトル埋め込みを使用して plot_embedding_voyage_3_large フィールドでタイムトラベルという文字列を検索します。最大 150 の最近傍を考慮し、結果として 10 ドキュメントを返します。

詳細については、「 ラーニングの概要」を参照してください。

このクイック スタートでは、指定されたクエリにセマンティックに関連するテキストを含むドキュメントを Atlas クラスターから取得する方法に焦点を当てています。 ただし、画像やビデオなど、Atlas クラスターに書き込む可能性のある任意のデータを表す埋め込みにベクトル検索インデックスを作成することはできます。

このクイック スタートでは、映画の詳細を含むsample_mflix.embedded_moviesコレクションを使用します。 コレクション内の各ドキュメントで、 plot_embedding_voyage_3_largeフィールドには、 plotフィールドの string を表すベクトル埋め込みが含まれています。 コレクション内のドキュメントのスキーマの詳細については、「 Mflix サンプル データセット 」を参照してください。

ソース データとそれに対応するベクトル埋め込みを同じドキュメントに保存することで、複雑なクエリやハイブリッド検索で両方のフィールドを活用できます。 同じドキュメントに異なる埋め込みモデルから生成されたベクトル埋め込みを保存して、特定のユースケースに応じてさまざまなベクトル埋め込みモデルのパフォーマンスをテストする際にワークフローを効率化することもできます。

sample_mflix.embedded_movies コレクションとサンプル クエリ内のベクトル埋め込みは、Voyage AI voyage-3-large 埋め込みモデルを使用して作成されました。埋め込みモデルの選択は、ベクトル検索インデックスで使用するベクトルの次元とベクトル類似度関数に影響を与えます。お好みの埋め込みモデルを使用することができ、特定のユースケースに応じてモデルごとに精度が異なる可能性があるため、さまざまなモデルを試す価値があります。

独自のデータのベクトル埋め込みを作成する方法については、「ベクトル埋め込みの作成方法 」を参照してください。

インデックスは、特定のクエリのデータベースのパフォーマンスを向上させるコレクションのドキュメントのデータのサブセットを保持するデータ構造です。 ベクトル検索インデックスは、ベクトル埋め込みを含むフィールドを指し、ベクトルの次元、およびクエリのベクトルとデータベースに保存されているベクトル間の類似性を測定するために使用される関数が含まれます。

このクイック スタートで使用されているvoyage-3-large埋め込みモデルは、データを2048次元のベクトル埋め込みに変換し、 cosine関数をサポートしているため、このベクトル検索インデックスでは同じ数のベクトル次元と類似性関数を指定します。

このクイック スタートで実行したクエリは集計パイプラインであり、 $vectorSearchステージがANN(近似最近傍)検索を実行し、その後に結果を微調整する$projectステージが続きます。 完全一致(enn)の使用や、 filterオプションを使用してベクトル検索の範囲を絞り込む方法など、ベクトル検索クエリのすべてのオプションを確認するには、「ベクトル検索クエリの実行 」を参照してください。

戻る

Atlas Vector Search

ルール バッジを取得する

「Vector Search の基礎」を無料で習得できます。

詳細

項目一覧