Google Cloud モデルグループを使用して投票AIモデルを配置

埋め込みと再ランク付けAPI はプレビュー段階です。機能および関連するドキュメントは、プレビュー期間中にいつでも変更される可能性があります。

Google Cloud モデルツリーからMongoDBモデルの投票AIを検索して配置できます

モデルグループは、 MongoDBモデルごとに Vyage AIのライセンスを管理し、オンデマンドハードウェアまたは既存のコンピュートエンジンの予約を使用した配置オプションを提供します。

MongoDBモデルによる投票AI は自己配置型の提携するモデルであるため、モデルの使用量と Vertex AIインフラストラクチャの消費量の両方を支払うことを意味します。 Vertex AI が配置を処理し、エンドポイント管理機能を提供します。

利用可能なモデル

配置できるモデルを確認するには、Google Cloud モデル結果で「Voyage」を検索します。

投票AIモデルの詳細については、「モデルの概要」を参照してください。

価格

Google Cloud モデルツリーのMongoDBモデルによる投票AIの価格には、次のものが含まれます。

モデル使用料金: 時間単位で請求される、排他的AIモデルコンテナの使用コスト。使用料金は、特定のモデルと配置用に選択したハードウェア構成によって異なります。詳細な料金情報については、Google Cloud Marketplace のモデルのリストページの「価格」セクションを参照してください。
お使いのリージョンにある Google Cloud の基礎となるインスタンス: 基礎となる Google Cloud CPUインスタンスのコスト（リージョン固有の Nvidia L4 、A100 、H100 など）は毎月請求され、月額料金は請求されます。 vCPU。詳しくは、「 Google Cloud コンピュートエンジンの料金」を参照してください。

すべての請求料金は、Google Cloud の請求書の Vertex AIの使用として表示されます。

特定の投票AIモデルの価格を表示するには:

モデルフィールドにGo。

モデルを検索します。

Model Garden 検索ボックスでモデルを検索します。

モデルをクリックします。

表示するモデルをクリックすると、その詳細ページが開きます。

価格セクションに移動します。

Overviewタブで、Pricing セクションにスクロールします。

詳細な価格を表示します。

モデルの Google Cloud Marketplace リストに接続するリンクをクリックします。リストエントリの Pricingタブには、詳細な価格情報が表示されます。

Quotas

投票AIモデルを配置すると、割り当ての対象となる Vertex AIリソースが消費されます。Quotas Google Cloud コンソールの IAM ページの [] セクションで割り当てを表示および管理できます。詳しくは、「プロジェクトの割り当てを表示する」を参照してください。同じページで、現在の割り当てを右クリックし、[] Edit quotaをクリックして、必要に応じて割り当てを増やすためのリクエストを送信できます。

前提条件

Google Cloud Vertex AIを通じてMongoDBモデルの投票AIの使用を開始するには、次の手順を実行する必要があります。

Google Cloudプロジェクトと開発環境を設定します。詳しくは、「プロジェクトと開発環境を設定する」を参照してください。
Vertex AI API を有効にします。手順については、「セットアップ」を参照してください。

ハードウェア構成

モデルラグの各モデルには、推奨ハードウェア構成が示されています。各 Vyage モデルの推奨ハードウェア仕様については、「 Vertex AI用の Google Cloud Model 再構築」を参照してください。

例、4 、、、、およびモデルでは、Vertex AIモデルグループが配置について提案する次の推奨インスタンスを使用します。これらの推奨事項は変更される可能性があるため、特定の Vyage AIモデルの公式 Google Cloud Platform ページを参照して、推奨ハードウェアを確認することをお勧めします。

A やなどの A2 a2-highgpu-1ga2-ultragpu-1g100インスタンスと A CPU がデフォルトの選択になります。
より高いパフォーマンスニーズには、H CPU と H などの A3 インスタンスが推奨されています。a3-highgpu-1g100

サポートされているリージョン

モデルデータベースには、各投票AIモデルでサポートされているリージョンが一覧表示されます。モデルの別のリージョンでサポートが必要な場合は、 MongoDBサポートにお問い合わせください。

ベストプラクティスと制限事項

エンドポイント タイプ: すべての投票AIモデルには専用のパブリックエンドポイントタイプが必要です。詳しくは、「エンドポイントの種類を選択する」を参照してください。
input_type: クエリとドキュメントの理解: input_typeパラメーターは、検索タスクの埋め込みを最適化します。検索クエリには"query" "document"を使用し、検索されるコンテンツにはを使用します。この最適化により、検索の精度が向上します。input_type パラメータの詳細については、「埋め込みと再ランク付けAPI の概要」を参照してください。
異なる出力サイズを使用する: 投票モデルは、複数の出力ディメンションをサポートしています。 4256、512 、1024 （デフォルトは）、単位が小さい場合、ストレージとコンピューティングのコストが削減されますが、単位が大きいと精度が向上する可能性があります。精度要件とリソース制約の最もバランスが取れたディメンションを選択します。2048

投票AIモデルの特定

モデルシャードでMongoDBモデルの投票AIを見つけるには、次の手順に従います。

モデルフィールドにGo。

モデルフィールドコンソールにGo。

投票モデルを検索します。

Search Modelsフィールドに「Voyage」と入力すると、 MongoDBモデル別の投票AIのリストが表示されます。

注意

Google Cloud Marketplace には、マーケットプレイス全体と Vertex AIモデル照合サイト内に 1 つの検索ボックスがあります。 MongoDBモデルによる投票AIを検索するには、 Vertex AIモデルツリーサイトの検索ボックスを使用します。

または、Model Garden > Model Collections > Partner Models を通じて MongoDB AIモデルに移動し、ここにリストされている任意の Voyage AI モデルを選択することもできます。

また、Task-specific solutions まで下にスクロールすると、そのまま使用したり、ニーズに合わせてカスタマイズしたりできる MongoDB AIモデルを見つけることができます。

Vertex AIでの投票AIモデルの配置

MongoDBモデルの Vyage AIを使用して予測するには、オンライン推論用のプライベートエンドポイントにそれを配置する必要があります。配置は、低レイテンシと高スループットのオンライン予測のモデルに物理リソースを関連付けます。 1 つのエンドポイントに複数のモデルを配置することも、同じモデルを複数のエンドポイントに配置することもできます。

モデルを配置するときは、次のオプションを考慮してください。

エンドポイントのロケーション
モデルコンテナ
モデルの実行に必要な計算リソース

モデルを配置すると、これらの設定を変更することはできません。配置構成を変更する必要がある場合は、モデルの配置を解除し、新しい設定で再配置する必要があります。

投票AIモデルには専用のパブリックエンドポイントが必要です。詳しくは、Google Cloud Vertex AIドキュメントの「パブリックエンドポイントの作成」を参照してください。

コンソールを使用して、Google Cloud Vertex AIにモデルを配置するには次のようにします。

モデルを見つけます。

モデルコンソールにGo、フィールドで「Voyage」を検索すると、Search Models MongoDBモデル別の投票AIのリストが表示されます。

配置するモデルをクリックして、詳細ページを開きます。

モデルを有効にし、契約を受け入れます。

[Enable をクリックします。 MongoDB Marketplace 終了ユーザー契約が開きます。契約を確認して受け入れて、モデルを有効にし、必要な商用使用ライセンスを取得します。

配置オプションを確認します。

契約に同意すると、モデルページには次のオプションが表示されます。

Deploy a model: モデルをモデルレジストリに保存し、Google Cloud のエンドポイントに配置します。コンソールを使用して配置するには、次の手順に進みます。
Create an Open Notebook for Voyage Embedding Models Family: コラボレーション環境でモデルを微調整してカスタマイズし、最適なコストとパフォーマンスを実現するようにモデルを組み合わせて使用できます。 V storage AIの Vertex AIノートブックのサンプルを参照してください。
View Code: 配置してモデルを使用するためのコードサンプルを表示します。コードを使用してプログラムによって配置するには、「コードを使用した配置」を参照してください。

モデルの詳細を確認します。

モデルのリージョン、ハードウェア要件、考慮事項、ユースケース、および価格情報を確認します。

Deploy model[ をクリックします。

配置プロセスを開始するには、Deploy model ボタンをクリックします。

配置フォームに入力します。

配置オプションを検討および編集できるフォームが開きます。 Vertex AI は、モデルに最適化されたデフォルト設定を提供しますが、必要に応じてカスタマイズすることもできます。例、マシンタイプ、CPU タイプ、およびレプリカの数を選択できます。次の例は、 v提供-4モデルのデフォルト設定を示していますが、これらは変更される可能性があるため、配置する前に設定を慎重に確認してください。

フィールド	説明
Resource ID	ドロップダウンメニューから [] を選択します（事前選択されています）。
Model Name	ドロップダウンメニューから [] を選択します（事前選択されています）。
Region	目的のリージョンを選択します（`us-central1` など）。
Endpoint name	エンドポイントの名前を指定します（`mongodb_voyage-4_latest-mg-one-click-deploy` など）。
Serving spec	マシンタイプを選択します（`g2-standard-4` など）。
Accelerator type	CPU タイプ（`NVIDIA_L4` など）を選択します。
Accelerator count	CPU の数を指定します（例: `1`）。
Replica count	レプリカの最小数と最大数を指定します（`1 - 1` など）。
Reservation type	予約タイプを選択します（`No reservation` など）。
VM provisioning model	プロビジョニングモデルを選択します（`Standard` など）。
Endpoint access	Public (Dedicated endpoint) を選択します。

設定を確認します。

Vertex AI は、表示される設定を最適化します。これはデフォルトで適用されます。設定をカスタマイズするには、Edit settings をクリックします。例、では、より強力なマシンタイプまたは CPU を選択できます。

Check quotas.

構成画面には、使用可能な割り当てが表示されます。必要に応じて割り当てを管理するには、Quotas へのリンクを使用します。

モデルを配置します。

配置プロセスを開始するには、Deploy をクリックします。

完了するまで待機します。

配置が完了すると、通知が届きます。配置が完了したら、Google Cloud Vertex AI、Deploy、Endpoints リストをクリックして配置を見つけます。

コードを使用した配置

モデルの詳細ページから View Code を選択した場合は、Vertex AI SDK を使用してプログラムによってモデルを配置できます。このアプローチでは、コードを通じて配置構成を完全に制御できます。

Google Cloud Vertex AI SDK の詳細については、 Python用の Vertex AI SDK ドキュメントを参照してください。

注意

このセクションのコード例は4 mongos に該当し、変更される可能性があります。最新のコード例については、モデルView Code ツリー内のモデルのページにある []タブを参照してください。他の MongoDB AIモデルの場合、コードは同様ですが、モデル固有の詳細については、モデルツリーのそのモデルのページを確認してください。

コードを使用してモデルを配置するには、次の手順に従います。

モデルを初期化します。

まず、Modelですからモデルを初期化し、配置オプションを表示します。

from vertexai import model_garden
MODEL_NAME = "mongodb/voyage-4@latest"
model = model_garden.OpenModel(MODEL_NAME)
deploy_options = model.list_deploy_options(concise=True)
print(deploy_options)

エンドポイントに配置します。

新しいモデルを配置するか、既存のエンドポイントを使用するかを選択します。

# Choose whether to deploy a new model or use an existing endpoint:
deployment_option = "deploy_new"  # ["deploy_new", "use_existing"]
# If using existing endpoint, provide the endpoint ID:
ENDPOINT_ID = ""  # {type:"string"}
if deployment_option == "deploy_new":
    print("Deploying new model...")
    endpoint = model.deploy(
        machine_type="a3-highgpu-1g",
        accelerator_type="NVIDIA_H100_80GB",
        accelerator_count=1,
        accept_eula=True,
        use_dedicated_endpoint=True,
    )
    print(f"Endpoint deployed: {endpoint.display_name}")
    print(f"Endpoint resource name: {endpoint.resource_name}")
else:
    if not ENDPOINT_ID:
        raise ValueError("Please provide an ENDPOINT_ID when using existing endpoint")
    from google.cloud import aiplatform
    print(f"Connecting to existing endpoint: {ENDPOINT_ID}")
    endpoint = aiplatform.Endpoint(
        endpoint_name=f"projects/{PROJECT_ID}/locations/{LOCATION}/endpoints/{ENDPOINT_ID}"
    )
    print(f"Using endpoint: {endpoint.display_name}")
    print(f"Endpoint resource name: {endpoint.resource_name}")

重要

投票AIモデルには専用のパブリックエンドポイントが必要なため、use_dedicated_endpoint を True に設定します。

Vertex AI は管理対象のエンドポイントにモデルを配置します。このエンドポイントにアクセスすると、Google Cloud コンソールまたは Vertex AI APIを通じてオンライン推論またはバッチする推論を行うことができます。

詳細については、Google Cloud Vertex AIドキュメントの「エンドポイントへのモデルの配置」を参照してください。

予測を行います。

配置後は、Vertex AIエンドポイントを使用して予測を行うことができます。

すべてのエンドポイントパラメーターと予測オプションについては、「埋め込みと再ランク付けAPI の概要」を参照してください。

import json
# Multiple texts to embed
texts = [
    "Machine learning enables computers to learn from data.",
    "Natural language processing helps computers understand human language.",
    "Computer vision allows machines to interpret visual information.",
    "Deep learning uses neural networks with multiple layers."
]
# Prepare the batch request and make invoke call
body = {
    "input": texts,
    "output_dimension": 1024,
    "input_type": "document"
}
response = endpoint.invoke(
    request_path="/embeddings",
    body=json.dumps(body).encode("utf-8"),
    headers={"Content-Type": "application/json"}
)
# Extract embeddings
result = response.json()
embeddings = [item["embedding"] for item in result["data"]]
print(f"Number of texts embedded: {len(embeddings)}")
print(f"Embedding dimension: {len(embeddings[0])}")
print(f"\nFirst embedding (first 5 values): {embeddings[0][:5]}")
print(f"Second embedding (first 5 values): {embeddings[1][:5]}")

モデルの配置を解除し、エンドポイントを削除

配置されたモデルとそのエンドポイントを削除するには:

エンドポイントからモデルを配置解除します。
必要に応じて、エンドポイント自体を削除します。

詳細な手順については、Google Cloud Vertex AIドキュメントの「モデルの配置を解除し、エンドポイントを削除する」を参照してください。

重要

エンドポイントを削除できるのは、すべてのモデルがエンドポイントから解除された後にのみです。モデルの配置を解除し、エンドポイントを削除すると、そのエンドポイントのすべての推論サービスと請求が停止されます。

戻る

Azure マーケットプレイス

利用可能なモデル

価格

モデル フィールドにGo。

モデルを検索します。

モデルをクリックします。

価格セクションに移動します。

詳細な価格を表示します。

Quotas

前提条件

ハードウェア構成

サポートされているリージョン

ベストプラクティスと制限事項

投票AIモデルの特定

モデル フィールドにGo。

投票モデルを検索します。

注意

Vertex AIでの投票AIモデルの配置

モデルを見つけます。

配置するモデルをクリックして、詳細ページを開きます。

モデルを有効にし、契約を受け入れます。

配置オプションを確認します。

モデルの詳細を確認します。

Deploy model[ をクリックします。

配置フォームに入力します。

設定を確認します。

Check quotas.

モデルを配置します。

完了するまで待機します。

コードを使用した配置

注意

モデルを初期化します。

エンドポイントに配置します。

重要

予測を行います。

モデルの配置を解除し、エンドポイントを削除

重要

モデルフィールドにGo。

モデルフィールドにGo。