Docs Menu
Docs Home
/

Google Cloud モデル グループを使用して投票AIモデルを配置

Google Cloud モデル ツリーからMongoDBモデルの投票AIを検索して配置できます

モデル グループは、 MongoDBモデルごとに Vyage AIのライセンスを管理し、オンデマンドハードウェアまたは既存のコンピュート エンジンの予約を使用した配置オプションを提供します。

MongoDBモデルによる投票AI は自己配置型の提携するモデルであるため、モデルの使用量と Vertex AIインフラストラクチャの消費量の両方を支払うことを意味します。 Vertex AI が配置を処理し、エンドポイント管理機能を提供します。

配置できるモデルを確認するには、Google Cloud モデル 結果で「Voyage」を検索します。

投票AIモデルの詳細については、「 モデルの概要 」を参照してください。

Google Cloud モデル ツリーのMongoDBモデルによる投票AIの価格には、次のものが含まれます。

  • モデル使用料金: 時間単位で請求される、 排他的AIモデルコンテナの使用コスト。使用料金は、特定のモデルと配置用に選択したハードウェア構成によって異なります。詳細な料金情報については、Google Cloud Marketplace のモデルのリスト ページの「価格」セクションを参照してください。

  • お使いのリージョンにある Google Cloud の基礎となるインスタンス: 基礎となる Google Cloud CPUインスタンスのコスト(リージョン固有の Nvidia L4 、A100 、H100 など)は毎月請求され、月額料金は請求されます。 vCPU。詳しくは、「 Google Cloud コンピュート エンジンの料金 」を参照してください。

すべての請求料金は、Google Cloud の請求書の Vertex AIの使用として表示されます。

特定の投票AIモデルの価格を表示するには:

1
2

Model Garden 検索ボックスでモデルを検索します。

3

表示するモデルをクリックすると、その詳細ページが開きます。

4

Overviewタブで、Pricing セクションにスクロールします。

5

モデルの Google Cloud Marketplace リストに接続する リンクをクリックします。リスト エントリの Pricingタブには、詳細な価格情報が表示されます。

投票AIモデルを配置すると、割り当ての対象となる Vertex AIリソースが消費されます。Quotas Google Cloud コンソールの IAM ページの [] セクションで割り当てを表示および管理できます。詳しくは、「プロジェクトの割り当てを表示する 」を参照してください。同じページで、現在の割り当てを右クリックし、[] Edit quotaをクリックして、必要に応じて割り当てを増やすためのリクエストを送信できます。

Google Cloud Vertex AIを通じてMongoDBモデルの投票AIの使用を開始するには、次の手順を実行する必要があります。

モデル ラグの各モデルには、推奨ハードウェア構成が示されています。各 Vyage モデルの推奨ハードウェア仕様については、「 Vertex AI用の Google Cloud Model 再構築 」を参照してください。

例、4 、 、 、 、および モデルでは、Vertex AIモデル グループが配置について提案する次の推奨インスタンスを使用します。これらの推奨事項は変更される可能性があるため、特定の Vyage AIモデルの公式 Google Cloud Platform ページを参照して、推奨ハードウェア を確認することをお勧めします。

  • A や などの A2 a2-highgpu-1ga2-ultragpu-1g100インスタンスと A CPU がデフォルトの選択になります。

  • より高いパフォーマンス ニーズには、H CPU と H などの A3 インスタンスが推奨されています。a3-highgpu-1g100

モデル データベースには、各投票AIモデルでサポートされているリージョンが一覧表示されます。モデルの別のリージョンでサポートが必要な場合は、 MongoDBサポート にお問い合わせください。

  • エンドポイント タイプ: すべての投票AIモデルには専用のパブリック エンドポイント タイプが必要です。詳しくは、「 エンドポイントの種類を選択する 」を参照してください。

  • input_type: クエリとドキュメントの理解: input_typeパラメーターは、検索タスクの埋め込みを最適化します。検索クエリには"query" "document"を使用し、検索されるコンテンツには を使用します。この最適化により、検索の精度が向上します。input_type パラメータの詳細については、「 埋め込みと再ランク付けAPI の概要 」を参照してください。

  • 異なる出力サイズを使用する: 投票 モデルは、複数の出力ディメンション をサポートしています。 4256、512 、1024 (デフォルトは)、 単位が小さい場合、ストレージとコンピューティングのコストが削減されますが、単位が大きいと精度が向上する可能性があります。精度要件とリソース制約の最もバランスが取れたディメンションを選択します。2048

モデル シャードでMongoDBモデルの投票AIを見つけるには、次の手順に従います。

1

モデル フィールド コンソールにGo。

2

Search Modelsフィールドに「Voyage」と入力すると、 MongoDBモデル別の投票AIのリストが表示されます。

注意

Google Cloud Marketplace には、マーケットプレイス全体と Vertex AIモデル 照合サイト内に 1 つの検索ボックスがあります。 MongoDBモデルによる投票AIを検索するには、 Vertex AIモデル ツリー サイトの 検索ボックスを使用します。

または、Model Garden > Model Collections > Partner Models を通じて MongoDB AIモデルに移動し、ここにリストされている任意の Voyage AI モデルを選択することもできます。

また、Task-specific solutions まで下にスクロールすると、そのまま使用したり、ニーズに合わせてカスタマイズしたりできる MongoDB AIモデルを見つけることができます。

MongoDBモデルの Vyage AIを使用して予測するには、オンライン推論用のプライベートエンドポイントにそれを配置する必要があります。配置は、低レイテンシと高スループットのオンライン予測のモデルに物理リソースを関連付けます。 1 つのエンドポイントに複数のモデルを配置することも、同じモデルを複数のエンドポイントに配置することもできます。

モデルを配置するときは、次のオプションを考慮してください。

  • エンドポイントのロケーション

  • モデルコンテナ

  • モデルの実行に必要な計算リソース

モデルを配置すると、これらの設定を変更することはできません。配置構成を変更する必要がある場合は、モデルの配置を解除し、新しい設定で再配置する必要があります。

投票AIモデルには専用のパブリック エンドポイントが必要です。詳しくは、Google Cloud Vertex AIドキュメントの「 パブリックエンドポイントの作成 」を参照してください。

コンソールを使用して、Google Cloud Vertex AIにモデルを配置するには次のようにします。

1

モデル コンソールにGo、 フィールドで「Voyage」を検索すると、Search Models MongoDBモデル別の投票AIのリストが表示されます。

2
3

[Enable をクリックします。 MongoDB Marketplace 終了ユーザー契約が開きます。契約を確認して受け入れて、モデルを有効にし、必要な商用使用ライセンスを取得します。

4

契約に同意すると、モデルページには次のオプションが表示されます。

  • Deploy a model: モデルをモデル レジストリに保存し、Google Cloud のエンドポイントに配置します。コンソールを使用して配置するには、次の手順に進みます。

  • Create an Open Notebook for Voyage Embedding Models Family: コラボレーション環境でモデルを微調整してカスタマイズし、最適なコストとパフォーマンスを実現するようにモデルを組み合わせて使用できます。 V storage AIの Vertex AIノートブックのサンプル を参照してください。

  • View Code: 配置してモデルを使用するためのコード サンプルを表示します。コードを使用してプログラムによって配置するには、「 コードを使用した配置 」を参照してください。

5

モデルのリージョン、ハードウェア要件、考慮事項、ユースケース、および価格情報を確認します。

6

配置プロセスを開始するには、Deploy model ボタンをクリックします。

7

配置オプションを検討および編集できるフォームが開きます。 Vertex AI は、モデルに最適化されたデフォルト設定を提供しますが、必要に応じてカスタマイズすることもできます。例、マシンタイプ、CPU タイプ、およびレプリカの数を選択できます。次の例は、 v提供-4モデルのデフォルト設定を示していますが、これらは変更される可能性があるため、配置する前に設定を慎重に確認してください。

フィールド
説明

Resource ID

ドロップダウン メニューから [] を選択します(事前選択されています)。

Model Name

ドロップダウン メニューから [] を選択します(事前選択されています)。

Region

目的のリージョンを選択します(us-central1 など)。

Endpoint name

エンドポイントの名前を指定します(mongodb_voyage-4_latest-mg-one-click-deploy など)。

Serving spec

マシンタイプを選択します(g2-standard-4 など)。

Accelerator type

CPU タイプ(NVIDIA_L4 など)を選択します。

Accelerator count

CPU の数を指定します(例: 1)。

Replica count

レプリカの最小数と最大数を指定します(1 - 1 など)。

Reservation type

予約タイプを選択します(No reservation など)。

VM provisioning model

プロビジョニングモデルを選択します(Standard など)。

Endpoint access

Public (Dedicated endpoint) を選択します。

8

Vertex AI は、表示される設定を最適化します。これはデフォルトで 適用されます。設定をカスタマイズするには、Edit settings をクリックします。例、 では、より強力なマシンタイプまたは CPU を選択できます。

9

構成画面には、使用可能な割り当てが表示されます。必要に応じて割り当てを管理するには、Quotas へのリンクを使用します。

10

配置プロセスを開始するには、Deploy をクリックします。

11

配置が完了すると、通知が届きます。配置が完了したら、Google Cloud Vertex AIDeployEndpoints リストをクリックして配置を見つけます。

モデルの詳細ページから View Code を選択した場合は、Vertex AI SDK を使用してプログラムによってモデルを配置できます。このアプローチでは、コードを通じて配置構成を完全に制御できます。

Google Cloud Vertex AI SDK の詳細については、 Python用の Vertex AI SDK ドキュメントを参照してください。

注意

このセクションのコード例は4 mongos に該当し、変更される可能性があります。最新のコード例については、モデルView Code ツリー内のモデルの ページにある []タブを参照してください。他の MongoDB AIモデルの場合、コードは同様ですが、モデル固有の詳細については、モデル ツリーのそのモデルのページを確認してください。

コードを使用してモデルを配置するには、次の手順に従います。

1

まず、Modelです からモデルを初期化し、配置オプションを表示します。

from vertexai import model_garden
MODEL_NAME = "mongodb/voyage-4@latest"
model = model_garden.OpenModel(MODEL_NAME)
deploy_options = model.list_deploy_options(concise=True)
print(deploy_options)
2

新しいモデルを配置するか、既存のエンドポイントを使用するかを選択します。

# Choose whether to deploy a new model or use an existing endpoint:
deployment_option = "deploy_new" # ["deploy_new", "use_existing"]
# If using existing endpoint, provide the endpoint ID:
ENDPOINT_ID = "" # {type:"string"}
if deployment_option == "deploy_new":
print("Deploying new model...")
endpoint = model.deploy(
machine_type="a3-highgpu-1g",
accelerator_type="NVIDIA_H100_80GB",
accelerator_count=1,
accept_eula=True,
use_dedicated_endpoint=True,
)
print(f"Endpoint deployed: {endpoint.display_name}")
print(f"Endpoint resource name: {endpoint.resource_name}")
else:
if not ENDPOINT_ID:
raise ValueError("Please provide an ENDPOINT_ID when using existing endpoint")
from google.cloud import aiplatform
print(f"Connecting to existing endpoint: {ENDPOINT_ID}")
endpoint = aiplatform.Endpoint(
endpoint_name=f"projects/{PROJECT_ID}/locations/{LOCATION}/endpoints/{ENDPOINT_ID}"
)
print(f"Using endpoint: {endpoint.display_name}")
print(f"Endpoint resource name: {endpoint.resource_name}")

重要

投票AIモデルには専用のパブリック エンドポイントが必要なため、use_dedicated_endpointTrue に設定します。

Vertex AI は管理対象のエンドポイントにモデルを配置します。このエンドポイントにアクセスすると、Google Cloud コンソールまたは Vertex AI APIを通じてオンライン推論またはバッチする推論を行うことができます。

詳細については、Google Cloud Vertex AIドキュメントの「 エンドポイントへのモデルの配置 」を参照してください。

3

配置後は、Vertex AIエンドポイントを使用して予測を行うことができます。

すべてのエンドポイントパラメーターと予測オプションについては、「 埋め込みと再ランク付けAPI の概要 」を参照してください。

import json
# Multiple texts to embed
texts = [
"Machine learning enables computers to learn from data.",
"Natural language processing helps computers understand human language.",
"Computer vision allows machines to interpret visual information.",
"Deep learning uses neural networks with multiple layers."
]
# Prepare the batch request and make invoke call
body = {
"input": texts,
"output_dimension": 1024,
"input_type": "document"
}
response = endpoint.invoke(
request_path="/embeddings",
body=json.dumps(body).encode("utf-8"),
headers={"Content-Type": "application/json"}
)
# Extract embeddings
result = response.json()
embeddings = [item["embedding"] for item in result["data"]]
print(f"Number of texts embedded: {len(embeddings)}")
print(f"Embedding dimension: {len(embeddings[0])}")
print(f"\nFirst embedding (first 5 values): {embeddings[0][:5]}")
print(f"Second embedding (first 5 values): {embeddings[1][:5]}")

配置されたモデルとそのエンドポイントを削除するには:

  1. エンドポイントからモデルを配置解除します。

  2. 必要に応じて、エンドポイント自体を削除します。

詳細な手順については、Google Cloud Vertex AIドキュメントの「 モデルの配置を解除し、エンドポイントを削除する 」を参照してください。

重要

エンドポイントを削除できるのは、すべてのモデルがエンドポイントから解除された後にのみです。モデルの配置を解除し、エンドポイントを削除すると、そのエンドポイントのすべての推論サービスと請求が停止されます。

戻る

Azure マーケットプレイス

項目一覧