AWS Marketplace モデル パッケージ は、モデルと推論コードを含むコンテナ化されたソリューションです。これらはアカウントと仮想プライベートクラウド(VPC)に配置します。モデル パッケージには、次の主な利点があります。
データフローとアクセス制御: データフローとAPIアクセスを完全に制御するために、アカウントとVPCにモデルを配置します。これにより、サードパーティまたはマルチテナント処理に関連するデータ プライバシーのリスクに対処できます。
AWSによる信頼性とコンプライアンス: AWS はサブプロセッサとして機能するため、すべてのAWS信頼性とコンプライアンス保証を継承します。
AWSによる請求と支払い: 既存のAWS請求情報とクレジットを使用して、マーケットプレイス リストを通じて MongoDB AIモデルを購入します。サードパーティの支払いと請求システムを個別に管理する必要はありません。
モデルパッケージは、 リアルタイム推論APIエンドポイントまたはバッチする変換ジョブとして配置できます。リアルタイム推論APIエンドポイントは、リクエストごとの推論のための永続的でフルマネージドなAPIエンドポイントを提供します。バッチ変換ジョブは、データセットに対する一括推論のために有限の実行プロセスを実行し、予測をファイルに書込みます。どちらの配置タイプも CPU などのAWSインスタンスで実行されます。
利用可能なモデル
配置できるモデルを確認するには、 MongoDB Marketplace Shell Profile にアクセスしてください。
投票AIモデルの詳細については、「 モデルの概要 」を参照してください。
価格
MongoDB AIモデルパッケージの使用に対する価格は、ソフトウェア価格とインフラストラクチャ価格で構成されており、どちらも時間単位で表示されます。ソフトウェア価格はモデル使用量のコストをカバーしますが、1 時間あたりの合計コストはソフトウェア価格とインフラストラクチャ価格の合計です。価格は、配置タイプ(リアルタイム推論APIエンドポイントとバッチする変換ジョブ)、インスタンスタイプ、リージョンによって異なります。すべての MongoDB モデルには無料試用版が付属しています。各モデルパッケージの価格の詳細は、 AWS Marketplace の製品リスト ページで確認できます。
次のセクションでは、モデルをサブスクライブして配置する方法を示します。
前提条件
AWS Marketplace のリストをサブスクライブするには、次のAWS ID アクセス管理(IAM)権限が必要です。
aws-marketplace:ViewSubscriptionsaws-marketplace:Subscribeaws-marketplace:Unsubscribe
これらを追加するには、 AWSアカウント コンソールにサインインし、 AWSドキュメントで手順を確認してください。
手順
AWS Marketplace を使用してサブスクライブするには、次の手順に従います。
コンソールのサブスクライブ管理ページからAWS Marketplace サブスクリプションを確認および管理することもできます。サブスクライブはいつでもキャンセルできますが、サブスクライブをキャンセルしても既存のリアルタイム推論エンドポイントやバッチする変換ジョブは終了されないことに注意してください。詳細については、「 リアルタイム推論エンドポイントの削除 」を参照してください。
モデルパッケージの配置には特定の Sage Administration インスタンスが必要です(例:5 m.g.xLarge)。ジョブ。これらの割り当ては通常、デフォルトで5.2 5.20 に設定されています。必要に応じて割り当ての増加をリクエストには、 Sagemation Service Quotas コンソールにアクセスします。
AWS Marketplace から Vyage AIモデルパッケージのサブスクライブと配置でサポートが必要な場合は、 MongoDBサポート にお問い合わせください。
パッケージ配置のモデル化
このセクションには、 Amazon Sage を使用してモデルパッケージを配置する方法に関するガイダンスが含まれています。
Amazon Sage の作成
Amazon Sage を使用することで、 AWSアカウントにすでに認証されているホスト型ノート PC 環境が含まれる、ML およびAI開発向けのウェブベースのインターフェースです。ローカル マシンなど、別の希望する MongoDB ノート実行環境がある場合は、このセクションをスキップできます。この環境からAWSアカウントは認証できます。 Sage Administration のドキュメントに従って Sage Administration Studio を起動し、JupyterLog 環境を起動します。
ユーティリティ ノート
AWS SDK( Boto3 )とAmazon SageMany Python SDK を使用して、例GitHub ノートを使用してPythonを使い始めることができます。 Vyage AI AWSリポジトリをクローンした後、Sagemation Studio または希望する jupyter ノート実行環境でノートを実行できます。例、 を実行中場合はgit clone
https://github.com/voyage-ai/voyageai-aws.git になります。
あるいは、GitHub からノートを直接ダウンロードし、Sagemation Studio またはご希望のノートク環境にアップロードすることもできます。
ノートが Sage Builder または希望する実行環境に表示されたら、提供されたコードを実行してモデルを配置できます。
リアルタイム推論エンドポイントの削除
必要以上に長いリアルタイム推論エンドポイントを実行しないでください。指定すると、余計なコストが発生し、予期しない料金が発生する可能性があります。提供された jupyter ノートを使用している場合は、必ずクリーンアップ コードを実行してください。これにより、エンドポイントと関連するエンドポイント構成が削除されます。エンドポイントは、Sage Administration Studio または Sageノード コンソールを使用して管理および削除できます。詳細については、 AWS のドキュメント を参照してください。
高度な配置
前のセクションで説明されているJupyter ノートは、モデル パッケージをデプロイする方法を学習するために役立ちます。ただし、Cloud ConsoleFormation、SageMany、 AWS CLIなど、モデル パッケージを配置する他の方法はいくつかあります。これらの代替メソッドは、既存の本番ワークフローに適している場合があります。 (例: )。
宣言型インフラストラクチャ仕様用の CloudFormation
インタラクティブUIベースの配置のための Sagemation コンソール
プログラムによるシェル のオーケストレーションのためのAWS CLI
これらのメソッドを使用してモデルパッケージを構成して配置するには次の手順に従います。
製品リスト ページにGo。
AWS Marketplace からサブスクライブされたMongoDB Vyage モデルの製品リストページにGo。