AWS Marketplace モデル パッケージ は、モデルと推論コードを含むコンテナ化されたソリューションです。これらはアカウントと仮想プライベートクラウド(VPC)に配置します。モデル パッケージには、次の主な利点があります。
データフローとアクセス制御: データフローとAPIアクセスを完全に制御するために、アカウントとVPCにモデルを配置します。これにより、サードパーティまたはマルチテナント処理に関連するデータ プライバシーのリスクに対処できます。
AWSによる信頼性とコンプライアンス: AWS はサブプロセッサとして機能するため、すべてのAWS信頼性とコンプライアンス保証を継承します。
AWSによる請求と支払い: 既存のAWS請求情報とクレジットを使用して、マーケットプレイス リストを通じて Voyage AIモデルを購入します。サードパーティの支払いと請求システムを個別に管理する必要はありません。
リアルタイム推論APIエンドポイントまたはバッチする変換ジョブとしてモデルパッケージを配置できます。リアルタイム推論APIエンドポイントは、リクエストごとの推論のための永続的で完全管理されたAPIエンドポイントを提供します。バッチ変換ジョブは、データセットに対する一括推論のために有限の実行プロセスを実行し、予測をファイルに書込みます。どちらの配置タイプも CPU などのAWSインスタンスで実行されます。
利用可能なモデル
配置できるモデルを確認するには、 MongoDB Marketplace Shell Profile にアクセスしてください。
Voyage AIモデルの詳細については、「 モデルの概要 」を参照してください。
価格
Voyage AIモデルパッケージの使用に対する価格は、ソフトウェア価格とインフラストラクチャ価格で構成されており、どちらも時間単位で表示されます。ソフトウェア価格はモデル使用量のコストをカバーしますが、1 時間あたりの合計コストはソフトウェア価格とインフラストラクチャ価格の合計です。価格は、配置タイプ(リアルタイム推論APIエンドポイントとバッチする変換ジョブ)、インスタンスタイプ、リージョンによって異なります。すべての Voyage モデルには無料試用版が付属しています。各モデルパッケージの価格の詳細は、 AWS Marketplace の製品リスト ページで確認できます。
次のセクションでは、モデルをサブスクライブして配置する方法を示します。
前提条件
AWS Marketplace のリストをサブスクライブするには、次のAWS ID アクセス マネジメント(IAM)権限が必要です。
AmazonSageMakerFullAccess (AWS マネージドポリシー)
aws-marketplace:ViewSubscriptionsaws-marketplace:Subscribeaws-marketplace:Unsubscribe
これらを追加するには、AWSアカウント コンソールにサインインし、AWSドキュメントで手順を検討してください。
手順
AWS Marketplace を使用してサブスクライブするには、次の手順に従います。
モデルパッケージを選択します。
AWS MarketplaceでサブスクライブするVoyage AIモデルパッケージを選択します。
コンソールのサブスクリプション管理ページからAWS Marketplace サブスクリプションを確認および管理することもできます。サブスクリプション はいつでもキャンセルできますが、サブスクリプションをキャンセルしても既存のリアルタイム推論エンドポイントとなる接続されたデバイスやバッチする変換ジョブは終了されないことに注意してください。詳細については、リアルタイム推論エンドポイントの削除 を参照してください。
モデルパッケージの配置には特定の Sage Administration インスタンスが必要です(例: m.g5.xLarge)。これらのインスタンスの正確な割り当て名は、「エンドポイントの使用」と「機械学習ジョブの使用状況」で終わる(例:5.2エンドポイントとなる接続されたデバイス使用量用」および「機械学習.g5.2xLarge変換ジョブの使用のためのものです)。これらの割り当ては通常、デフォルトで 0 に設定されています。必要に応じて割り当ての増加をリクエストには、Sagemation Service Quotas コンソールにアクセスします。
AWS Marketplace から Voyage AIモデルパッケージのサブスクライブと配置でサポートが必要な場合は、MongoDBサポート にお問い合わせください。
パッケージ配置のモデル化
このセクションには、 Amazon Sage を使用してモデルパッケージを配置する方法に関するガイダンスが含まれています。
Amazon Sage の作成
Amazon SageMaker Studio は、AWSアカウントにすでに認証されているホスト型ノート PC 環境が含まれる、機械学習 およびAI開発向けのウェブベースのインターフェースです。ローカル マシンなど、別の希望する MongoDB ノート実行環境がある場合は、このセクションをスキップできます。この環境からAWSアカウントは認証できます。Sage Administration のドキュメントに従って Sage Administration Studio を起動し、JupyterLog 環境を起動します。
ユーティリティ ノート
AWS SDK( Boto3 )と Amazon SageMaker Python SDK を使用して、 例の Jupyter notebook を使ってPythonを始めることができます。Voyage AI AWSリポジトリをクローンした後、Sagemaker Studio または希望する jupyter ノート実行環境でノートを実行できます。例、git clone
https://github.com/voyage-ai/voyageai-aws.gitを実行中場合は になります。
あるいは、GitHub からノートを直接ダウンロードし、Sagemation Studio またはご希望のノートク環境にアップロードすることもできます。
ノートが Sage Builder または希望する実行環境に表示されたら、提供されたコードを実行してモデルを配置できます。
リアルタイム推論エンドポイントの削除
必要以上に長いリアルタイム推論エンドポイントとなる接続されたデバイスを実行しないでください。指定すると、余計なコストが発生し、予期しない料金が発生する可能性があります。提供された Jupyter ノートを使用している場合は、必ずクリーンアップ コードを実行してください。これにより、エンドポイントと関連するエンドポイント設定が削除されます。エンドポイントとなる接続されたデバイスは、Sage Administration Studio または Sageノード コンソールを使用して管理および削除できます。詳細については、AWS のドキュメント を参照してください。
高度な配置
前のセクションで説明されているJupyter ノートは、モデル パッケージを配置する方法を学習するために役立ちます。ただし、Cloud ConsoleFormation、SageMany、 AWS CLIなど、モデル パッケージを配置する他の方法はいくつかあります。これらの代替メソッドは、既存の本番ワークフローに適している場合があります。(例: )。
宣言型インフラストラクチャ仕様用の CloudFormation
インタラクティブUIベースの配置のための Sagemation コンソール
プログラムによるシェル のオーケストレーションのためのAWS CLI
これらのメソッドを使用してモデルパッケージを構成して配置するには次の手順に従います。
製品リスト ページにGo。
AWS Marketplace からサブスクライブされたMongoDB Voyage モデルの製品リストページにGo。