ほとんどの一般的なユースケースで正常にバランスが取れたリソースを使用して mongot
配置を迅速に提供するには、小規模または中程度の高 CPUノードが 有効な開始点になることが多いです。この構成は、一般的な検索ワークロードのための強力な基盤を提供します。
特定のワークロードに合わせてリソースプロビジョニングのより正確な場合は、次のページを検討してください。
これらのページは、目的の重要なアプリケーションについて、またはより忠実な最適化が必要な場合にガイダンスを提供します。
注意
検索およびベクトル検索ワークロードのリソースのサイズ設定は反復的なプロセスです。これらの例は開始点を表しますが、特定のワークロード のサイズ設定には高度な考慮事項と測定値が必要になる場合があります。
ワークロード クラス
mongot
配置は、次の 2 つのクラスに分類されます。
低 CPU (データ量が少なくなりベクトル検索に適)
高 CPU (より大きなデータ ボリュームと全文検索に適)
次のガイダンスを使用して、アプリケーションのニーズに一致する開始構成を選択します。
低 CPU ワークロード
低 CPU アーカイブタイプは、ベクトル検索アプリケーションや、未加工 CPU 能力よりもメモリが優先される低データ量に最適です。これらのノードは通常、8:1 RAMと CPU の比率はあります。適切なサイズカテゴリを決定する際の重要な要素は、予想される合計ベクトルサイズの推定値です。参照ベクトルのサイズ範囲を確認するには、 概要 の 開始サイズの選択 ステップの表を参照してください。
次の表は、低 CPU 配置で予想されるワークロードに基づいて、メモリ、ストレージ、および CPU コアの推奨事項を示しています。
ワークロード サイズ カテゴリ | デフォルトのメモリ(GB) | デフォルトのストレージ(GB) | CPU コア |
---|---|---|---|
小 | 8 - 16 | 50 - 100 | 1 - 2 |
平均 | 32 - 64 | 200 - 400 | 4 - 8 |
大 | 128 - 256 | 800 - 1600 | 16 - 32 |
その他の考慮事項
小: 初期テストや非常に小さなベクトル検索アプリケーションに適しています。
中:ベクトル検索のユースケースや中程度のデータ量の増加に適しています。
大規模: 大規模なベクトル検索アプリケーションや、大規模な低 CPU 集中型ワークロードに適しています。
高 CPU ワークロード
高 CPU アーカイブタイプは、クエリがより CPU 集中型である汎用の全文検索ワークロード向けに設計されています。これらのノードは通常、2:1 RAMと CPU の比率はあります。適切なサイズカテゴリを決定する際の重要な要素として、必要なスループット(QPS)と予想されるインデックス作成負荷が含まれます。挿入の量は、インデックス負荷のプロキシとして使用できます。挿入量が多いほど、インデックス アクティビティのレベルが高いことを示します。参照QPS 範囲を確認するには、 概要 の 開始サイズの選択 ステップの表を参照してください。
次の表は、高 CPU 配置で予想されるワークロードに基づいて、メモリ、ストレージ、および CPU コアの推奨事項を示しています。
ワークロード サイズ カテゴリ | デフォルトのメモリ(GB) | デフォルトのストレージ(GB) | CPU コア |
---|---|---|---|
小 | 4 - 8 | 100 - 200 | 2 - 4 |
平均 | 16 - 32 | 400 - 800 | 8 - 16 |
大 | 64 - 96 | 1600 - 2400 | 32 - 48 |
その他の考慮事項
小: クエリ レートが中程度の全文検索の開始点。2 つの小さいノード(合計 4CPU)の最小設定は、約 40 QPS をサポートします。
中: クエリスループットが高い、よりアクティブな全文検索アプリケーションに適しています。
大: 全文検索、重いインデックス、または大規模なクエリ ワークロードを要求する場合に適しています。
大規模なベクトル検索ワークロードに関する考慮事項
ベクトル検索は、 AIアプリケーションの重要な領域です。自動バイナリ定量化などの最新の手法では、プライマリリソースの制約をRAMからストレージに移行しています。バイナリ定量化により、インデックスのストレージはより制限されます。
このような場合は、大量のストレージが使用可能な低 CPUクラスノードを検討してください。大規模なストレージは、フル忠実度ベクトル埋め込みとソースベクトル埋め込みの量子化バージョンをサポートします。このようにリソースとワークロードを組み合わせることで、最新のAIアプリケーションを効率的かつ経済的に構築、増やすできます。