投票AI は、最新の埋め込みとリランク付けモデルを提供します。 MongoDB の 埋め込みと再ランク付けAPI は、最新の投票AIモデルへのアクセスを提供します。このページでは、使用可能なモデルとそれをいつ使用するかについて説明します。
テキスト埋め込みの場合は、次のことを推奨します。
voyage-4-large最高の品質voyage-4-liteレイテンシとコストを最小限に抑えるためvoyage-4、品質とパフォーマンスのバランス
その他のユースケースでは、次のことをお勧めします。
voyage-multimodal-3.5テキスト、画像、ビデオ埋め込み用voyage-context-3、チャンクレベルとドキュメントレベルの取得タスク用rerank-2.5、ほとんどのアプリケーションに再ランク付けを追加するrerank-2.5-liteレイテンシの影響を受けやすいアプリケーションに再ランク付けを追加するため
テキスト埋め込み
テキストのセマンティック意味をキャプチャするために、次のテキスト埋め込みAIを提供します。
詳細と使用例については、「 テキスト埋め込み 」を参照してください。
汎用モデル
ほとんどのAI検索および取得アプリケーションには、次のモデルを使用します。
モデル | コンテキストの長さ | ディメンション | 説明 |
|---|---|---|---|
| 32,000 tokens | 1024(デフォルト)、256、512、2048 | 最高の汎用および多言語検索品質。 4 シリーズで作成されたすべての埋め込みは相互に互換性があります。 詳しくは、 ブログ記事 を参照してください。 |
| 32,000 tokens | 1024(デフォルト)、256、512、2048 | 汎用および多言語検索品質が最適化されています。 4 シリーズで作成されたすべての埋め込みは相互に互換性があります。 詳しくは、 ブログ記事 を参照してください。 |
| 32,000 tokens | 1024(デフォルト)、256、512、2048 | レイテンシとコストが最適化されています。 4 シリーズで作成されたすべての埋め込みは相互に互換性があります。 詳しくは、 ブログ記事 を参照してください。 |
ドメイン固有のモデル
精度を高めるには、専用ドメインに次のモデルを使用します。
モデル | コンテキストの長さ | ディメンション | 説明 |
|---|---|---|---|
| 32,000 tokens | 1024(デフォルト)、256、512、2048 | コード検索とドキュメント用に最適化されています。 詳しくは、 ブログ記事 を参照してください。 |
| 32,000 tokens | 1024 | 金融取得と RG アプリケーション用に最適化されています。 詳しくは、 ブログ記事 を参照してください。 |
| 16,000 tokens | 1024 | 正規表現検索と RAG アプリケーション用に最適化されています。 詳しくは、 ブログ記事 を参照してください。 |
オープン モデル
MongoDB では、次のオープン 重みモデルも提供されています。
モデル | コンテキストの長さ | ディメンション | 説明 |
|---|---|---|---|
| 32,000 tokens | 512(デフォルト)、128、256 | Hドキュメントで利用可能なオープン重みモデル。4 シリーズで作成されたすべての埋め込みは相互に互換性があります 詳しくは、 ブログ記事 を参照してください。 |
最新モデルは、品質、コンテキスト長、レイテンシ、スループットなどのすべての要素でレガシーモデルよりもパフォーマンスが優れています。
モデル | コンテキストの長さ | ディメンション | 説明 |
|---|---|---|---|
| 32,000 tokens | 1024(デフォルト)、256、512、2048 | 汎用および多言語検索品質のテキスト埋め込みの前の生成。 詳しくは、 ブログ記事 を参照してください。 |
| 32,000 tokens | 1024(デフォルト)、256、512、2048 | 汎用および多言語検索品質のために最適化されたテキスト埋め込みの前の生成。 詳しくは、 ブログ記事 を参照してください。 |
| 32,000 tokens | 1024(デフォルト)、256、512、2048 | レイテンシとコスト のために最適化されたテキスト埋め込みの以前の生成。 詳しくは、 ブログ記事 を参照してください。 |
| 16,000 tokens | 1536 | コード取得用に最適化されました(代替手段よりも 17% 優れています)。コード埋め込みの前の生成。 詳しくは、 ブログ記事 を参照してください。 |
コンテキストに基づくチャンク埋め込み
投票AI は、検索精度を向上させるために周囲のコンテキストを含めながら埋め込みを生成する次のモデルを提供します。
詳細と使用例については、「 コンテキスト付きチャンク埋め込み 」を参照してください。
モデル | コンテキストの長さ | ディメンション | 説明 |
|---|---|---|---|
| 32,000 tokens | 1024(デフォルト)、256、512、2048 | 汎用および多言語検索品質を最適化するために最適化されたコンテキスト化されたチャンク埋め込み。 詳しくは、 ブログ記事 を参照してください。 |
マルチモーダル埋め込み
投票AI は、テキスト、画像、ビデオを処理する次の埋め込みモデルを提供します。
詳細と使用例については、「 マルチモーダル埋め込み 」を参照してください。
モデル | コンテキストの長さ | ディメンション | 説明 |
|---|---|---|---|
| 32,000 tokens | 1024(デフォルト)、256、512、2048 | PDF、スライド、表、数値、ビデオなどのインターリーブされたテキストと視覚的データをベクトル化できる豊富なマルチモーダル埋め込みモデル。 詳しくは、 ブログ記事 を参照してください。 |
最新モデルは、品質、コンテキスト長、レイテンシ、スループットなどのすべての要素でレガシーモデルよりもパフォーマンスが優れています。
モデル | コンテキストの長さ | ディメンション | 説明 |
|---|---|---|---|
| 32,000 tokens | 1024 | テキストと画像を統合埋め込みに処理します。 50、000 から 200 万ドットまでの画像をサポートします。 詳しくは、 ブログ記事 を参照してください。 |
ランク :
投票AI は、検索結果を絞り込むための次の再ランク付けモデルを提供します。
詳細と使用例については、「 Rerankers 」を参照してください。
モデル | コンテキストの長さ | 説明 |
|---|---|---|
| 32,000 | 最高の精度。ほとんどのアプリケーションに推奨されます。 詳しくは、 ブログ記事 を参照してください。 |
| 32,000 | レイテンシの影響を受けやすいアプリケーション向けに最適化された、高速でコスト効果の高いモデル。 詳しくは、 ブログ記事 を参照してください。 |
最新モデルは、品質、コンテキスト長、レイテンシ、スループットなどのすべての要素でレガシーモデルよりもパフォーマンスが優れています。
モデル | コンテキストの長さ | 説明 |
|---|---|---|
| 16,000 tokens | 多言語をサポートする品質に最適化されたこの一般的な 2 生成のリランカー。 詳しくは、 ブログ記事 を参照してください。 |
| 8,000 tokens | レイテンシと品質の両方を多言語サポートで最適化されたこの一般的な 2 生成のリランカーは、 詳しくは、 ブログ記事 を参照してください。 |
価格
モデルの価格設定は使用量ベースで、アクセスに使用されるAPIキーにリンクされた Atlas アカウントに料金が請求されます。すべてのモデルには無料階層が含まれています。ほとんどのモデルでは 20000 万の無料トークンを、または特定のモデルでは 5000 万トークンを使用して開始します。
価格は、ドキュメントとクエリ内のトークンの数に基づいています。無料階層には、ほとんどのモデルの 20000 万トークンと、次の専用モデルの 5000 万トークンが含まれます(voyage-finance-2、voyage-law-2、voyage-code-2。
モデル | Price per 1K tokens | Price per 1M tokens | 無料トークン |
|---|---|---|---|
| $0.00012 | $0.12 | 200 100万 |
| $0.00006 | $0.06 | 200 100万 |
| $0.00002 | $0.02 | 200 100万 |
| $0.00018 | $0.18 | 200 100万 |
| $0.00018 | $0.18 | 200 100万 |
voyage-finance-2voyage-law-2voyage-code-2 | $0.00012 | $0.12 | 50 100万 |
価格は、ドキュメントとクエリ内のトークンの数に基づいています。
モデル | Price per 1K tokens | Price per 1M tokens | 無料トークン |
|---|---|---|---|
| $0.00018 | $0.18 | 200 100万 |
価格は、テキスト トークンとイメージ ドットに基づいています。無料階層には、マルチモーダル モデルの場合、20000 万のテキスト トークンと 15000 億のドキュメントが含まれます。画像は 50,000 ドキュメント(最小)から 200 万ドキュメント(最大)の間で処理され、コストは画像 1 件あたり $0.00003 から $0.0012 の範囲です。価格設定上、各ビデオフレームはイメージと見なされます。
注意
50,000 ドット未満の画像は、50,000 ドットのイメージとしてアップスケール、処理、課金されます。 200 万ドキュメントを超える画像はダウンサンプリングされ、200 万ドキュメントとして課金されます。
モデル | Price per 1M tokens | Price per 1B pixels | 無料階層 |
|---|---|---|---|
| $0.12 | $0.60 | 200M トークン、 150B ドット |
イメージの解決 | ドット数 | イメージあたりの価格 | Price per 1K images |
|---|---|---|---|
200px × 200px | 40,000 | $0.00003 | $0.03 |
1000px × 1000px | 1 100万 | $0.0006 | $0.60 |
2000px × 2000px | 4 100万 | $0.0012 | $1.20 |
4000px × 4000px | 16 100万 | $0.0012 | $1.20 |
例
1、000 テキスト トークン($0.00012)と 2 つの 400 ドキュメント(2 x $0.0012)を使用して単一の入力をベクトル化するコストは$0.00252 になります。
価格は処理されたトークンの合計に基づいて表示され、(query tokens × number of documents) + sum of tokens in all documents として計算されます。無料階層には、最新のリランク モデル用の 20000 万トークンが含まれます。
モデル | Price per 1K tokens | Price per 1M tokens | Est. price per request* | 無料トークン |
|---|---|---|---|---|
| $0.00005 | $0.05 | $0.0025 | 200 100万 |
| $0.00002 | $0.02 | $0.001 | 200 100万 |
*価格は、リクエスト1100 件あたりの推定ドキュメント数 があり、1ドキュメントあたりのクエリ トークンと トークンの合計が500 になることを想定しています。