Docs Menu
Docs Home

MongoDBによる投票AI

MongoDB は、Voyage AI のベストインクラスの埋め込みと再ランク付けモデル用のAPIを提供します。ベクトルデータベースや大規模言語モデル(llm)など、 AIスタックの他の部分 とともに使用されることで、正確なAI検索と取得で本番環境に対応できるアプリケーションを構築できます。

投票フローチャート

開始するには次のリソースを使用してください。

クイック スタートのアイコン

APIキーの作成、最初の埋め込みの生成、RAGアプリケーションの構築 を行います。

クイック スタート

APIリファレンスのアイコン

MongoDB AtlasでAPIキーを管理する方法を学びます。

APIキーの管理

APIリファレンスのアイコン

API仕様 をご覧ください。

API リファレンス

投票 AI の埋め込みモデルと再ランク付けモデルは、検索精度の点で最新の状態です。モデルの詳細については、「 モデルの概要 」を参照してください。

注目のモデル

torage-4-Large

最高の汎用および多言語検索品質。すべての 4 シリーズ モデルは同じ埋め込みスペースを共有します。

任意のコンテキスト-3

汎用および多言語検索品質を最適化するために最適化されたコンテキスト化されたチャンク埋め込み。

ストレージマルチモーダル-3.5

PDF、スライド、表、数値、ビデオなどのインターリーブされたテキストと視覚的データをベクトル化できる豊富なマルチモーダル埋め込みモデル。

rerank-2.5

指示に従い、多言語をサポートすることで品質に最適化された一般的なリランカー。

投票AIモデルは次のユースケースをサポートしています。

セマンティック検索のアイコン

セマンティック検索を使用して、コンテキストに関連する情報を検索します。

セマンティック検索

RAG icon

RG を実装してデータ内の LRM をグラウンドし、プロ認証を軽減します。

検索拡張生成 (RAG)

MongoDB ベクトル検索とAI統合で MongoDB AIを活用して、 AIアプリケーション開発 を効率化します。

ベクトル検索のアイコン

MongoDB ベクトル検索と MongoDB Vector Search を組み合わせて、AIAIを構築できます。

MongoDB ベクトル検索

AI統合アイコン

LgChuin、LlamaIndex、およびその他の一般的なAIフレームワークと統合します。

AI 統合

埋め込みモデル
埋め込みモデルは、データのセマンティックまたは基礎となる意味を取得するベクトル埋め込みにデータを変換するアルゴリズムです。これらのベクトルはベクトル検索を可能にし、信頼できるAIアプリケーションを構築するための主要なアプローチである検索拡張生成 (RAG)(RAG)に必須のビルド ブロックとして機能します。
reranker
Reranker は、検索クエリーと検索結果の間の関連性をスコアリングするアルゴリズムです。 Rerankers は、関連性スコアに基づいてドキュメントの順序付けを変更することで初期結果を調整し、より正確な結果のサブセットを生成するのに役立ちます。
ベクトル埋め込み
ベクトル埋め込みは数値の配列であり、各次元はデータの異なる機能または属性を表します。ベクトルは、テキスト、画像、ビデオから非構造化データまで、任意のタイプのデータを表すために使用できます。埋め込みモデルにデータを渡すことでベクトル埋め込みを作成し、これらの埋め込みをMongoDBのようなベクトル埋め込みをサポートするデータベースに保存できます。
vectorSearch
ベクトル検索は、セマンティック検索と RAG を強化する検索メソッドです。ベクトル間の距離を測定することで、異なるデータ ポイント間のセマンティック類似性を判断できます。これにより、ベクトル化されたクエリをベクトル埋め込みと比較して、関連性の高い検索結果を得ることができます。任意のベクトル検索ソリューションとベクトルデータベースで任意のAIモデルを使用できますが、これらはMongoDB ベクトル検索およびMongoDB Atlasとシームレスに統合されます。
RAG
検索拡張生成(RAG)は、大規模な言語モデル(llm)を追加のデータで強化して、より正確な応答を生成できるようにするために使用されるアーキテクチャです。詳細については、「 投票AI付きの RG 」を参照してください。
tokens
埋め込みモデルと LVM のコンテキストでは、トークンとは、埋め込みの作成やテキストの生成のためにモデルが処理する単語、サブワード、文字などのテキストの基本単位です。トークンは、埋め込みモデルと LM の使用量に対して課金される方法を示します。
レート制限
レート制限は、ユーザーが特定の時間枠内で実行できるリクエスト数に対してAPIプロバイダーによって課せられる制限であり、1 分あたりのトークン(TPM)または 1 分あたりのリクエスト数(RPM)で測定されます。これらの制限により、均等な使用が確保され、不正を防ぎ、すべてのユーザーに対してサービスの安定性とパフォーマンスが維持されます。

項目一覧