ベクトル検索でデータの質問に回答する RAG チャットボットを使用して、 MongoDB Search Playground でMongoDB ベクトル検索 をすばやくお試しください。 MongoDB Search Playground で チャットボット Demo ビルダを使用すると、独自のデータを取得し、さまざまなチャンク戦略を試し、Voyage AI埋め込みモデルを使用して埋め込みを生成し、Atlas アカウント、クラスター、またはコレクションなしでデータに関する質問をすることができます。また、 MongoDB Search Playground のスナップショットへのリンクを他のユーザーと共有することもできます。
使用されるステージ
チャットボットデモビルダーは、2 つの集計パイプラインステージ$vectorSearch
と $project
を使用します。
Considerations
これは生成系 AI チャットボットです。すべての情報は使用前に検証する必要があります。機密データをアップロードしないでください。MongoDB は、システムの健全性を監視し、チャットボット デモ ビルダー内の問題をトラブルシューティングするために、ワークロード データを記録します。
チャットボット デモ ビルダーの制限事項
チャットボット デモ ビルダーは、インポートされた PDF ファイルまたはコピー&ペーストされたテキストを、1 つの統合されたナレッジ ソースとして処理します。このビルダー内で個別のデータ コレクションを定義したり統合したりすることはできません。
チャットボットデモビルダーは、編集できない事前構成されたベクトル検索インデックスを使用します。クエリは指定された取得設定に基づいて生成され、コードエディターを使用して直接編集することはできません。
チャットボット デモ ビルダーの環境は永続化されません。環境を保存するには、Share ボタンを使用して、30 日間保持されるスナップショット URL を生成します。
チャットボット デモ ビルダーは、テキストベースの埋め込みのみをサポートします。PDF ファイルに画像が含まれている場合、チャットボットはその画像内のコンテンツを処理したり、質問に回答したりすることはできません。
チャットボット デモ ビルダーには、次のデータ制限があります。
100 MB を超えるファイルはインポートできません。
文字数の合計は 100,000 字を超えることはできません。
独自のベクトル埋め込みや、埋め込みソリューション用の API 認証情報を持ち込むことはできません。
チャットボット デモ ビルダーをお試しください
チャットボット デモ ビルダーにアクセスします。
チャットボット Demo Builder < https://search-Playground.mongodb.com/tools/chatbot-demo-Builder/. に移動します。
データソースを選択してください。
チャットボット デモ ビルダーでは、3 つのデータソース オプションが提供されています。
Upload PDF | 最大 100 MB の PDF ファイルをローカル デバイスからアップロードします。文字数が 100,000 字を超える場合は、先頭の 100,000 字のみを使用するか、文字数の少ないファイルをアップロードする必要があります。[SEE TEXT] でテキストをプレビューできます。 |
Copy & Paste Text | 最大 100,000 字までのテキストをコピー&ペーストできます。文字数が 100,000 字を超える場合は、先頭の 100,000 字のみを使用するか、テキスト サイズを縮小する必要があります。 |
Sample Data | MongoDB が提供するサンプル データ(架空の公園に関する PDF)を使用できます。 |
チャットボット デモ ビルダーは公開デモです。機密データをアップロードしないでください。
データ処理を構成します。
チャンク化の設定と埋め込みモデルをカスタマイズします。
Chunking strategy | [Recursive Chunking](デフォルト オプション)または [Fixed Token Count with Overlap] のいずれかを選択します。 |
Chunk size | チャンクごとのトークン数を定義します。トークン数は、チャンクの重なりの少なくとも 2 倍である必要があります。
|
Chunk overlap | 隣接するチャンク間のトークンのオーバーラップ サイズを指定します。オーバーラップ サイズは、チャンク サイズの最大でも半分までにする必要があります。
|
Embedding model | 以下のいずれかの埋め込みモデルを選択します。
|
埋め込みを作成した後にこれらのオプションを変更するには、サイドパネルの [DATA SETTINGS] を使用してください。設定を変更すると、以前のチャット履歴がクリアされます。
データに関する質問を行ったり、検索設定を編集したりできます。
各質問と回答のペアは独立しており、以前のやり取りには依存しません。[Share] を選択すると、プレイグラウンドにデータ構成と検索設定が保存されます。質問と回答の履歴は保存も共有もされません。
質問をするたびに、チャットボット デモ ビルダーには次の設定項目が表示されます。
設定または出力 | ページ上の位置 | 説明 |
---|---|---|
Search Query | チャットボックス内の回答にリンクされています | MongoDB ベクトル検索クエリ構文を表示します。 |
[number] DOCUMENTS | チャットボックス内の回答にリンクされています | 検索クエリの実行によって検索されたドキュメントと、結果のスコアリング方法を表示します。 |
Data to Evaluate (numCandidates) | 右側パネル | 最適な結果を選択するために、システムが評価する候補数を調整します。すべてのインデックス作成されたベクター埋め込みを網羅的に検索するには、[Evaluate all [number] documents (ENN)] チェックボックスをクリックします。これにより、クエリのレイテンシに影響する可能性があります。 |
Data to Retrieve (limit) | 右側パネル | 返されるドキュメント(チャンク)の数を調整してください。 |
Data Source | Bottom panel tab | データを MongoDB Documents または Full Extracted Text として表示します。 |
Index Definition | Bottom panel tab | 生成されたMongoDB ベクトル検索インデックス定義を表示します。 |
Search Query | Bottom panel tab | 最新の質問と回答に使用されるMongoDB ベクトル検索クエリ構文を表示します。 |
LLM & Prompt | Bottom panel tab | 使用されている大規模言語モデル(LLM)を表示します。 |
注意
チャットボット デモ ビルダーのパフォーマンスは、本番環境のパフォーマンスと異なる場合があります。
詳細
ベクトル検索クエリの詳細については、「ベクトル検索クエリの実行」を参照してください。検索拡張生成(RAG)の詳細については、MongoDBによる検索拡張生成(RAG)を参照してください。