エージェント的なAIとMongoDBによるドキュメントインテリジェンス

MongoDB Atlas Vector Searchと大規模な言語モデルを使用して、金融アプリケーションのインタラクションを改善します。

ユースケース: 生成AI、インテリジェント検索、コンテンツ管理
業種別: 金融サービス
製品: MongoDB Atlas、 MongoDB Atlas Vector Search、 Voyage AI
パートナー: Amazon Blog、Llang Charter

ソリューション概要

このソリューションでは、MongoDBによるエージェント的AIを使用してドキュメントインテリジェンスを活用する方法を学ぶことができます。このアプローチでは、ローカルリポジトリやクラウドコンテナ、クラウドストレージサービスなどのさまざまなソースにわたる構造化データ、半構造化データ、非構造化データからインサイトを得ます。

金融機関とフィンテックプロバイダーは、大量のドキュメントと複数のソースからの断片化されたデータを管理します。この情報の収集、検索、分析するなどの手動タスクでは、操作が遅く、エラーのリスクが高まります。

このソリューションでは、マルチエージェントオーケストレーションシステムを使用してこれらの挑戦に対処します。このクエリは、MongoDB の柔軟な document model、 MongoDB Atlas Vector Search、VorageAI の voyage-context-3、エージェントAIによって強化されています。

このソリューションは、金融サービスにおける 5 つのドキュメントインテリジェンスのユースケースを検証します。

会社クレジット評価
支払いプロセシングにおける例外処理
運用調査
クライアントオンボード（KeyC）
保証開始

次のセクションでは、静的ドキュメントを運用および戦略的なインサイトの動的ソースに変換する方法について説明します。

参照アーキテクチャ

このソリューションは、3 つの主要なモジュールコンポーネントで構成されています。

図の 1。MongoDB を使用したインテリジェントなドキュメントプロセシングアーキテクチャ。

1。スーパーバイザーマルチエージェントオーケストレーション

スーパーバイザーエージェントは、専用エージェントのチームを調整します。各エージェントには、特定のタスクを実行するための独自のプロンプトと特定のツールが提供されます。

スキャンエージェントは、複数のソース（ローカルファイル、 AWS S3、Google ドライブ）から利用可能なドキュメントを検出し、カタログします。
評価エージェントは、業界とユースケースのコンテキストに基づいてドキュメントの関連性を評価します。
抽出エージェントは視覚AI （を使用）を使用します3.5Sonnet v2）は、チャートや表などのテキストと視覚的要素を解釈し、それらをマークダウンに変換します。
プロセッサエージェントのコンテンツは、セマンティックに意味のあるチャンクに分割され、VyageAI を使用して埋め込みを生成し、それをMongoDB Atlasコレクションに保存します。

部分 2。エージェント RAG システム

データが取り込まれると、このRAGワークフローは次のことを行います。

ドキュメント支援エージェントとのリアルタイムインタラクションを有効にします。
クエリ生成、ドキュメントグレーディング、クエリ書き換えのループを使用して、応答を自動的に絞り込みます。
voyage-context-3 埋め込みを使用することで、ドキュメントチャンクが正確でベースのある答えるためのより幅広いコンテキストを保持できます。

注意

エージェント RAG には次の特権があります。

インテリジェントな決定を行い、検索が必要な時点を直接応答と比較して返します。
自己修正: 検索するドキュメントが関連性がない場合、クエリを書き換えて再度試行します
コンテキストの維持: マルチターンの対話にMongoDBチェックポイントを使用
透過性を提供: ワークフローのステップと評価の決定を追跡する

部分 3。レポート作成とインサイト生成

このモジュールは、対象を絞ったベクトル検索と LM ベースのコンテンツ生成を使用して、次のタスクを実行して定期レポートを自動化します。

カスタマイズされたレポートを生成するための情報を処理します。
関連する結果とコンテキストデータをコンパイルします。
PDF などの構造化出力のエクスポート。
低コンテキストのシナリオでも信頼性を確保するためにフォールバックメカニズムを含めます。

データモデルアプローチ

ソリューションのデータモデルは、そのコレクションを関数ごとにグループ化します。

主要ドキュメント処理:

chunks: は voyage-context-3 ベクトルを持つテキストセグメントを保存します。
documents: はドキュメントメタデータを保存 (する) し、プロセシングステータスとソース情報を追跡します。
assessments: 関連性スコアやプロセシング決定などのドキュメント評価の結果が含まれます。
workflows: 取り込みワークフロー追跡を保存し、マルチエージェントのプロセシング状態をモニターします。

次のドキュメントは、chunksコレクションの例です。

{
   "_id": {
      "$oid": "68e7d4cd77c8fbfb9abdf878"
   },
   "document_id": "doc_ef5b1da6",
   "document_name": "Payment_Investigation_Ticket.pdf",
   "chunk_index": 2,
   "chunk_text": "Contacted cardholder to confirm receipt of temporary credit and advise on investigation timeline. Cardholder confirmed satisfaction with temporary resolution...",
   "embedding": [
      0.02789805270731449,
      0.0045435624197125435,
      -0.06760358065366745,
     ...
   ],
   "has_visual_references": false,
   "metadata": {
      "name": "Payment_Investigation_Ticket.pdf",
      "path": "@s3@.../document-intelligence/fsi/payment_processing_exception/Payment_Investigation_Ticket.pdf",
      "processed_at": {
         "$date": "2025-10-09T15:29:17.741Z"
      },
      "chunk_count": 3,
      "chunk_metadata": {
         "chunk_index": 2,
         "total_chunks": 3,
         "section_start": "Contacted cardholder",
         "section_end": "ion_ticket.html*\n4/5",
         "document_id": "doc_ef5b1da6",
         "document_name": "Payment_Investigation_Ticket.pdf",
         "contains_images": false
      }
   }
}

次のドキュメントは、documentsコレクションの例です。

{
   "_id": {
      "$oid": "68e7d4cb5fc2bb6e17eaedb8"
   },
   "document_id": "doc_ef5b1da6",
   "document_name": "Payment_Investigation_Ticket.pdf",
   "document_path": "@s3.../document-intelligence/fsi/payment_processing_exception/Payment_Investigation_Ticket.pdf",
   "file_extension": "pdf",
   "file_size_mb": 0.3242454528808594,
   "source_type": "s3",
   "source_path": "@s3@fsi/payment_processing_exception",
   "page_count": 4,
   "created_at": {
      "$date": "2025-10-09T15:29:15.041Z"
   },
   "updated_at": {
      "$date": "2025-10-09T15:29:18.267Z"
   },
   "status": "completed",
   "chunk_count": 3,
   "has_visual_references": true,
   "metadata": {
      "markdown_length": 5592,
      "processing_timestamp": {
         "$date": "2025-10-09T15:29:15.041Z"
      }
   }
}

次のドキュメントは、assessmentsコレクションの例です。

{
   "_id": {
      "$oid": "68e7d2b35fc2bb6e17eaedb2"
   },
   "document_id": "doc_ef5b1da6",
   "document_name": "Payment_Investigation_Ticket.pdf",
   "document_path": "@s3.../document-intelligence/fsi/payment_processing_exception/Payment_Investigation_Ticket.pdf",
   "file_size_mb": 0.3242454528808594,
   "assessment": {
      "main_entity": "Payment Investigation Ticket",
      "document_category": "Banking Investigation Document",
      "key_topics": [
         "merchant chargeback investigation",
         "payment dispute resolution",
         "cardholder dispute handling"
      ],
      "relevance_score": 95,
      "reasoning": "This document is highly relevant to both the financial services industry and exception handling in payment processing. It is an official payment investigation ticket from First National Bank's Payment Investigation Department, specifically dealing with a cardholder dispute and merchant non-response case. The document contains formal banking investigation details, dispute resolution tracking, and payment processing exception handling elements.",
      "should_process": true
   },
   "assessed_at": {
      "$date": "2025-10-09T15:20:19.060Z"
   },
   "workflow_id": "fsi_payment_processing_exception_1760023126468"
}

次のドキュメントは、workflowsコレクションの例です。

{
   "_id": {
      "$oid": "68e7d25d5fc2bb6e17eaedad"
   },
   "workflow_id": "fsi_payment_processing_exception_1760023126468",
   "endpoint": "/api/ingestion/start",
   "source_paths": [
      "@local@/docs/fsi/payment_processing_exception",
      "@s3@fsi/payment_processing_exception",
      "@gdrive@fsi/payment_processing_exception"
   ],
   "triggered_at": {
      "$date": "2025-10-09T15:18:53.563Z"
   }
}

主要なドキュメント処理コレクションに加えて、ソリューションには次のような他の関数とそれに対応するコレクションが含まれます。

インタラクションとメモリを要求します。

gradings: には、Q8 検索評価からのバイナリスコアなど、ドキュメント関連性のグレーディングが含まれます。
logs_qa: プロンプトインタラクションセッションログを含む、エージェントキー RAG ワークフローのステップと決定を追跡します。
agent_personas: ユースケース固有のAI構成にカスタマイズされた、業界ごとのプロンプトと機能を定義します。
checkpoint_writes_aio: は、ディスカッション状態の非同期永続性を取り扱う（具体的には LangGraph 状態の書き込み (write)）。
checkpoints_aio: スレッドベースのダイアログ履歴をマネージドし、チャットメモリとして機能します。

レポート:

scheduled_reports: 生成されたレポートメタデータを含む PDF ロケーションと生成履歴を追跡します。
report_templates:ユースケースによってセクションとプロンプトを定義し、レポート構造のテンプレートとして機能します。

このデータモデルへのアプローチは、開発を簡素化する直感的な設計を作成し、特定のタスクに関連するすべてのデータが MongoDB の柔軟なドキュメント構造内に同じ場所に配置されるためです。

ソリューションのビルド

完全な実装とコードについては、このGitHubリポジトリのREADMEの手順に従ってください。

このソリューションは、3 つのプライマリアーキテクチャパターンを組み合わせて構築されています。各コンポーネントがどのように実装される手順は次のとおりです。

監視用マルチエージェントシステムを実装する

これは、複数の専用AIエージェントを調整する主要取り込みパイプラインです。

専用エージェントを定義する: まず、 LgGraphフレームワークを使用して各エージェントを定義します。
スーパーバイザーエージェントを実装する：次に、ワークフロー全体を管理する supervisor agent を実装します。これは LingGraph マネージャーパスワードなしに従います。

エージェント RAG システムをビルドする

このシステムは、自己修正型エージェント RAG ワークフローを提供します。MongoDB Atlas Vector Searchからコンテキストを検索するか、ユーザーに直接応答するかをインテリジェントに決定するエージェントが備えられています。

図の 2。MongoDB （ドキュメント支援エージェント）によるエージェント的 RAG アーキテクチャ。

ベクトル検索インデックスを作成する: chunksコレクションにベクトル検索インデックスを作成します。これにより、アプリケーションはドキュメント埋め込みに対して高速セマンティック検索を実行できます。
自己修正 RAG グラフをビルドする: LgGraph を使用して、条件付きエッジを持つサイクルグラフを作成します。このグラフには、取得エージェント、ドキュメントグレーダー、およびクエリリライターが含まれています。クエリリライターの目的は、結果が関連性のない場合に再試行することです。
やり取りの永続性を有効にする: MongoDBチェックポイントシステムを実装して、会話メモリとマルチターンの会話を提供します。これにより、専用のMongoDBコレクションから対話状態が自動的に保存およびロードされ、エージェントにメモリの永続性が付与されます。

自動レポートジェネレーターの作成

このモジュールは、スケジュールされた PDF レポートの生成を自動化します。

レポートテンプレートの保存: MongoDB の柔軟なスキーマを活用して report_templatesコレクションを作成します。これにより、クレジット評価や投資調査レポートなど、各レポートタイプの構造、セクションタイトル、および特定のセマンティック検索プロンプトが保存されます。
セクション固有の生成を実装する: テンプレートの各セクションをループ処理するスクリプトを作成します。このスクリプトは、別の Atlas Vector Search クエリを実行します。その特定のセクションのプロンプトを使用し、コンテンツを累積します。
レポート出力のスケジュールと追跡: このスクリプトはスケジューラーによって実行されます。PDF の生成後、スクリプトは追跡用にMongoDBの scheduled_reportsコレクションにファイルパスや生成日などのメタデータを書き込みます。

キーポイント

MongoDB Atlas を統合データプラットフォームとして使用して、構造化メタデータ、非構造化ドキュメント、ベクトル埋め込み、運用状態を保存します。これにより、データサイロが排除され、アーキテクチャの複雑さが軽減されます。
複雑なマルチエージェントワークフローを管理するために、スーパーバイザーのマルチエージェントオーケストレーションパスワードなしを実装します。このパターンにより、複数の専用ワーカーエージェント間でツールを分割し、集中的な専門知識を確保できます。
クエリの精度を向上させるには、自己修正メカニズムを持つエージェント的 RAG を配置します。これにより、エージェントはコンテキストの検索、クエリの再フォーマット、ドキュメントの関連性のグレードをインテリジェントに決定できます。
堅牢な通信とワークフロー追跡を確立するために、永続的なエージェントメモリに MongoDB のチェックポイントを実装します。これにより、複数回のインタラクションで永続的な対話状態とダイアログ履歴が確保されます。
MongoDB Atlas Vector Searchを使用してセマンティック検索を実行し、自動レポート作成などのターゲットコンテンツ生成を実行します。これにより、クエリはキーワードだけでなく意味を使用してコンテンツを検索し、より正確な出力を得ることができます。

作成者

ペイマンパージ、フィールドCTO金融サービス、 MongoDB
Ainnoa Kubernetes、コンサルティング、業界ソリューション、 MongoDB
ユーティリティソート、高度に選択と選択、インサイトソリューション、 MongoDB
Andrea Alaman Calderon、シニアスペシャリスト、業界ソリューション、MongoDB

詳細

AIエージェントを迅速に配置するためのフレームワークの実装方法を見つける
ガイド「エージェントメモリとは何ですか。AIの学習と呼び出しを強化するためのガイド」で、エージェントメモリをより深く調べます
学ぶ voyage-context-3 について: グローバルドキュメントコンテキストによる集約型チャンクレベルの詳細

戻る

クレジットカードアプリケーション

Fireworks AI を活用した RAG アプリケーションの最適化