Docs Menu
Docs Home
/

エージェント的なAIとMongoDBによるドキュメントインテリジェンス

MongoDB Atlas Vector Searchと大規模な言語モデルを使用して、金融アプリケーションのインタラクションを改善します。

  • ユースケース: 生成AI、インテリジェント検索、コンテンツ管理

  • 業種別: 金融サービス

  • 製品: MongoDB Atlas、 MongoDB Atlas Vector Search、Vorage AI

  • パートナー: Amazon Blog 、Llang Charter

このソリューションでは、 MongoDBによるエージェント的AIを使用してドキュメントインテリジェンスを活用する方法を学ぶことができます。このアプローチでは、ローカル リポジトリやクラウドコンテナ、クラウドストレージサービスなどのさまざまなソースにわたる構造化データ、半構造化データ、非構造化データからインサイトを得ます。

金融機関と Findback プロバイダーは、大量のドキュメントと複数のソースからの断片化されたデータを管理します。この情報の収集、検索、分析などの手動タスクでは、操作が遅く、エラーのリスクが高まります。

このソリューションでは、マルチエージェント オーケストレーション システムを使用してこれらの課題に対処します。このクエリは、MongoDB の 柔軟なドキュメントモデル、 MongoDB Atlas Vector Search、VorageAI の voyage-context-3、 エージェントAIによって強化されています。

このソリューションは、金融サービスにおける 5 つのドキュメントインテリジェンスのユースケースを検証します。

  1. 会社クレジット評価

  2. 支払い処理における例外処理

  3. 運用調査

  4. クライアント オンボード(KeyC)

  5. 保証開始

次のセクションでは、静的ドキュメントを運用および戦略的なインサイトの動的ソースに変換する方法について説明します。

このソリューションは、3 つの主要なモジュール コンポーネントで構成されています。

MongoDBによる金融サービスドキュメントインテリジェンスのためのリファレンス アーキテクチャ。

図の 1。 MongoDB . を使用したインテリジェントなドキュメント処理アーキテクチャ。

1。スーパーバイザー マルチエージェント オーケストレーション

スーパーバイザーエージェントは、専用エージェントのチームを調整します。各エージェントには、特定のタスクを実行するための独自のプロンプトと特定のツールが提供されます。

  • スキャンエージェントは、複数のソース(ローカルファイル、 AWS S3 、Google ドライブ)から利用可能なドキュメントを検出し、カタログします。

  • 評価エージェントは、業界とユースケースのコンテキストに基づいてドキュメントの関連性を評価します。

  • エクスポート エージェントは、視覚化AI (Clade3.5 Sonnet v2 )を使用して、チャートや表などのテキストと視覚的要素を解釈し、それらをマークダウンに変換します。

  • プロセッサエージェントのコンテンツは、セマンティックに意味のあるチャンクに分割され、VyageAI を使用して埋め込みを生成し、それをMongoDB Atlasコレクションに保存します。

部分 2。エージェント RAG システム

データが取り込まれると、この RG ワークフローは次のことを行います。

  • ドキュメント支援エージェントとのリアルタイムインタラクションを有効にします。

  • クエリ生成、ドキュメントグレーディング、クエリ書き換えのループを使用して、応答を自動的に絞り込みます。

  • vovage-context-3 埋め込みを使用することで、ドキュメントチャンクが正確でベースのある回答のためのより幅広いコンテキストを保持できます。

注意

エージェント RAG には次の特権があります。

  • インテリジェントな決定を行い、検索が必要な時点を直接応答と比較して返します。

  • 自己修正: 検索されたドキュメントが関連性がない場合、クエリを書き換えて再度試行します

  • コンテキストの維持: マルチリターンの対話にMongoDBチェックポイントを使用

  • 透過性を提供: ワークフロー ステップと評価の決定を追跡

部分 3。レポート作成とインサイト生成

このモジュールは、対象を絞ったベクトル検索と LM ベースのコンテンツ生成を使用して、次のタスクを実行して定期レポートを自動化します。

  • カスタマイズされたレポートを生成するための情報を処理します。

  • 関連する結果とコンテキスト データをコンパイルします。

  • PDF などの構造化出力のエクスポート。

  • 低コンテキストのシナリオでも信頼性を確保するためにフォールバック メカニズムを含めます。

ソリューションのデータモデルは、そのコレクションを関数ごとにグループ化します。

主要ドキュメント処理:

  • chunks: は voyage-context-3 ベクトルを持つテキスト セグメントを保存します。

  • documents: はドキュメントメタデータを保存し、処理ステータスとソース情報を追跡します。

  • assessments: 関連性スコアや処理決定などのドキュメント評価の結果が含まれます。

  • workflows: 取り込みワークフロー 追跡を保存し、マルチエージェントの処理状態を監視します。

次のドキュメントは、chunksコレクションの例です。

{
"_id": {
"$oid": "68e7d4cd77c8fbfb9abdf878"
},
"document_id": "doc_ef5b1da6",
"document_name": "Payment_Investigation_Ticket.pdf",
"chunk_index": 2,
"chunk_text": "Contacted cardholder to confirm receipt of temporary credit and advise on investigation timeline. Cardholder confirmed satisfaction with temporary resolution...",
"embedding": [
0.02789805270731449,
0.0045435624197125435,
-0.06760358065366745,
...
],
"has_visual_references": false,
"metadata": {
"name": "Payment_Investigation_Ticket.pdf",
"path": "@s3@.../document-intelligence/fsi/payment_processing_exception/Payment_Investigation_Ticket.pdf",
"processed_at": {
"$date": "2025-10-09T15:29:17.741Z"
},
"chunk_count": 3,
"chunk_metadata": {
"chunk_index": 2,
"total_chunks": 3,
"section_start": "Contacted cardholder",
"section_end": "ion_ticket.html*\n4/5",
"document_id": "doc_ef5b1da6",
"document_name": "Payment_Investigation_Ticket.pdf",
"contains_images": false
}
}
}

次のドキュメントは、documentsコレクションの例です。

{
"_id": {
"$oid": "68e7d4cb5fc2bb6e17eaedb8"
},
"document_id": "doc_ef5b1da6",
"document_name": "Payment_Investigation_Ticket.pdf",
"document_path": "@s3.../document-intelligence/fsi/payment_processing_exception/Payment_Investigation_Ticket.pdf",
"file_extension": "pdf",
"file_size_mb": 0.3242454528808594,
"source_type": "s3",
"source_path": "@s3@fsi/payment_processing_exception",
"page_count": 4,
"created_at": {
"$date": "2025-10-09T15:29:15.041Z"
},
"updated_at": {
"$date": "2025-10-09T15:29:18.267Z"
},
"status": "completed",
"chunk_count": 3,
"has_visual_references": true,
"metadata": {
"markdown_length": 5592,
"processing_timestamp": {
"$date": "2025-10-09T15:29:15.041Z"
}
}
}

次のドキュメントは、assessmentsコレクションの例です。

{
"_id": {
"$oid": "68e7d2b35fc2bb6e17eaedb2"
},
"document_id": "doc_ef5b1da6",
"document_name": "Payment_Investigation_Ticket.pdf",
"document_path": "@s3.../document-intelligence/fsi/payment_processing_exception/Payment_Investigation_Ticket.pdf",
"file_size_mb": 0.3242454528808594,
"assessment": {
"main_entity": "Payment Investigation Ticket",
"document_category": "Banking Investigation Document",
"key_topics": [
"merchant chargeback investigation",
"payment dispute resolution",
"cardholder dispute handling"
],
"relevance_score": 95,
"reasoning": "This document is highly relevant to both the financial services industry and exception handling in payment processing. It is an official payment investigation ticket from First National Bank's Payment Investigation Department, specifically dealing with a cardholder dispute and merchant non-response case. The document contains formal banking investigation details, dispute resolution tracking, and payment processing exception handling elements.",
"should_process": true
},
"assessed_at": {
"$date": "2025-10-09T15:20:19.060Z"
},
"workflow_id": "fsi_payment_processing_exception_1760023126468"
}

次のドキュメントは、workflowsコレクションの例です。

{
"_id": {
"$oid": "68e7d25d5fc2bb6e17eaedad"
},
"workflow_id": "fsi_payment_processing_exception_1760023126468",
"endpoint": "/api/ingestion/start",
"source_paths": [
"@local@/docs/fsi/payment_processing_exception",
"@s3@fsi/payment_processing_exception",
"@gdrive@fsi/payment_processing_exception"
],
"triggered_at": {
"$date": "2025-10-09T15:18:53.563Z"
}
}

主要なドキュメント処理コレクションに加えて、ソリューションには次のような他の関数とそれに対応するコレクションが含まれます。

インタラクションとメモリを要求します。

  • gradings: には、Q8 検索評価からのバイナリ スコアなど、ドキュメント関連性のグレーディングが含まれます。

  • logs_qa: プロンプト インタラクション セッション ログを含む、エージェントキー ワークフローのステップと決定を追跡します。

  • agent_personas: ユースケース固有のAI構成にカスタマイズされた、業界ごとのプロンプトと機能を定義します。

  • checkpoint_writes_aio: は、ディスカッション状態の非同期永続性を処理します(具体的には LgGraph 状態の書込み)。

  • checkpoints_aio: スレッドベースのダイアログ履歴を管理し、チャットメモリとして機能します。

レポート:

  • scheduled_reports: 生成されたレポート メタメタデータを含む PDF ロケーションと生成履歴を追跡します。

  • report_templates:ユースケースによってセクションとプロンプトを定義し、レポート構造のテンプレートとして機能します。

このデータモデルへのアプローチは、開発を簡素化する直感的な設計を作成し、特定のタスクに関連するすべてのデータが MongoDB の柔軟なドキュメント構造内に同じ場所に配置されるためです。

完全な実装とコードについては、README GitHubリポジトリの の手順に従ってください。

このソリューションは、3 つのプライマリ アーキテクチャ パターンを組み合わせて構築されています。各コンポーネントがどのように実装される手順は次のとおりです。

1

これは、複数の専用AIエージェントを調整する主要取り込みパイプラインです。

  • 専用エージェントを定義する: まず、 LgGraphフレームワークを使用して各エージェントを定義します。

  • supervisor agent監視エージェントを実装します。次に、ワークフロー全体を管理する を実装します。これは LingGraph マネージャー パターンに従います。

2

このシステムは、自己修正型エージェント RAG ワークフローを提供します。 MongoDB Atlas Vector Searchからコンテキストを取得するか、ユーザーに直接応答するかをインテリジェントに決定する取得エージェントが備えられています。

MongoDBによる金融サービスドキュメントインテリジェンスのためのリファレンス アーキテクチャ。

図の 2。 MongoDB (ドキュメント 支援 エージェント)によるエージェント的 RAG アーキテクチャ。

  1. ベクトル検索インデックスを作成する:chunks コレクションにベクトル検索インデックスを作成します。これにより、アプリケーションはドキュメント埋め込みに対して高速セマンティック検索を実行できます。

  2. 自己修正 RG グラフを作成する: LgGraph を使用して、条件付きエッジを持つサイクルグラフを作成します。このグラフには、 取得エージェント、ドキュメントグレーダ 、 クエリリ書込み が含まれています。クエリリライターの目的は、結果が関連性のない場合に再試行することです。

  3. やり取りの永続性を有効にする: MongoDBチェックポイント システムを実装して、やり取り メモリとマルチビューの対話を提供します。これにより、専用のMongoDBコレクションから対話状態が自動的に保存およびロードされ、エージェントにメモリの永続性が付与されます。

3

このモジュールは、スケジュールされた PDF レポートの生成を自動化します。

  1. レポート テンプレートの保存: MongoDB の柔軟なスキーマを活用してreport_templates コレクションを作成します。これにより、クレジット評価やプロジェクトレポートなど、各レポートタイプの構造、セクションタイトル、および特定のセマンティック検索プロンプトが保存されます。

  2. セクション固有の生成を実装する: テンプレートの各セクションをループ処理するスクリプトを作成します。このスクリプトは、別の Atlas ベクトル検索クエリを実行します。その特定のセクションのプロンプトを使用し、コンテンツを累積します。

  3. レポート出力のスケジュールと追跡: このスクリプトは スケジューラーによって実行されます。 PDFscheduled_reports の生成後、スクリプトは追跡用にMongoDBの コレクションにファイルパスや生成日などのメタデータを書込みます。

  • MongoDB Atlas を統合データプラットフォームとして使用して、 構造化メタデータ、非構造化ドキュメント、ベクトル埋め込み、運用状態を保存します。これにより、データサイロが排除され、アーキテクチャの複雑さが軽減されます。

  • 複雑なマルチエージェント ワークフローを管理するために、スーパーバイザーのマルチエージェント オーケストレーション パターンを実装します。このパターンにより、複数の専用ワーカー エージェント間でツールを分割し、集中的な専門知識を確保できます。

  • クエリの精度を向上させるには、 自己修正メカニズムを持つ エージェント的 RG を配置します。これにより、エージェントはコンテキストの取得、クエリの再フォーマット、ドキュメントの関連性のグレードをインテリジェントに決定できます。

  • 堅牢な通信とワークフロー追跡を確立するために、永続的なエージェントメモリに MongoDB のチェックポイントを実装します。これにより、複数回のインタラクションで永続的な対話状態とダイアログ履歴が確保されます。

  • MongoDB Atlas Vector Searchを使用してセマンティック検索を実行し、自動レポートなどのターゲット コンテンツ生成を実行します。これにより、クエリはキーワードだけでなく意味を使用してコンテンツを検索し、より正確な出力を得ることができます。

  • ペイマン パージ、フィールドCTO金融サービス、 MongoDB

  • Ainnoa Kubernetes、コンサルティング、業界ソリューション、 MongoDB

  • ユーティリティ ソート、高度に選択と選択、インサイト ソリューション、 MongoDB

  • Andrea Alaman Calderon、シニア スペシャリスト、業界ソリューション、MongoDB

戻る

クレジット カード アプリケーション

項目一覧