Xlrt: エージェントAIと知識グラフによる金融ドキュメント処理の最適化

このドキュメントでは、エージェントによるAIとMongoDB向けの知識グラフを使用して、財務ドキュメントの分析と複雑なワークフローを最適化するように設計されたソリューションである Xlrt のアーキテクチャについて説明します。

Xlrt の概要

Xlrt は、手動のボトルネックとAIの影響を排除し、カスタマーの財務の健全性を正確かつ完全なビューで生成することで、財務上の決定を変換します。システムでは、データを処理し、アクションを実行し、金融エコシステム内で調整するインテリジェントエージェントが使用されます。また、結果として得られる決定には、条件を満たすために必要なプロセスの最適化、製品の推奨プロセスの最適化、デフォルトや不正などのリスクの管理が含まれます。

金融ドキュメント分析におけるAIの課題

従来の金融AIアプローチでは、特に複雑な数量データを処理する場合、ビジネスへの影響と信頼を制限するボトルネックが発生することがよくあります。一般的な問題には、次のようなものがあります。

手動ワークフローのボトルネック:クレジットメモリの作成などのプロセスでは、集中的な手動コンパイル、分析、反復的なレビューが必要になるため、遅延やエラーが発生します。
コンテキストに必要な基数の欠落: AIモデルには、正確な数値精度が必要なエンタープライズ固有の金融コンテキストが欠落していることがよくあります。これにより、実質的に正しいが実行できない出力が生成されます。
精度と信頼性のリスク（はにとき

Xlrt では、次の方法を使用してこれらの問題を解決します。

グラフ検索拡張生成（Graph RAG）: 財務オンポロジー（主要金融明細項目とその関係を表すグラフ構造）を使用して、関連する金融知識と数値データを選択的に検索します。
ロール固有のエージェントと認識の連鎖（CoT）理由付け: エンドツーエンドのワークフローを自動化するため。
スコアリングベースのフィードバック: 理由を強化するには、精度を評価し、結果が精度の標準を満たすまで CoT プロンプトを反復的に改善します。

グラフ検索拡張生成による知識エージェントの能力

知識エージェントは、複雑なデータセットからインサイトを操作、分析、推論するように設計されたインテリジェントシステムです。

金融関連では、データ内の複雑な関係を理解することが重要です。 Xlrt は、この目的を実現するために知識エージェントを Graph Raw と統合します。

金融オンタリオとグラフのストア

財務オンポロジーは、Xlrt アプローチの主要である知識グラフです。このオントポロジーは、金融エンティティの関係方法に関するルールと制約を提供する青いプリントとして機能します。

MongoDB AtlasまたはMongoDB Enterprise Advancedによって強化されるグラフストアは、グラフ構造とそれに関連する金融データを保存する永続的データベースレイヤーです。

図の 1。 MongoDBによって提供される Xlrt の知識エージェント + グラフ RAG システム。

基礎となるグラフストアには、2 つの統合されたデータコンポーネントが含まれています。

ドメイン固有のオンロジー構造: 許可されたノードとエッジタイプの概念実証。
年間財務データ:クライアントドキュメントから抽出されたグラフの特定のインスタンス（ノードとエッジ）。年次レポートや金融ステートメントなどのドキュメントをソースとするこのデータは、各レポート期間ごとにノードとエッジに数値を入力します。この時間の経過とともに母集団が存在することで、システムは過去の傾向と財務変化を分析できます。

オンポロジーの構造化: ノードとエッジ

ノード: 収益、費用、正午などの金融明細項目。
エッジ: 因果関係または構造的な関係（総数に影響を与える収益など）。これらのエッジは、2 つのノード間のセマンティック関係を定義します。

コンテキスト検索での Graph RG の使用

Graph RG は、知識グラフ（グラフ定数）とAI検索および生成手法を組み合わせたものです。 Xlrt は Graph RG を使用してグラフストアから関連する知識と数値情報を検索し、TLM をグラウンドします。このグラウンド処理により、出力がコンテキストに応じて実行可能になり、実行可能になる。

GraphRAG を使用すると、システムは次のことが可能になります。

因果依存関係の分析: システムは因果関係（エッジ）を追跡し、ある財務明細項目の変更が他の明細項目にどのように影響するかを識別します。
非論理相関の特定: システムは、ノード間の関係を検査して、財務ロジックに適さない不整合や相関を検出します。この検証により、データの整合性が確保されます。
任意の行項目のコンテキストを取得: システムはグラフをクエリし、関連するノードとエッジを抽出し、行項目を囲むデータのコンテキストに応じたスナップショットを提供します。このスナップショットでは、個々のコンポーネントが財務構造内でどのように相互作用するのかが明確になります。

このアプローチは、金融データセットの構造と相互接続性を明確にすることで、コンテキストの認識とより優れた決定権を提供します。

MongoDBと Lgachein による Graph Rug の強化

Latchin は LM をMongoDBに直接接続します。 MongoDBGraphStore コンポーネントはこの接続を容易にし、言語モデルとデータベースの間のデータフローを管理します。この統合により、専用のグラフデータベースエンジンが必要になることなく、非構造化金融データがアクション可能で相互に接続されたインサイトに変換されます。

主要データベース機能

システムは、知識グラフの基礎として機能するためにMongoDBの柔軟なアーキテクチャに依存しています。

運用データとグラフ データの統合:グラフデータを運用データから分離する従来のアプローチとは異なり、 MongoDB はドメイン固有のオンポロジーと金融データの特定のインスタンス（ノードとエッジ）の両方を同じ柔軟なドキュメント形式で保存します。これにより、厳格なスキーマ移行なしに、システムは年次報告または金融機関の新しいデータをグラフに継続的に入力できます。
効率的なグラフ トラバーサル: MongoDB は$graphLookup集計ステージを使用してグラフトラバーサルとクエリを実行します。このプロセスにより、運用データと一緒に、関連する相互接続された財務の知識を迅速に取得できます。

MongoDBGraphStore の統合

MongoDB はエンジンを提供しますが、Lgachein の MongoDBGraphStore コンポーネントはオーケストレータとして機能します。このコンポーネントは、2 つの主要な関数を通じてGraph RAG の実装を効率化します。

抽象化と取得:MongoDBGraphStore は未加工のデータベース集計を抽象化し、グラフデータの取得を簡素化します。コンポーネントは、検索された知識グラフをコンテキスト情報の多いプロンプトに自動的にフォーマットするため、手動でクエリを構築する必要なくエージェント的理由付けでデータを最適化します。
動的グラフ作成:グラフを入力するために、コンポーネントは動的「抽出とロード」ワークフローを使用します。
- エンティティ抽出: LVM ベースのエンティティ抽出モデル（コンポーネント内で初期化）は、クライアントがアップロードした財務ステートメントを解析します。名前付きエンティティとその接続を抽出することで、非構造化データを構造化グラフのエンティティと関係に変換します。
- 構成: カスタムのプロンプトと指示が抽出プロセスをガイド。これらのプロンプトはentity_prompt パラメータを通じて構成可能で、モデルがデータを正しい財務コンテキストにマッピングするようにします。
- グラフ母集団: add_documents()メソッドを使用して、モデルはこれらのエンティティと関係をMongoDBコレクションに自動的に抽出し、アップサートします。これにより、新しいドキュメントが処理されるとすぐに変化する動的な知識グラフが作成されます。

スコアリングベースのフィードバックによる考えの連鎖（CoT）の強化

Graph Raw を通じて正しいコンテキストを取得することは重要ですが、データに適用される理由を正確に確保することも等しく重要です。 Xlrt は、モデルの出力を反復的に改善するスコアリングループを導入することで、標準的な考え性連鎖（CoT）のプロンプトを強化します。

理由付けの限界

構造化された理由があっても、大規模な言語モデル（LVM）では、コンテキストを誤解したり、誤った論理的なスキップが行われて、はドキュメントが含まれることがあります。このリスクを軽減するために、Xlrt は二重モデルアーキテクチャを使用します。

Performance LM: 金融データに基づいて初期応答を生成します。
プロンプト増加 LVM: パフォーマンス者の出力を評価し、品質が不十分な場合はプロンプトを調整します。

スコアリングプロセス

システムは、すべての応答を 3 つの重要なメトリクスに対して評価します。

コンテキストの整合性: 応答は提供された特定の金融コンテキストと一致しますか。
機能の精度: 出力は既知の機能とデータルールに準拠していますか。
論理の健全性: 中間的な理由付けステップは接続されており、有効か。

応答のスコアが 60 パーセンテージなどの特定のしきい値を下回る場合、Prompt Usage はエラーを分析し、洗練されたプロンプトを生成します。例、は、Performance LM に「以前の四半期と比較したパーセンテージの変更を検証する」ように明示的に指示します。このサイクルは、応答が精度の基準を満たすまで繰り返されるため、クレジットメモの作成などの重要なタスクに対して高信頼性の出力が保証されます。

パーソナライズされたコメントのユーザーフィードバック

出力が関連性を確保するために、システムはユーザーのフィードバックを2 つの方法で使用して、認識連鎖（CoT）の生成を改善します。

ロールベースのアダプション: エラーのみを修正するのではなく、システムはユーザーのフィードバックを使用して、ユーザーの特定のコンテキストに合わせて CoT プロンプトを調整します。
動的強化: 専用の LVM は、監査のコンプライアンスまたは経営陣のビジネスへの影響に焦点を当てて、プロンプトを調整するためにフィードバックを分析します（例、）。

ユースケース: 金融ドキュメントワークフローの変換

Xlrt は Graph RG アーキテクチャを使用して、時間のかかる財務ドキュメントワークフローを変換します。金融知識グラフに基づくエージェント的AIを使用して、次の 3 つの製品提供を強化します。

Justifern: 10K、年次レポート、マネジメントが作成した財務などの財務ステートメントを迅速に分析します。また、データプロバイダーとスマートなサマリーの正規化された分析も提供します。
Atlas : 商用契約の自動分析を提供し、キャッシュフローをプロジェクトための商用タームを推測して、組織の契約管理を容易にします。
Factors: テンプレートフリーの請求書の解析と自動データ評価を有効にし、直線処理の優れた検証フローを確保します。

金融ドキュメント分析における Xlrt の主な利点

これらの複雑なワークフローをオートメーションには、次のメリットが得られます。

精度: 実際の知識グラフに基づいて、ドメイン調整されたエージェントは、正確かつ一貫した財務インサイトを確保します。
コスト削減: システムは手動作業への依存関係を削減すると同時に、高品質で監査可能な結果を維持します。
効率: エンドツーエンドのワークフローを自動化することで、手動の作業量が大幅に削減され、データ処理が迅速化され、決定権がより迅速になります。

Xlrt のグラフ RAG アーキテクチャの説明ロジック

次の手順では、Xlrt が Lgachein とそのMongoDBGraphStore コンポーネントを統合してインテリジェントドキュメント処理のための Graph Raw を構築するために使用する主要な実装ロジックを示します。この図ではMongoDB Atlasを使用していますが、 MongoDB Enterprise Advancedもオプションです。 Xlrt は Ollma を使用して LM を実行することを選択しました。

環境を準備する

MongoDB とのインタラクション、Lgachein 統合、および LM にリクエストを送信するための Ollma に必要なライブラリがインストールされます。アーキテクチャは LM に依存しないため、任意の LM モデルに接続できます。このチュートリアルを完了するには、 MongoDBバージョン 7.0.2 以降を実行中Atlas クラスターが必要です。

pip install --quiet --upgrade pymongo langchain_mongodb langchain_ollama

変数を定義する

MONGODB_URI = "<connection-string>"
DB_NAME = "financial_kg_db" # MongoDB database to store the knowledge graph
COLLECTION_NAME = "FINANCIALS" # MongoDB collection to store the knowledge graph

<connection-string> は、Atlas クラスターからの接続文字列になります。

<connection-string> は、次の形式を使用して定義されます。

mongodb+srv://<db_username>:<db_password>@<clusterName>.<hostname>.mongodb.net

LgChuin MongoDB Graph Store のインスタンス化

from langchain_mongodb.graphrag.graph import MongoDBGraphStore
graph_store = MongoDBGraphStore.from_connection_string(
   connection_string=MONGODB_URI,
   database_name=DB_NAME,
   collection_name=COLLECTION_NAME,
   entity_extraction_model=chat_model # LLM – model of your choice
   )

グラフストアへのデータの追加

# Add documents to extract entities and relationships from and to the graph store
graph_store.add_documents(documents)

グラフストアへのクエリ

# Query the knowledge graph to get related entities and context for prompts Query = "What are the key financial metrics for Q4? "
Context = graph_store.query(
   query,
   max_hops=3
)

プロンプト拡張のためのコンテキストの組み合わせ

関連データが取得された後、Graph RAG から取得されたコンテキストを組み合わせて、Ollma が提供する Lgachein と選択したモデルを使用して LM のプロンプトを強化します。

コンテキスト構築のためのPython例:

from langchain_ollama import ChatOllama
from langchain.prompts import PromptTemplate
# Set up Ollama as the LLM with your model of choice
llm = ChatOllama(model="<model of your choice>")
# Define a prompt template
template = """
You are an AI financial analyst. Analyze the following data and provide insights: {context}
User Query: {query}
"""
prompt = PromptTemplate(
         input_variables= ["context", "query"],
         template=template
)
chain = prompt | llm
response = chain.invoke({"context": context, "query": Query})
print("Generated Insights:\n", response)

まとめ

金融組織は、Xlrt をMongoDB AtlasまたはMongoDB Enterprise Advancedと統合して、高度なインテリジェントドキュメント処理と自動ワークフローに Graph RG システムを使用できます。

この組み合わせにより、構造化されていない財務データが実行可能なインサイトに変換されます。 MongoDBベースの財務オンポロジーは、効率、精度、戦略的な決定権限を向上させます。

重要なポイント

MongoDB Graph RAG アーキテクチャを使用して LM を基礎化する: MongoDB Graph RG アーキテクチャを使用することで、LVM は動的な金融オンポロジーで基礎となります。このアプローチでは、 $graphLookup集計ステージを使用して、統合された知識ベース内の相互接続された関係を走査し、正確でコンテキストに対応した検索を保証します。
スコアリングベースの理由で複雑なエージェントを強化: 単純な検索ではなく、アーキテクチャは高度なフィードバックループをサポートします。 MongoDBから取得された検証済みの財務情報に対して「認識の連鎖」を検証することで、システムは応答を最終化する前に精度を確保します。この反復的なスコアリングにより、プロ認証を防止し、すべてのインサイトが論理的に健全性を確保し、金融オンタリオとの整合性があることが保証されます。
技術機能をビジネス値に変換: MongoDBを使用して非構造化ドキュメントと構造化知識グラフを統合することで、組織はクレジット分析などの手動のボトルネックを自動化されたインテリジェントなワークフローに変換できます。このアーキテクチャの移行により、運用のオーバーヘッドが削減され、手動プロセスへの依存関係が最小限に抑えられます。

戻る

IntellectAI 赤色組織