Xlrt：通过代理AI和知识图优化财务文档处理

本文档概述了 Xlrt 的架构，该解决方案旨在通过使用代理AI和由...提供支持MongoDB提供支持的知识图表来优化财务文档分析和复杂的工作流程。

Xlrt 概述

Xlrt 通过消除手动瓶颈和AI幻觉来转变财务决策，生成有关客户财务健康状况的准确、完整的视图。该系统使用智能代理来进程数据、执行操作并在金融生态系统中进行适应。由此产生的决策通常涉及优化贷款审批流程、定制产品推荐以及管理默认和欺诈等风险。

AI在财务文件分析中的挑战

传统的金融AI方法经常遇到限制业务影响和信任的瓶颈，尤其是在处理复杂的定量数据时。常见的挑战包括：

手动工作流瓶颈：创建信用凭证等流程需要大量的手动编译、分析和迭代审核，从而导致延迟和错误。
缺乏上下文基础： AI模型通常缺乏精确的数值准确性所需的特定于企业的财务上下文。这会导致输出可能实际上是正确的，但不可操作。
准确性和可靠性风险（幻觉）：即使使用结构化推理，大型语言模型 (LLM) 也可能会错误地进程上下文或出现逻辑错误，从而产生逻辑上不健全或不准确的结果。

Xlrt 通过使用以下方法来克服这些挑战：

图检索增强生成 (Graph RAG)：使用金融本体（一种表示关键财务列项及其关系的图表结构）来有选择地检索相关的金融知识和数值数据。
角色特定代理和思想链 (CoT) 推理：实现端到端工作流程自动化。
基于评分的反馈：增强推理、评估准确性并迭代完善 CoT 提示，直到结果达到准确性标准。

具有图检索增强生成功能的知识代理的强大功能

知识代理是智能系统，旨在导航、分析复杂数据集并从中推断见解。

在金融领域，理解数据中的复杂关系至关重要。 Xlrt 将知识代理与 Graph RAG 集成以实现此目标。

金融本体和图形存储

金融本体是一个知识图表，是 Xlrt 方法的核心。该本体作为蓝图，为金融实体的关联方式提供了规则和约束。

由...提供支持MongoDB Atlas或MongoDB Enterprise Advanced提供支持的图表存储是持久数据库层，用于存储图表结构及其相关的财务数据。

图 1。 Xlrt 的知识代理 + 图形 RAG 系统由MongoDB提供支持。

根本的图表存储包含两个合并的数据组件：

特定领域的本体结构：允许的节点和边类型的概念蓝图。
年度财务数据：从客户端文档中提取的图表的特定实例（节点和边）。这些数据源自年度报告和银行对账单等文档，用每个报告期的数值填充节点和边。随着时间的推移，这种持续的人口数量使系统能够分析历史趋势和金融演变。

构建本体：节点和边

节点：财务行列项，例如收入、费用和净利润。
边：因果或结构关系，例如影响净利润的收入。这些边定义了两个节点之间的语义关系。

使用 Graph RAG 进行上下文检索

Graph RAG 将知识图谱（图表论）与AI检索和生成技术相结合。 Xlrt 使用 Graph RAG 从图表存储中检索相关知识和数字信息，为法学硕士提供基础。这种基础可确保输出内容切合实际、符合事实且可操作。

Graph RAG 使系统能够：

分析因果关系：系统追踪因果关系（边缘），并确定一个财务行列项的变更如何影响其他财务行列项。
识别不合逻辑的相关性：系统检查节点之间的关系，以检测违反金融逻辑的不一致或相关性。此验证可确保数据完整性。
检索任何行项目的上下文：系统查询图表，提取相关节点和边，并提供行项目周围数据的上下文快照。此快照阐明了各个组成部分如何在财务结构中交互。

这种方法通过揭示金融数据集的结构和互连性来提供上下文感知和更好的决策。

使用MongoDB和 LangChain 为 Graph RAG 提供支持

LangChain 将法学硕士直接连接到MongoDB。 MongoDBGraphStore 组件可促进此连接并管理语言模型与数据库之间的数据流。这种集成可将非结构化财务数据转换为可操作的互连见解，而无需专用的图表数据库引擎。

核心数据库功能

该系统依赖于MongoDB的灵活架构提供服务知识图表的基础：

统一的操作和图形数据：与将图表数据与操作数据分开的传统方法不同， MongoDB以相同的灵活文档格式存储特定领域的本体和财务数据的特定实例（节点和边）。这使系统能够使用年度报告或银行对账单中的新数据不断填充图表，而无需严格的模式迁移。
高效的图形遍历： MongoDB使用 $graphLookup聚合阶段执行图表遍历和查询。通过此进程，可以直接快速检索相关的互联金融知识和运营数据。

MongoDBGraphStore 集成

尽管MongoDB提供了引擎，但 LangChain 中的 MongoDBGraphStore 组件充当了协调器。该组件通过两个关键功能简化 Graph RAG 的实施：

抽象和检索：MongoDBGraphStore 抽象原始数据库聚合，简化图表数据的检索。该组件会自动将检索到的知识图表格式化为上下文丰富的提示，从而优化数据以进行代理推理，而无需手动构建查询。
动态图形创建：为了填充图表，该组件使用动态的“提取和加载”工作流程：
- 实体提取：基于 LLM 的实体提取模型（在组件内初始化）解析客户端上传的财务报表。它通过提取命名实体及其连接，将非结构化数据转换为结构化图表实体和关系。
- 配置：自定义提示和说明指南提取进程。这些提示可通过entity_prompt 参数进行配置，确保模型将数据映射到正确的财务环境。
- 图表填充：使用add_documents() 方法，模型自动提取这些实体和关系，并将其更新或插入到MongoDB集合中。这将创建一个动态知识图表，该知识图谱会随着新文档的处理而立即演变。

通过基于评分的反馈增强思路 (CoT)

虽然通过 Graph RAG 检索正确的上下文至关重要，但确保应用于该数据的推理是准确的也同样重要。 Xlrt 通过引入可迭代优化模型输出的评分循环来增强标准思想链 (CoT) 提示。

推理挑战

即使使用结构化推理，大型语言模型 (LLM) 有时也会误解上下文或进行错误的逻辑跳转，从而导致幻觉。为了降低这种风险，Xlrt 使用了双模型架构：

表演者法学硕士：根据财务数据生成初始响应。
提示增强法学硕士：评估执行器的输出，并在质量不足时调整提示。

评分过程

系统会根据三个关键指标评估每个响应：

上下文一致性：回复是否与所提供的特定财务背景一致？
事实准确性：输出结果是否符合已知事实和数据规则？
逻辑可靠性：中间推理步骤是否相互关联且有效？

如果响应分数低于特定阈值（例如 60%），Prompt Augmentation LLM 会分析错误并生成完善的提示，示例，明确指示 Performance LLM“验证与上一季度相比的百分比变化”。重复此循环，直到响应达到准确性标准，从而确保创建信用凭证等关键任务的高可靠性输出。

个性化评论的用户反馈

为确保输出的相关性，系统通过两种方式使用用户反馈来优化思路链 (CoT) 的生成：

基于角色的调整：系统不仅更正错误，还根据用户反馈，根据用户的特定上下文定制 CoT 提示。
动态增强：专门的法学硕士分析反馈以调整提示，示例，重点关注审核员的合规或高管的业务影响。

使用案例：转变财务文档工作流程

Xlrt 使用其 Graph RAG 架构来转变耗时的财务文档工作流程。它使用基于金融知识图表的代理AI来支持三种产品：

Justifi™：提供财务报表的即时分析，例如 10-K、年度报告和管理层编制的财务数据。它还为数据提供者和智能摘要提供规范化分析。
Contractus™：提供对商业合同的自动分析，推断项目现金流的商业条款，并促进组织合同管理。
Facturas™：支持对发票进行无模板解析和自动数据评估，确保为直通式处理提供卓越的验证流程。

Xlrt 用于财务文档分析的主要优势

这些复杂工作流程的自动化提供了以下好处：

准确性：基于事实知识图表的领域调整代理，确保财务见解精确一致。
降低成本：系统减少对体力劳动的依赖，同时保持高质量、可审核的结果。
效率：自动化的端到端工作流程大幅减少了人工，启用了数据处理速度，加快了决策制定速度。

Xlrt Graph RAG 架构的逻辑说明

以下步骤说明了 Xlrt 用于集成 LangChain 及其MongoDBGraphStore 组件以构建用于智能文档处理的 Graph RAG 的关键实施逻辑。此插图使用MongoDB Atlas，尽管MongoDB Enterprise Advanced也是一个选项。 Xlrt 已选择使用 Ollama 来运行LLM：

准备环境

安装MongoDB交互、LangChain 集成和 Ollama 所需的库，以将请求发送到 LLM。该架构与 LLM 无关，允许插入任何 LLM 模型。要完成本教程，您需要一个运行MongoDB 7.0.2 或更高版本的Atlas 集群。

pip install --quiet --upgrade pymongo langchain_mongodb langchain_ollama

定义变量

MONGODB_URI = "<connection-string>"
DB_NAME = "financial_kg_db" # MongoDB database to store the knowledge graph
COLLECTION_NAME = "FINANCIALS" # MongoDB collection to store the knowledge graph

<connection-string> 将是来自Atlas 集群的连接字符串。

<connection-string> 使用以下格式定义：

mongodb+srv://<db_username>:<db_password>@<clusterName>.<hostname>.mongodb.net

实例化 LangChain MongoDB图存储

from langchain_mongodb.graphrag.graph import MongoDBGraphStore
graph_store = MongoDBGraphStore.from_connection_string(
   connection_string=MONGODB_URI,
   database_name=DB_NAME,
   collection_name=COLLECTION_NAME,
   entity_extraction_model=chat_model # LLM – model of your choice
   )

将数据添加到图形存储

# Add documents to extract entities and relationships from and to the graph store
graph_store.add_documents(documents)

查询图形存储

# Query the knowledge graph to get related entities and context for prompts Query = "What are the key financial metrics for Q4? "
Context = graph_store.query(
   query,
   max_hops=3
)

合并上下文以进行提示增强

检索到相关数据后，将从 Graph RAG 中检索到的上下文相结合，以使用 LangChain 和 Ollama 所服务的所选模型来增强 LLM 的提示。

上下文构建的Python示例：

from langchain_ollama import ChatOllama
from langchain.prompts import PromptTemplate
# Set up Ollama as the LLM with your model of choice
llm = ChatOllama(model="<model of your choice>")
# Define a prompt template
template = """
You are an AI financial analyst. Analyze the following data and provide insights: {context}
User Query: {query}
"""
prompt = PromptTemplate(
         input_variables= ["context", "query"],
         template=template
)
chain = prompt | llm
response = chain.invoke({"context": context, "query": Query})
print("Generated Insights:\n", response)

结论

金融组织可以将 Xlrt 与MongoDB Atlas或MongoDB Enterprise Advanced集成，以使用 Graph RAG 系统进行高级智能文档处理和自动化工作流程。

这种组合将非结构化财务数据转化为可行的见解。 MongoDB支持的金融本体提高了效率、准确性和战略决策。

要点

MongoDB Graph RAG 架构为法学硕士奠定了基础：通过使用MongoDB Graph RAG 架构，法学硕士以动态金融本体为基础。这种方法使用 $graphLookup聚合阶段来遍历统一知识库中的互连关系，从而确保精确且上下文感知的检索。
通过基于评分的推理为复杂的代理提供支持：除了简单的检索之外，该架构还支持高级反馈循环。通过对照从MongoDB检索的经验证的财务事实来验证思想链推理，系统在最终确定响应之前确保准确性。这种迭代评分可以防止幻觉，确保每个见解在逻辑上都是合理的，并且与您的财务本体一致。
将技术能力转化为业务价值：通过使用MongoDB来统一非结构化文档和结构化知识图，组织可以将信用分析等手动瓶颈转化为自动化、智能的工作流程。这种架构转变降低了运营开销，并最大限度地减少对手动流程的依赖。

后退

IntellectAI 紫色结构