使用 LLM 和 RAG 向量搜索进行理赔管理

了解如何将MongoDB Atlas Vector Search 和大型语言模型 (LLM) 结合起来，简化理赔进程。

使用案例： 生成式人工智能、内容管理

行业： 保险、金融、制造和移动、零售

产品： MongoDB Atlas，MongoDB Atlas Vector Search

合作伙伴： LangChain、FastAPI

解决方案概述

理赔人员面临的最大挑战之一是聚合来自不同系统和数据格式的信息。多年来，保险公司在其数据存储中积累了数 TB 的非结构化数据，这些数据有助于发现业务见解、提供更好的客户体验并简化运营。然而，许多公司未能利用这一点。

为了帮助您的组织克服这些挑战，您可以使用MongoDB构建理赔管理解决方案，该解决方案将Atlas Vector Search和法学硕士结合在检索增强生成 (RAG)系统中。该框架可帮助组织Go基本模型的限制，并使用其专有数据使模型具有上下文感知能力，从而充分发挥 AI 的潜力，简化操作。

参考架构

MongoDB通过将文档与向量嵌入和相关元数据一起存储来提供统一的开发体验，从而无需在其他地方检索数据。这使用户可以专注于构建应用程序，而不是维护单独的技术。最终，从MongoDB Vector Search 获得的数据将作为上下文提供给 LLM。

RAG 查询进程如下：

用户用自然语言编写提示。
Voyage AI 的嵌入模型可将提示矢量化。
Atlas Vector Search使用矢量化提示来检索相关文档。
LLM 使用上下文和原始问题来生成回答。
用户会收到回答。

图1。RAG 查询流程

数据模型方法

在演示解决方案中，数据模型采用简化设计，可模拟真实的保险理赔数据。该方法利用 MongoDB 灵活的文档模型来处理将嵌入与相关文档一起存储的各种数据结构。

claims_final集合存储声明信息。相关字段是 claimDescription字段及其相应的嵌入 claimDescriptionEmbedding。这种嵌入被索引并用于检索与用户提示相关的文档。此集合中的文档如下：

{
"_id": {
   "$oid": "65cc809c76da22d0089dfb2e"
},
"customerID": "c105",
"policyNumber": "p105",
"claimID": "cl105",
"claimStatusCode": "Subrogation",
"claimDescription": "High winds caused ...",
"totalLossAmount": 4200,
"claimFNOLDate": "2023-10-27",
"claimClosedDate": "2024-09-01",
"claimLineCode": "Auto",
"damageDescription": "Roof caved in ...",
"insurableObject": {
   "insurableObjectId": "abc105",
   "vehicleMake": "Make105",
   "vehicleModel": "Model105"
},
"coverages": [
   {
      "coverageCode": "888",
      "description": "3rd party responsible"
   },
   {
      "coverageCode": "777",
      "description": "Vehicle rental/loaner service for customer"
   }
],
"claimDescriptionEmbedding": [-0.017, ..., 0.011],
"damageDescriptionEmbedding": [-0.047, ..., -0.043],
"photo": "105.jpg",
"photoEmbedding": [9.629, ..., 14.075]
}

构建解决方案

有关详细的设置说明，请关注此Github存储库的 README。这些说明指南您完成以下步骤：

设置 MongoDB 数据库和集合

在MongoDB Atlas中创建一个名为 demo_rag_insurance 的新数据库，并使用提供的数据集 demo_rag_insurance_claims.json 创建一个名为 claims_final 的集合。

创建 Vector Search 索引

为 claimDescriptionEmbeddingCohere 创建并配置名为 vector_index_claim_description_cohere 的Atlas Vector Search索引。您必须按如下方式构建搜索索引：

{
   "fields": [
      {
         "type": "vector",
         "path": "claimDescriptionEmbeddingCohere",
         "numDimensions": 350,
         "similarity": "cosine"
      }
   ]
}

配置后端

使用 Poetry 设置虚拟环境。

与API交互

启动后端服务器。

连接到前端

配置环境变量并运行前端。

您必须同时运行前端和后端。您将访问权限一个 Web用户界面，在该用户界面中，您可以向法学硕士提问、获得回答以及查看用作上下文的参考文档。

要立即试用 MongoDB 的语义搜索工具，请访问Atlas Vector Search快速入门指南。

关键要点

生成文本嵌入：您可以使用不同的模型和部署选项创建嵌入。考虑隐私和数据保护要求非常重要。如果您的数据需要保留在服务器上，您可以在本地部署模型。否则，您可以调用API并取回向量嵌入，如本教程中所述。您可以使用Voyage AI或开源模型。
创建向量搜索索引：您可以在MongoDB Atlas中构建向量搜索索引。或者，您也可以为本地部署构建索引。
执行向量搜索查询：您可以运行MongoDB 的聚合管道向量搜索查询，从而允许您在工作流程中连接多个操作。这种方法无需学习；了解另一种编程语言或更改上下文。
开发快速 RAG 实施：您可以使用结合了MongoDB Atlas Vector Search 和法学硕士的LangChain框架来开发快速 RAG实施。

作者

Luca Napoli，行业解决方案，MongoDB
Jeff Needham，行业解决方案，MongoDB

后退

构建一个 PDF 搜索应用程序

来年

机场操作助手语音助手