利用附带实时数据处理功能的机器学习,并自动完成数字承保。
产品和工具: 时间序列、Atlas Charts、Spark Connector
合作伙伴: Databricks
解决方案概述
试想,您能为客户提供个性化、基于使用情况的保费,而这些保费会考虑他们的驾驶习惯和行为。为此,您需从联网车辆收集数据、将其发送到机器学习平台进行分析,然后使用分析结果为客户制定个性化保费。此外,您还需将这些数据可视化,以识别趋势并获得见解。这一独特且量身定制的方法有助您的客户加大对保险费用的控制权,同时帮助您提供更准确、更公平的定价。
在 GitHub 存储库中,您可找到详细的分步说明,以便了解如何利用 MongoDB Atlas 平台功能来构建数据上传与转换管道,以及如何生成事件、向 Databricks 发送事件以及处理来自 Databricks 的事件。
在本演示结束时,您将使用 Atlas Charts 创建一个数据可视化面板,可近乎实时地追踪自动化保险费的动态变化。
其他适用行业和使用案例
金融服务:银行及金融机构必须能够解读带时间戳的金融交易,以支持交易决策、欺诈侦测等多种用途。
零售:获取当前动态的实时见解。
医疗保健:从运输模式到包装本身,IoT 传感器在运输途中和现场均能实现供应链优化。
参考架构
图 1. 基于 MongoDB 的参考架构
数据模型方法
用于支持此使用案例的基本示例数据模型将包括客户、他们完成的行程、他们购买的保单以及这些保单所承保的车辆。
此示例构建了三个MongoDB集合以及两个物化视图。可以在 GitHub 上找到定义此示例中所有MongoDB对象的完整 Hackloade数据模型。

图2。MongoDB 数据模型方法
构建该解决方案
将包含汽车总行驶距离的数据集加载到 MongoDB 中,并在每天午夜运行一个每日 cron 作业,该作业会汇总每日行程并将其编译成一个存储在名为“CustomerTripDaily”的新集合中的文档。每月 cron 作业在每月的 25 号运行,将汇总每日文档并创建一个名为“Customer Trip Monthly”的新集合。每次创建新的月度汇总时,Atlas Function 都会将当月的总距离和基线保费发布到 Databricks 以进行机器学习预测。然后,机器学习预测将发送回 MongoDB 并添加到“Customer Trip Monthly”文档中。最后一步,您可以使用 MongoDB Charts 将所有数据可视化。
创建包含物化视图的数据处理管道
本示例中的数据处理管道组件包括示例数据、每日物化视图和每月物化视图。IoT 车辆遥测数据的示例数据集表示客户的机动车行程信息。该数据集被加载到名为“customerTripRaw”的集合中 (1)。该数据集可在 GitHub 上找到,并可以通过 MongoImport 或其他方法加载。要创建一个物化视图,定时触发器会执行一个运行聚合管道的函数。然后,它会生成原始 IoT 数据的每日摘要,并将其放入名为“customerTripDaily” (2) 的物化视图集合中。同样,对于每月物化视图,定时触发器会执行一个函数,该函数运行一个聚合管道,用于每月汇总“customerTripDaily”集合中的信息,并将其放置在名为“customerTripMonthly” (3) 的物化视图集合中。
请参阅以下 GitHub 存储库,以创建数据处理管道:
第 1 步: 加载示例数据。
步骤 2: 设置每日的 cron 作业。
步骤 3: 设置每月的 cron 作业。
图3。创建数据处理管道
使用机器学习模型自动化保险费计算
本示例的决策处理组件由一个定时触发器组成,该触发器会收集必要的数据并将有效负载发布到 Databricks 机器学习流程 API 终结点。(该模型之前曾在 Databricks 上使用 MongoDB Spark Connector 进行训练。)然后,它等待模型根据某位客户在一个月内行驶的里程数计算出保费并进行响应。接下来,定时触发器会更新“customerPolicy”集合,将一个新的月度保费计算作为新的子文档附加在“monthlyPremium”数组中。
请参阅以下 GitHub 存储库,以创建数据处理管道:
第 4 步: 设置计算保费触发器。
步骤 5: 设置 Databricks 连接。
步骤 6: 将机器学习模型的预测结果写入MongoDB。
图4。使用机器学习模型自动化计算
使用的技术和产品
MongoDB 开发者数据平台
合作伙伴技术
主要考虑因素(Key Considerations)
利用聚合管道处理 cron 表达式:请参考 GitHub 存储库中的步骤 2 或 3。
使用 MongoDB Atlas 数据提供机器学习模型:请参阅 GitHub 存储库中的第 4 步骤。
将机器学习模型预测写入Atlas数据库:请参阅 GitHub 存储库中的步骤。
可视化持续变化的模型结果的近实时见解:请参阅 GitHub 存储库中的奖励步骤。
作者
Jeff Needham,MongoDB
Ainhoa Múgica, MongoDB
Luca Napoli,MongoDB
Karolina Ruiz Rogelj, MongoDB