产品和工具: 时间序列、 MongoDB Atlas Charts、 MongoDB Connector for Spark、 MongoDB Atlas 数据库、 MongoDB 物化视图、 聚合管道
合作伙伴: Databricks
解决方案概述
该解决方案演示了如何使用MongoDB、机器学习和实时数据处理来实现联网汽车数字化核保进程的自动化。您可以使用此解决方案,根据客户数的习惯和行为,为他们提供基于使用量的个性化保费。
为此,您需要收集数据,将其发送到机器学习平台进行分析,然后使用分析结果为客户数创建个性化保费。您还将可视化数据,以识别趋势并获得见解。这种独特的定制方法将使您的客户数更好地控制其保险成本,并帮助您提供更准确、更公平的定价。
GitHub 存储库 包含有关如何在 MongoDB Atlas 中加载示例数据和构建管道的详细分步说明,以及如何生成、发送和处理往返于 Databricks 的事件。
在本演示结束时,您将使用Atlas Charts创建数据可视化,以接近实时地自动追踪保费变化。
您可以将此解决方案的概念应用其他行业,包括:
金融服务:银行及金融机构必须能够解读带时间戳的金融交易,以支持交易决策、欺诈侦测等多种用途。
零售:零售商需要实时见解当前市场数据。
医疗保健:从运输模式到包装本身,IoT 传感器在运输途中和现场均能实现供应链优化。
参考架构
下图描述了该架构:
图 1. 基于 MongoDB 的参考架构
首先,将包括汽车旅程总行驶距离的数据集加载到MongoDB中,并在每天午夜运行每日 Cron作业以总结每日行程。然后,将每日行程编译为文档,存储在名为 customerTripDaily 的新集合中。在每月的 25 日运行每月一次的 cron作业,聚合每日文档并创建名为 customerTripMonthly 的新集合。每次创建新的月度摘要时,Atlas function都会将该月的总距离和基线溢价帖子到Databricks以进行机器学习预测。然后,将 机器学习 预测发送回MongoDB并添加到 customerTripMonthly。最后一步,使用MongoDB Charts可视化所有数据。
数据模型方法
对于此使用案例,基本数据模型涵盖了客户数、他们的行程、他们购买的保单以及这些保单承保的车辆。
此示例构建了三个MongoDB集合和两个物化视图。您可以在GitHub存储库中找到用于定义MongoDB对象的完整数据模型。

图2。MongoDB 数据模型方法
构建解决方案
要复制此解决方案,请检查其 GitHub 存储库。按照存储库的 README 进行操作,其中更详细地介绍了以下步骤。
使用物化视图创建数据处理管道
数据处理管道组件由示例数据、每日物化视图和每月物化视图组成。物联网(IoT)车辆遥测数据的示例数据集代表客户数的机动车行程。它已加载到名为 customerTripRaw 的集合中。数据集可在 GitHub 上找到,并可通过 mongoimport 或其他方法加载。要创建物化视图,定时触发器会执行一个运行聚合管道的函数。然后,生成原始IoT数据的每日摘要,并将其放入名为 customerTripDaily 的物化视图集合中。与每月物化视图类似,定时触发器执行一个运行聚合管道的函数,该管道每月汇总 customerTripDaily集合中的信息,并将其放入名为 customerTripMonthly 的物化视图集合中。
检查以下Github存储库以创建数据处理管道:
第 1 步: 加载示例数据。
步骤 2: 设置每日的 cron 作业。
步骤 3: 设置每月的 cron 作业。
图 3。创建数据处理管道
利用机器学习模型自动计算保费
决策处理组件包含一个定时触发器,用于收集必要的数据并将有效负载帖子到 Databricks 机器学习 Flow API 终结点。此模型之前使用 Databricks 上的 MongoDB Spark Connector 进行过训练。然后,等待模型响应,并根据给定客户数的每月驾驶里程计算出保费。然后,定时触发器会更新 customerPolicy集合,以将新的每月保费计算结果作为新的子文档附加到 monthlyPremium数组中。
检查以下Github存储库以创建数据处理管道:
第 4 步: 设置计算保费触发器。
步骤 5: 设置 Databricks 连接。
步骤 6: 将机器学习模型的预测结果写入MongoDB。
图4。使用机器学习模型自动化计算
关键要点
了解如何构建 时间序列数据的物化视图:请参阅 GitHub 存储库 中的步骤 1-3。
利用 cron 表达式的聚合管道:请参阅2 3GitHub 存储库中的步骤 或 。
使用MongoDB Atlas数据为机器学习模型提供服务:请参阅4 GitHub 存储库中的步骤 。
将机器学习模型预测写入Atlas数据库:请参阅5 6GitHub 存储库中的步骤 和 。
对不断变化的模型结果提供近乎实时的可视化见解:请参阅 GitHub 存储库 中的“奖励”步骤。
作者
Jeff Needham,MongoDB
Ainhoa Múgica, MongoDB
Luca Napoli,MongoDB
Karolina Ruiz Rogelj, MongoDB