Casos de uso: Gen AI, Análisis
Industrias: Seguros, Servicios Financieros, Salud
Productos y herramientas: Series temporales, gráficos Atlas de MongoDB, conector MongoDB para Spark, base de datos Atlasde MongoDB, vistas materializadas deMongoDB, canalizaciones de agregación
Asociados: Databricks
Resumen de la solución
Esta solución demuestra cómo usar MongoDB, aprendizaje automático y procesamiento de datos en tiempo real para automatizar el proceso de suscripción digital de vehículos conectados. Puede usar esta solución para ofrecer a los clientes primas personalizadas basadas en el uso, que tengan en cuenta sus hábitos y comportamientos.
Para ello, deberá recopilar datos, enviarlos a una plataforma de aprendizaje automático para su análisis y, a continuación, utilizar los resultados para crear primas personalizadas para sus clientes. También visualizará los datos para identificar tendencias y obtener información. Este enfoque único y personalizado brindará a sus clientes un mayor control sobre los costes de sus seguros y le ayudará a ofrecer precios más precisos y justos.
El repositorio de GitHub Contiene instrucciones detalladas, paso a paso, sobre cómo cargar los datos de muestra y crear la canalización de transformación en MongoDB Atlas, así como también cómo generar, enviar y procesar eventos hacia y desde Databricks.
Al finalizar esta demostración, creará una visualización de datos con Atlas Charts que rastrea los cambios automatizados en las primas de seguros casi en tiempo real.
Puede aplicar los conceptos de esta solución a otras industrias, entre ellas:
Servicios financieros: Los bancos y las instituciones financieras deben poder interpretar las transacciones financieras con marca de tiempo para fines comerciales, de detección de fraudes y más.
Venta minorista: los minoristas necesitan información en tiempo real sobre los datos actuales del mercado.
Atención sanitaria: desde los modos de transporte hasta los propios paquetes, los sensores IoT permiten la optimización de la cadena de suministro tanto en tránsito como en el sitio.
Arquitecturas de Referencia
El diagrama a continuación describe la arquitectura de la siguiente manera:
Figura 1. Arquitectura de referencia con MongoDB
Primero, cargue un conjunto de datos que incluya la distancia total recorrida en coche en MongoDB y ejecute una tarea cron diaria a medianoche para resumir los viajes diarios. Luego, compile los viajes diarios en un documento almacenado en una nueva colección llamada customerTripDailyEjecute una tarea cron mensual el día 25de cada mes, agregando los documentos diarios y creando una nueva colección llamada customerTripMonthly. Cada vez que se crea un nuevo resumen mensual, una función de Atlas publica la distancia total del mes y la prima de referencia en Databricks para la predicción de aprendizaje automático. La predicción de aprendizaje automático se envía de vuelta a MongoDB y se añade a customerTripMonthly. Como paso final, visualice todos sus datos con MongoDB Charts.
Enfoque del modelo de datos
Para este caso de uso, un modelo de datos básico cubre a los clientes, los viajes que realizan, las pólizas que compran y los vehículos asegurados por esas pólizas.
Este ejemplo crea tres colecciones de MongoDB y dos vistas materializadas. Puede encontrar el modelo de datos completo para definir objetos de MongoDB en el repositorio de GitHub.

Figura 2. Enfoque del modelo de datos de MongoDB
Construir la solución
Para replicar esta solución, consulta su repositorio de GitHub. Sigue la instrucción del repositorio,README que explica los siguientes pasos con más detalle.
Crea una pipeline de procesamiento de datos con una vista materializada
El componente de canalización de procesamiento de datos consta de datos de muestra, una vista materializada diaria y una vista materializada mensual. Un conjunto de datos de muestra de telemetría de vehículos IoT representa los viajes en vehículos motorizados realizados por los clientes. Se carga en la customerTripRaw colección. El conjunto de datos se puede encontrar en GitHub y se puede cargar mediante mongoimport u otros métodos. Para crear una vista materializada, un disparador programado ejecuta una función que ejecuta una canalización de agregación. Esto genera un resumen diario de los datos IoT sin procesar y lo coloca en una colección de vistas customerTripDaily materializadas. De forma similar, para una vista materializada mensual, un disparador programado ejecuta una función que ejecuta una canalización de agregación que resume la información de la customerTripDaily colección mensualmente y la coloca en una colección de vistas customerTripMonthly materializadas.
Consulte los siguientes repositorios de Github para crear la canalización de procesamiento de datos:
Paso 1: Cargue los datos de muestra.
Paso 2: Configura una tarea cron diaria.
Figura 3. Crear una pipeline de procesamiento de datos
Automatice los cálculos de primas de seguros con un modelo de aprendizaje automático
El componente de procesamiento de decisiones consta de un disparador programado que recopila los datos necesarios y envía la carga útil a un punto final de la API de Databricks ML Flow. Este modelo se entrenó previamente con el conector Spark de MongoDB en Databricks. A continuación, espera a que el modelo responda con una prima calculada según los kilómetros mensuales recorridos por un cliente determinado. A continuación, el disparador programado actualiza la colección customerPolicy para añadir un nuevo cálculo de la prima mensual como un nuevo subdocumento dentro de la matriz monthlyPremium.
Consulte los siguientes repositorios de Github para crear la canalización de procesamiento de datos:
Figura 4. Automatización de cálculos con un modelo de aprendizaje automático.
Visualice cambios casi en tiempo real en las primas de seguros a lo largo del tiempo
Una vez agregadas las primas mensuales, puede configurar gráficos Atlas para visualizar las primas calculadas según el uso. Configure diferentes gráficos para ver cómo han evolucionado las primas con el tiempo y descubrir patrones interesantes.
Aprendizajes clave
Aprenda a construir Vista materializada de datos de series temporales: consulte los pasos 1-3 en el repositorio de GitHub.
Aproveche las canalizaciones de agregación para expresiones cron: consulte los pasos 2 o 3 en el repositorio de GitHub.
Sirve modelos de aprendizaje automático con los datos de MongoDB Atlas: consulta el paso 4 en el repositorio de GitHub.
Escriba una predicción de un modelo de aprendizaje automático 5 6 en una base de datos Atlas: consulte los pasos y en el repositorio de GitHub.
Visualice información casi en tiempo real de los resultados del modelo en constante cambio: consulte el paso adicional en el repositorio de GitHub.
Autores
Jeff Needham, MongoDB
Ainhoa Múgica, MongoDB
Luca Napoli, MongoDB
Karolina Ruiz Rogelj, MongoDB