Automatiza la suscripción digital con aprendizaje automático

Industrias: Seguros, Servicios Financieros, Salud

Productos y herramientas: Serie de tiempo, MongoDB Atlas Charts, MongoDB Connector for Spark, Base de datos MongoDB Atlas, Vistas materializadas de MongoDB, Pipelines de agregación

emparejar: Databricks

Descripción general de la solución

Esta solución demuestra cómo utilizar MongoDB, aprendizaje automático y procesamiento de datos en tiempo real para automatizar el proceso de suscripción digital para autos conectados. Puedes usar esta solución para ofrecer a los clientes primas personalizadas basadas en el uso, teniendo en cuenta sus hábitos y comportamientos.

Para hacer esto, deberá recopilar datos, enviarlos a una plataforma de aprendizaje automático para su análisis y luego utilizar los resultados para crear primas personalizadas para sus clientes. También visualizarás los datos para identificar tendencias y obtener perspectivas. Este enfoque único y personalizado brindará a tus clientes un mayor control sobre los costos de seguro y te ayudará a ofrecer precios más precisos y justos.

El repositorio de GitHub contiene instrucciones detalladas, paso a paso, sobre cómo cargar los datos de muestra y construir el pipeline de transformación en MongoDB Atlas, así como sobre cómo generar, enviar y procesar eventos hacia y desde Databricks.

Al final de esta demostración, crearás una visualización de datos con Atlas Charts que rastrea los cambios automáticos en las primas de seguros casi en tiempo real.

Puede aplicar los conceptos de esta solución a otras industrias, incluyendo:

Servicios financieros: los bancos y las instituciones financieras deben ser capaces de interpretar las transacciones financieras con sello de tiempo para el comercio, la detección de fraudes y más.
Venta minorista: Los minoristas requieren perspectivas en tiempo real sobre los datos actuales del mercado.
Atención sanitaria: desde los modos de transporte hasta los propios paquetes, los sensores IoT permiten la optimización de la cadena de suministro tanto en tránsito como en el sitio.

Arquitecturas de Referencia

El siguiente diagrama describe la arquitectura de la siguiente manera:

Una ilustración muestra una arquitectura de referencia

Figura 1. Arquitectura de referencia con MongoDB

Primero, carga un dataset que incluya la distancia total recorrida en viajes en automóvil en MongoDB y ejecuta una tarea cron diaria todos los días a medianoche para resumir los viajes diarios. Luego, compila los viajes diarios en un documento almacenado en una nueva colección llamada customerTripDaily. Ejecuta una tarea cron mensual el día 25de cada mes, agregando los documentos diarios y creando una nueva colección llamada customerTripMonthly. Cada vez que se crea un nuevo resumen mensual, una Atlas function publica la distancia total del mes y la prima base en Databricks para la predicción de aprendizaje automático. Luego, la predicción de aprendizaje automático se envía de vuelta a MongoDB y se agrega a customerTripMonthly. Como paso final, visualiza todos tus datos con MongoDB Charts.

Enfoque de modelo de datos

Para este caso de uso, un modelo de datos básico cubre a los clientes, los viajes que realizan, las pólizas que compran y los vehículos asegurados por esas pólizas.

Este ejemplo crea tres colecciones de MongoDB y dos vistas materializadas. Puedes encontrar el modelo de datos completo para definir objetos de MongoDB en el repositorio de GitHub.

Una ilustración muestra el enfoque del modelo de datos de MongoDB

Figura 2. Enfoque del modelo de datos de MongoDB

Compilar la solución

Para replicar esta solución, revisa su repositorio de GitHub. Sigue el README del repositorio, que cubre los siguientes pasos con más detalle.

Crea una pipeline de procesamiento de datos con una vista materializada

El componente del pipeline de procesamiento de datos consiste en datos de muestra, una vista materializada diaria y una vista materializada mensual. Un conjunto de datos de muestra de datos de telemetría de vehículos IoT representa los recorridos en vehículos motorizados realizados por los clientes. Se carga en la colección denominada customerTripRaw. El conjunto de datos se puede encontrar en GitHub y puede cargarse a través de mongoimport u otros métodos. Para crear una vista materializada, un activador programado ejecuta una función que ejecutar un pipeline de agregación. Esto luego genera un resumen diario de los datos IoT sin procesar y lo coloca en una colección de vista materializada llamada customerTripDaily. De manera similar, para una vista materializada mensual, un activador programado ejecuta una función que ejecuta una pipeline de agregación que resume la información en la colección customerTripDaily mensualmente y lo coloca en una colección de vistas materializadas llamada customerTripMonthly.

Consulta los siguientes repositorios de Github para crear el pipeline de procesamiento de datos:

Paso 1: Cargue los datos de muestra.
Paso 2: Configura una tarea cron diaria.
Paso 3: Configura una tarea cron mensual.

Una ilustración muestra cómo crear una pipeline de procesamiento de datos

Figura 3. Crear una pipeline de procesamiento de datos

haga clic para ampliar

Automatiza los cálculos de primas de seguros con un modelo de aprendizaje automático

El componente de procesamiento de decisiones consiste en un activador programado que recolecta los datos necesarios y envía el payload a un endpoint de la API de Databricks ML Flow. Este modelo fue previamente entrenado utilizando el MongoDB Spark Connector en Databricks. Luego espera que el modelo responda con una prima calculada en función de las millas mensuales recorridas por un cliente determinado. A continuación, el trigger programado actualiza la colección customerPolicy para añadir un nuevo cálculo de prima mensual como un nuevo subdocumento dentro del arreglo monthlyPremium.

Consulta los siguientes repositorios de Github para crear el pipeline de procesamiento de datos:

Paso 4: Configura un activador de cálculo de prima.
Paso 5: Configura la conexión de Databricks.
Paso 6: Escribe la predicción del modelo de aprendizaje automático en MongoDB.

Automatizar los cálculos con modelos de aprendizaje automático

Figura 4. Automatización de cálculos con modelo de aprendizaje automático

haga clic para ampliar

Visualiza cambios en las primas de seguros casi en tiempo real a lo largo del tiempo

Después de que se haya agregado la prima mensual, puedes configurar Atlas Charts para visualizar tus primas calculadas basadas en el uso. Configura diferentes gráficas para ver cómo han cambiado las primas a lo largo del tiempo y así descubrir patrones interesantes.

Lecciones clave

Aprende cómo compilar vista materializada sobre datos de series de tiempo: Consulta los pasos 1-3 en el repositorio de GitHub.
Aprovecha los pipelines de agregación para expresiones cron: consulta los pasos 2 o 3 en el Repositorio de GitHub.
Sirve modelos de aprendizaje automático con los datos de MongoDB Atlas: consulta el paso 4 en el repositorio de GitHub.
Guarde una predicción de modelo de aprendizaje automático en una base de datos Atlas: consulte los pasos 5 y 6 en el repositorio de Github.
Visualiza perspectivas sobre resultados de modelos en evolución continua casi en tiempo real: remítete al paso Bonus en el repositorio de Github.

Autores

Jeff Needham, MongoDB
Ainhoa Múgica, MongoDB
Luca Napoli, MongoDB
Karolina Ruiz Rogelj, MongoDB

Obtén más información

Volver

Inteligencia para centros de llamadas impulsado por IA

Procesamiento de reclamaciones de Agentic