Automatizar la suscripción digital con aprendizaje automático

Industrias: Seguros, Servicios Financieros, Salud

Productos y herramientas: Series temporales, gráficos Atlas de MongoDB, conector MongoDB para Spark, base de datos Atlas de MongoDB, vistas materializadas de MongoDB, canalizaciones de agregación

Asociados: Databricks

Resumen de la solución

Esta solución demuestra cómo usar MongoDB, aprendizaje automático y procesamiento de datos en tiempo real para automatizar el proceso de suscripción digital de vehículos conectados. Puede usar esta solución para ofrecer a los clientes primas personalizadas basadas en el uso, que tengan en cuenta sus hábitos y comportamientos.

Para ello, deberá recopilar datos, enviarlos a una plataforma de aprendizaje automático para su análisis y, a continuación, utilizar los resultados para crear primas personalizadas para sus clientes. También visualizará los datos para identificar tendencias y obtener información. Este enfoque único y personalizado brindará a sus clientes un mayor control sobre los costes de sus seguros y le ayudará a ofrecer precios más precisos y justos.

El repositorio de GitHub Contiene instrucciones detalladas, paso a paso, sobre cómo cargar los datos de muestra y crear la canalización de transformación en MongoDB Atlas, así como también cómo generar, enviar y procesar eventos hacia y desde Databricks.

Al finalizar esta demostración, creará una visualización de datos con Atlas Charts que rastrea los cambios automatizados en las primas de seguros casi en tiempo real.

Puede aplicar los conceptos de esta solución a otras industrias, entre ellas:

Servicios financieros: Los bancos y las instituciones financieras deben poder interpretar las transacciones financieras con marca de tiempo para fines comerciales, de detección de fraudes y más.
Venta minorista: los minoristas necesitan información en tiempo real sobre los datos actuales del mercado.
Atención sanitaria: desde los modos de transporte hasta los propios paquetes, los sensores IoT permiten la optimización de la cadena de suministro tanto en tránsito como en el sitio.

Arquitecturas de Referencia

El diagrama a continuación describe la arquitectura de la siguiente manera:

Una ilustración muestra una arquitectura de referencia.

Figura 1. Arquitectura de referencia con MongoDB

Primero, cargue un conjunto de datos que incluya la distancia total recorrida en coche en MongoDB y ejecute una tarea cron diaria a medianoche para resumir los viajes diarios. Luego, compile los viajes diarios en un documento almacenado en una nueva colección llamada customerTripDailyEjecute una tarea cron mensual el día 25de cada mes, agregando los documentos diarios y creando una nueva colección llamada customerTripMonthly. Cada vez que se crea un nuevo resumen mensual, una función de Atlas publica la distancia total del mes y la prima de referencia en Databricks para la predicción de aprendizaje automático. La predicción de aprendizaje automático se envía de vuelta a MongoDB y se añade a customerTripMonthly. Como paso final, visualice todos sus datos con MongoDB Charts.

Enfoque del modelo de datos

Para este caso de uso, un modelo de datos básico cubre a los clientes, los viajes que realizan, las pólizas que compran y los vehículos asegurados por esas pólizas.

Este ejemplo crea tres colecciones de MongoDB y dos vistas materializadas. Puede encontrar el modelo de datos completo para definir objetos de MongoDB en el repositorio de GitHub.

Una ilustración muestra el enfoque del modelo de datos de MongoDB

Figura 2. Enfoque del modelo de datos de MongoDB

Construir la solución

Para replicar esta solución, consulta su repositorio de GitHub. Sigue la instrucción del repositorio,README que explica los siguientes pasos con más detalle.

Crea una pipeline de procesamiento de datos con una vista materializada

El componente de canalización de procesamiento de datos consta de datos de muestra, una vista materializada diaria y una vista materializada mensual. Un conjunto de datos de muestra de telemetría de vehículos IoT representa los viajes en vehículos motorizados realizados por los clientes. Se carga en la customerTripRaw colección. El conjunto de datos se puede encontrar en GitHub y se puede cargar mediante mongoimport u otros métodos. Para crear una vista materializada, un disparador programado ejecuta una función que ejecuta una canalización de agregación. Esto genera un resumen diario de los datos IoT sin procesar y lo coloca en una colección de vistas customerTripDaily materializadas. De forma similar, para una vista materializada mensual, un disparador programado ejecuta una función que ejecuta una canalización de agregación que resume la información de la customerTripDaily colección mensualmente y la coloca en una colección de vistas customerTripMonthly materializadas.

Consulte los siguientes repositorios de Github para crear la canalización de procesamiento de datos:

Paso 1: Cargue los datos de muestra.
Paso 2: Configura una tarea cron diaria.
Paso 3: Configurar un trabajo cron mensual.

Una ilustración muestra cómo crear una canalización de procesamiento de datos.

haga clic para ampliar

Figura 3. Crear una pipeline de procesamiento de datos

Automatice los cálculos de primas de seguros con un modelo de aprendizaje automático

El componente de procesamiento de decisiones consta de un disparador programado que recopila los datos necesarios y envía la carga útil a un punto final de la API de Databricks ML Flow. Este modelo se entrenó previamente con el conector Spark de MongoDB en Databricks. A continuación, espera a que el modelo responda con una prima calculada según los kilómetros mensuales recorridos por un cliente determinado. A continuación, el disparador programado actualiza la colección customerPolicy para añadir un nuevo cálculo de la prima mensual como un nuevo subdocumento dentro de la matriz monthlyPremium.

Consulte los siguientes repositorios de Github para crear la canalización de procesamiento de datos:

Paso 4: Configurar un disparador de cálculo de prima.
Paso 5: Configurar la conexión Databricks.
Paso 6: Escriba la predicción del modelo de aprendizaje automático en MongoDB.

Automatización de cálculos con modelos de aprendizaje automático

haga clic para ampliar

Figura 4. Automatización de cálculos con un modelo de aprendizaje automático.

Visualice cambios casi en tiempo real en las primas de seguros a lo largo del tiempo

Una vez agregadas las primas mensuales, puede configurar gráficos Atlas para visualizar las primas calculadas según el uso. Configure diferentes gráficos para ver cómo han evolucionado las primas con el tiempo y descubrir patrones interesantes.

Aprendizajes clave

Aprenda a construir Vista materializada de datos de series temporales: consulte los pasos 1-3 en el repositorio de GitHub.
Aproveche las canalizaciones de agregación para expresiones cron: consulte los pasos 2 o 3 en el repositorio de GitHub.
Sirve modelos de aprendizaje automático con los datos de MongoDB Atlas: consulta el paso 4 en el repositorio de GitHub.
Escriba una predicción de un modelo de aprendizaje automático 5 6 en una base de datos Atlas: consulte los pasos y en el repositorio de GitHub.
Visualice información casi en tiempo real de los resultados del modelo en constante cambio: consulte el paso adicional en el repositorio de GitHub.

Autores

Jeff Needham, MongoDB
Ainhoa Múgica, MongoDB
Luca Napoli, MongoDB
Karolina Ruiz Rogelj, MongoDB

Obtén más información

Volver

Inteligencia de centro de llamadas impulsada por IA

Procesamiento de reclamaciones de Agentic