Aprenda cómo la convergencia de datos alternativos, la inteligencia artificial y la IA generativa está transformando la base de la evaluación crediticia.
Casos de uso: Gen AI
Productos y herramientas: MongoDB Atlas, Conector detransmisión Spark, Búsqueda vectorial deMongoDB Atlas
Asociados: LangChain, Fireworks.ai
Resumen de la solución
Esta solución muestra cómo la convergencia de la inteligencia artificial de datos alternativos y la IA generativa transforma los fundamentos de la calificación crediticia. Los métodos alternativos de calificación crediticia ofrecen una evaluación más inclusiva y matizada de la solvencia, y además pueden superar los desafíos de los modelos tradicionales.
Esta solución explica un ejemplo del proceso de solicitud de tarjeta de crédito en línea y muestra cómo MongoDB admite la calificación crediticia. También puede utilizar un enfoque similar para otros productos crediticios, como préstamos personales, hipotecas, préstamos corporativos y líneas de crédito para financiación comercial.
Desafíos de la calificación crediticia tradicional
A continuación se presentan algunos ejemplos de los desafíos y limitaciones de los modelos tradicionales de calificación crediticia:
Historial crediticio limitado: Muchas personas enfrentan obstáculos en forma de historial crediticio limitado o inexistente, lo que dificulta demostrar su solvencia debido a la falta de datos históricos.
Ingresos inconsistentes: los ingresos irregulares, típicos del trabajo a tiempo parcial o independiente, representan un desafío para los modelos tradicionales de calificación crediticia, que etiquetan a las personas como de mayor riesgo, lo que lleva al rechazo de solicitudes o a límites de crédito restrictivos.
Alta utilización del crédito existente: La dependencia del crédito existente, que conduce a índices elevados de utilización del crédito, se convierte en un obstáculo en las solicitudes de crédito, ya que los solicitantes pueden enfrentar el rechazo o la aprobación con términos menos favorables.
Falta de claridad en los motivos de rechazo: la falta de transparencia en los motivos de rechazo dificulta que los clientes aborden la causa raíz y mejoren su solvencia para futuras solicitudes.
Construir la solución
La siguiente solución muestra cómo MongoDB transforma la solicitud de crédito en los siguientes aspectos del proceso:
Simplifique la captura y el procesamiento de datos.
Mejora la puntuación crediticia con IA.
Explique la denegación de la solicitud de crédito.
Recomendar productos crediticios alternativos.
Simplifique la captura y el procesamiento de datos
Solicitar productos de crédito suele ser un proceso complicado por las siguientes razones:
Complejidad del proceso de solicitud: El proceso de solicitud de tarjeta de crédito implica varios pasos que consumen mucho tiempo:
Elige una tarjeta: Primero, selecciona una tarjeta de crédito que se ajuste a tus necesidades. Investiga diferentes tarjetas, compara sus características y comprende sus términos y condiciones.
Verificación de elegibilidad: A continuación, verifique si cumple con los criterios de elegibilidad establecidos por el banco. Estos criterios suelen considerar factores como su calificación crediticia, edad, ingresos y pasivos.
Presentación de documentos: proporcione documentos como comprobante de identidad (como identificación del Seguro Social, pasaporte y/o licencia de conducir), comprobante de domicilio (contrato de alquiler, facturas de servicios públicos) y comprobante de ingresos (extractos bancarios, recibos de sueldo,16 formulario).
Formulario de solicitud: Complete el formulario de solicitud de tarjeta de crédito. Puede hacerlo en línea a través del sitio web del banco, banca en línea o visitando una sucursal. Algunos bancos requieren documentos físicos, aunque los procesos digitales son cada vez más comunes.
Verificación y referencias: Los bancos verifican la autenticidad de sus documentos y contrastan la información proporcionada. Este paso también implica calcular la probabilidad de morosidad mediante algoritmos de IA/ML.
Recopilación de información redundante: los bancos a menudo recopilan datos redundantes, como:
Detalles de KYC: aunque tienen acceso a sus detalles de KYC (Conozca a su cliente), todavía le piden que los envíe repetidamente.
Verificación de ingresos: a pesar de contar con información como tus ingresos, historial bancario, facturas de servicios públicos, pagos de alquiler, pagos móviles y gastos de compras, el banco podría hacer una solicitud de prueba adicional para verificar estos detalles.
Agilizar este proceso eliminando solicitudes redundantes y aprovechando los datos existentes puede mejorar la experiencia del usuario.
Estos formularios de solicitud se vuelven más complejos con otros productos crediticios, como préstamos para automóviles, hipotecas y compraventa de acciones. Dentro de un formulario de solicitud, podría haber información tabular y jerárquica que debe completarse. La plataforma de datos flexible para desarrolladores de MongoDB admite de forma nativa... DatosJSON y no requiere que los documentos tengan el mismo esquema, lo que mejora la capacidad de manejar varios tipos de datos.
Para simplificar el proceso de captura de datos y mejorar el rendimiento de la aplicación, puede usar JSON para el formulario de solicitud de crédito en línea. JSON cuenta con una representación de datos estructurada que le permite organizar los diferentes detalles que necesita almacenar. El modelo de datos flexible se adapta bien a la naturaleza dinámica de los requisitos de las solicitudes de tarjetas de crédito, lo que le permite almacenar datos relacionados juntos, incluso si no tienen exactamente la misma forma. JSON también es generalmente comprendido por otros desarrolladores, lo que facilita la colaboración y facilita la comprensión de los datos a simple vista.
MongoDB procesa bien los documentos JSON en aplicaciones de crédito debido a su soporte nativo para el formato BSON similar a JSON.
Mejore la puntuación crediticia con IA
Aproveche Atlas, la plataforma de datos para desarrolladores de MongoDB, para crear un perfil bancario de usuario completo combinando puntos de datos relevantes.
A continuación se muestra un diagrama arquitectónico del proceso de procesamiento de datos para predecir la probabilidad de morosidad y la calificación crediticia:

Figura 1. Diagrama del flujo de procesamiento de datos para la calificación crediticia.
El proceso de obtención de datos para la calificación crediticia de un cliente implica los siguientes pasos:
Recopilación de datos: En primer lugar, el proceso recopila datos de diversas fuentes, como agencias de crédito, banca abierta, sistemas de detección de fraude y otras fuentes relevantes.
Procesamiento de datos: Los datos recopilados se procesan utilizando herramientas como Spark Streaming Connectors para crear una vista unificada del perfil financiero del cliente y almacenar los mismos datos como una única vista en MongoDB Atlas.
Generación de perfiles de riesgo: Desde esta vista unificada, se generan perfiles de riesgo o sugerencias de productos. Esto implica el uso de métodos estadísticos para realizar análisis descriptivos, así como técnicas de inteligencia artificial (IA) o aprendizaje automático (ML) para identificar patrones en los datos y realizar una puntuación de propensión al riesgo.
Desarrollo de modelos: Diversos algoritmos de aprendizaje automático pueden utilizarse para la calificación crediticia y la toma de decisiones. Considere la regresión logística, los árboles de decisión, las máquinas de vectores de soporte y las redes neuronales.
Este tutorial emplea el modelo XGBoost (Árboles Extremos de Gradiente Potenciado), un algoritmo de aprendizaje automático comúnmente utilizado por su rendimiento predictivo. El algoritmo es un método de aprendizaje supervisado basado en la aproximación de funciones. El algoritmo tiene las siguientes capacidades:
Optimizar funciones de pérdida específicas.
Aplicar varias técnicas de regularización.
Manejar datos de alta dimensión.
Captura patrones complejos para clasificación y regresión.
El modelo respalda su resultado de inferencia, lo que ayuda a explicar el resultado de este modelo predictivo.
Transformación de datos: Antes de realizar la puntuación del perfil de riesgo, los datos sin procesar del usuario se transforman mediante Spark (o un marco de análisis gestionado similar). Los datos se recopilan de múltiples fuentes para crear una vista única y materializada de los datos, que puede derivarse directamente de la colección MongoDB Atlas para su uso en el desarrollo de modelos y en diversas tareas de análisis descriptivo. Este paso también puede implicar la inferencia del modelo.
Recopilación de decisiones: Los datos transformados finales se incorporan a una recopilación de decisiones. Esto ayuda a los bancos e instituciones financieras a respaldar sus decisiones financieras y sus auditorías.
El objetivo es evaluar con precisión la solvencia de un cliente para tomar decisiones crediticias informadas y recomendar productos financieros. El pipeline es una demostración de los pipelines de calificación de riesgo existentes que mantienen las organizaciones.
Explicar la denegación de la solicitud de crédito
Comprender los motivos del rechazo de una solicitud de crédito es fundamental. Aprenda cómo MongoDB y los modelos de lenguaje extenso (LLM) pueden explicar las predicciones del modelo XGBoost (el modelo utilizado en este tutorial).
Aquí está el diagrama arquitectónico que explica la evaluación de crédito utilizando un LLM:

Figura 2. Diagrama de la arquitectura de calificación crediticia utilizando un LLM
El flujo de trabajo de ML para la creación de perfiles de riesgo proporciona una puntuación de probabilidad que define el riesgo asociado al perfil para la recomendación del producto. Este mensaje se comunica al usuario de forma estandarizada, donde solo se le informa del estado final de la aplicación. En la arquitectura propuesta con LLM, se puede utilizar la ingeniería de solicitudes para explicar el motivo del estado final de aprobación del producto, con razones válidas para el cliente final.
Aquí encontrará el código y ejemplos de respuestas. El código para generar un mensaje similar se puede generar usando Python en un Jupyter Notebook. Los detalles sobre cómo configurar MongoDB Atlas y obtener una cadena de conexión están disponibles en este enlace.
A continuación se muestra un ejemplo de una explicación de rechazo:

Figura 3. Ejemplo de explicación de un rechazo.
Este mensaje al cliente es una forma de IA explicable donde las características utilizadas en el modelo para elaborar perfiles de riesgo se clasifican y se utilizan como parte de la solicitud personalizada para el LLM. Esto puede ayudar a generar razones más descriptivas para que el cliente final explique su perfil de usuario, como se muestra arriba. Los LLM también pueden ayudar a resumir la lista de razones descriptivas para ofrecer una visión simplificada de la descripción.
En esta demostración, se utilizan dos enfoques para calificar la solicitud de crédito. El estado de la solicitud se determina mediante un enfoque de aprendizaje automático (ML), como se describió en la sección anterior, con más de 20 características relacionadas con el crédito. A continuación, se presenta un subconjunto de las 15 características más importantes:

Figura 4. Gráfico de importancia de características
Para obtener más detalles sobre las características utilizadas en esta demostración, consulte el código fuente proporcionado en el repositorio de GitHub de puntuación de crédito.
Para demostrar la diferencia entre el aprendizaje automático y el enfoque tradicional de calificación crediticia, considere cómo un método tradicional típico de calificación crediticia puede calificar la misma solicitud de crédito, pero generalmente utilizando solo unas pocas dimensiones. La demostración utiliza varias funciones que suelen utilizar los principales proveedores de calificación crediticia:
El historial de pagos del solicitante de crédito
Utilización del crédito
Historia de crédito
Consultas de crédito pendientes y número
Recomendar productos de crédito alternativos
La entidad crediticia debe intentar siempre realizar ventas cruzadas al cliente con un producto relevante que satisfaga sus necesidades, ya que está involucrado en el proceso y portal de aplicaciones.
Las instituciones financieras pueden implementar un sistema de recomendación de productos que ofrezca una explicación intuitiva de la justificación de la nueva recomendación, lo que generaría nuevas oportunidades de ingresos que los sistemas tradicionales no ofrecen actualmente. Proporcionar la justificación puede crear una relación personalizada con los clientes y aumentar la aceptación del producto recomendado. A continuación, se muestra un ejemplo de una arquitectura de datos utilizada para lograrlo:

Figura 5. Arquitectura del sistema de recomendaciones
Atlas Vector Search es una función que permite realizar búsquedas semánticas e IA generativa sobre cualquier tipo de datos. Integra la base de datos operativa y la búsqueda vectorial en una plataforma unificada y completamente administrada con una interfaz nativa de MongoDB. Permite crear incrustaciones vectoriales con modelos de aprendizaje automático y, posteriormente, almacenarlas e indexarlas en MongoDB Atlas para la generación aumentada por recuperación (RAG), la búsqueda semántica, los motores de recomendación, la personalización dinámica y otros usos.
RAG es un paradigma que utiliza la búsqueda vectorial para recuperar documentos relevantes según la consulta de entrada. Posteriormente, proporciona estos documentos recuperados como contexto a los LLM para ayudar a generar una respuesta más informada y precisa.
El tutorial anterior menciona tecnologías que pueden utilizarse para resolver un caso práctico de recomendación de productos de tarjetas de crédito. Los pasos del proceso se describen a continuación:
Cargardatos privados: Cada tarjeta de crédito ofrece diferentes ofertas. Estos productos cambian ocasionalmente, al igual que las comisiones por diversos beneficios de estilo de vida, como entradas de cine y servicios de conserjería. Almacenar los datos de los productos en MongoDB como almacén de datos operativos (ODS) ayuda a mantener los cambios y, al mismo tiempo, a generar índices vectoriales.
Los puntos de datos grandes se pueden actualizar, eliminar, insertar o reemplazar adecuadamente según las necesidades.
Las descripciones de los productos de tarjetas de crédito son muy largas, por lo que dividirlas en fragmentos más pequeños ayuda a recuperar la información relevante correspondiente.
Puede aprovechar los LLM para abreviar la descripción del producto y convertirla en resúmenes que incluyan todas las características y costos principales. Este cambio le permite recuperar y recomendar rápidamente los productos relevantes.
Recomendaciones impulsadas por LLM: en este caso de uso, LLM se utiliza como un sistema de recomendación donde el perfil de usuario generado en la etapa anterior se puede utilizar como entrada para generar subconsultas que se pueden usar para realizar una similitud semántica con los vectores de productos almacenados en MongoDB Atlas.
Recomendación de productos con mensajes personalizados: los productos recomendados luego se utilizan en un mensaje personalizado para el LLM para generar resúmenes de recomendaciones de productos relevantes para el usuario final.
Esto ayuda a la institución financiera a personalizar la recomendación y ofrecer recomendaciones relevantes al cliente final, lo que genera tasas de conversión más altas.
La recomendación de productos aumenta la participación del cliente y mejora las experiencias de los usuarios al mejorar la puntuación de "Probablemente recomendado" de los productos ofrecidos.
Aquí encontrará el código y ejemplos de recomendaciones de productos alternativas. A continuación, se muestran algunos ejemplos. Puede usar Python en un Jupyter Notebook para crear código que genere una recomendación de producto y personalice su descripción.

Figura 6. Ejemplo de una solicitud aprobada
En conclusión, la evaluación del crédito está experimentando una transformación gracias a la integración de IA generativa. La sinergia entre tecnología y finanzas está forjando un futuro en el que las decisiones de crédito sean tan precisas como oportunas para los prestatarios.
El código que demuestra todas las características de MongoDB para crear dicha solución está disponible en este repositorio deGitHub. Fireworks.AI, socio clave de MongoDB en IA, permite innovar con IA generativa de forma más rápida, eficiente y segura.
Aprendizajes clave
Comprenda las capacidades de GenAI: sintetice diversos conjuntos de datos para abordar las limitaciones clave de los modelos tradicionales de calificación crediticia.
Proporcionar un estado de crédito explicable: utilice ingeniería rápida a través de LLM para explicar el motivo del estado de crédito con razones válidas comunicadas al cliente final.
Desafío de los modelos tradicionales de calificación crediticia: reconocer la necesidad de modelos alternativos de calificación crediticia que puedan adaptarse a los comportamientos financieros cambiantes, manejar fuentes de datos no tradicionales y proporcionar una evaluación más inclusiva y precisa de la solvencia.
Utilice datos alternativos: Comprenda las ventajas de los datos alternativos para una calificación crediticia más precisa. Este modelo de calificación crediticia, por ejemplo, puede mejorarse aún más con datos alternativos como facturas de servicios públicos, facturas de teléfono móvil y historial académico.
Abordarlas alucinaciones: mitigar el riesgo de alucinaciones aprovechando RAG para fundamentar las respuestas del modelo en información fáctica de fuentes actuales, garantizando que las respuestas del modelo reflejen la información más actual y precisa disponible.
Autores
Ashwin Gangadhar, soluciones de socios, MongoDB
Wei You Pan, Soluciones industriales, MongoDB
Julian Boronat, Soluciones de Industria, MongoDB