Saiba como a convergência de dados alternativos, inteligência artificial e IA generativa está reformulando os fundamentos da pontuação de crédito.
Casos de uso: Gen AI
Setores: Serviços financeiros, Seguros
Produtos e ferramentas: Atlas, Spark Streaming Connector, Vector Search
Parceiros: LangChain, Fireworks.ai
Visão Geral da Solução
Nesta solução, você aprenderá como a convergência de dados alternativos, a inteligência artificial e AI generativa estão transformando os fundamentos da pontuação de crédito. Os desafios dos modelos tradicionais estão sendo superados com a adoção de métodos alternativos para pontuação de crédito, o que oferece uma avaliação mais inclusiva e diferenciada da credibilidade. Esta solução é focada em uma amostra para o processo de solicitação de cartão de crédito pela internet e demonstra como o MongoDB pode dar ajudar na avaliação de crédito. Também é possível usar uma abordagem semelhante para outros produtos de crédito, como empréstimos pessoais, hipotecas, empréstimos corporativos e linhas de crédito para financiamento comercial.
Desafios da pontuação de crédito tradicional
Aqui estão alguns dos desafios e limitações dos modelos tradicionais de pontuação de crédito:
Histórico de crédito limitado: muitos indivíduos enfrentam dificuldades devido a um histórico de crédito limitado ou inexistente, o que torna difícil comprovar que podem quitar as dívidas por falta de dados históricos.
Renda inconsistente: a renda irregular, comum em trabalhos de meio período ou autônomos, é um desafio para os modelos tradicionais de pontuação de crédito, que rotulam os indivíduos como de maior risco, levando a recusas de aplicativos ou limites de crédito restritivos.
Uso elevado do crédito existente: ter dependência no crédito existente leva a índices elevados de utilização. Isso é um obstáculo ao solicitar crédito, pois os requerentes podem ter seus pedidos negados ou podem ter seus pedidos concedidos sob condições menos favoráveis.
Falta de clareza nos motivos da rejeição: a falta de transparência nos motivos da rejeição faz com que seja difícil para os clientes abordar a causa principal e comprovar que podem quitar as dívidas para futuras solicitações.
Construir a solução
Na solução a seguir, você aprenderá como o MongoDB pode ajudar a transformar o processo de solicitação de crédito nestes aspectos:
Simplifique a captura e o processamento de dados.
Aprimore a pontuação de crédito com AI.
Explicar o motivo da rejeição para a solicitação de crédito.
Recomende produtos de crédito alternativos.
Simplificar a captura e o processamento de dados
Solicitar crédito pode ser um processo desafiador pelos seguintes motivos:
Complexidade do processo de aplicação: obter um cartão de crédito envolve várias etapas demoradas. Veja um breve resumo do processo:
Escolher um cartão: primeiro, é preciso selecionar um cartão de crédito que atenda às suas necessidades. Isso envolve pesquisar vários cartões, comparar recursos e entender os termos e condições.
Verificação de elegibilidade: em seguida, você deve verificar se atende aos critérios de elegibilidade estabelecidos pelo banco. Esses critérios geralmente consideram fatores como sua classificação de crédito, idade, renda e dívida.
Enviar documentos: será necessário fornecer documentos como prova de identidade (passaporte e/ou carteira de motorista, por exemplo), comprovante de endereço (por exemplo, contrato de aluguel ou contas água, luz e internet) e comprovante de renda (extratos bancários, holerites e informe de rendimentos, por exemplo).
Formulário de solicitação: preencher o formulário de solicitação de cartão de crédito pode ser complicado. É possível fazer isso pela internet no site do banco, pelo internet banking ou em uma agência. Alguns bancos ainda exigem documentos físicos, embora os processos digitais estejam se tornando mais comuns.
Verificação e referências: os bancos verificam a autenticidade dos seus documentos e cruzam as informações fornecidas. Esta etapa também envolve o cálculo da probabilidade de inadimplência usando algoritmos de AI e aprendizado de máquina.
Coleção de informações redundantes: bancos frequentemente coletam dados redundantes, como:
Dados do KYC: mesmo tendo acesso aos seus dados do Know Your Customer (KYC), ainda pedem que você os envie várias vezes.
Verificação de renda: apesar de ter informações como seu salário, histórico bancário, contas de água, luz e internet, pagamentos de aluguel, pagamentos de celular e despesas de compras, o banco pode fazer uma solicitação de provas adicionais para verificar essas informações.
Tornar esse processo mais eficiente ao eliminar solicitações redundantes e utilizar os dados existentes pode melhorar a experiência do usuário.
Esses formulários de solicitação para cartão de crédito podem ser relativamente simples, mas a complexidade aumenta com outros produtos de crédito, como financiamentos para automóveis, hipotecas e operações de capital. Em um formulário de solicitação, pode haver informações tabulares e também hierárquicas que precisam ser preenchidas, incluindo dados alternativos a serem obtidos de fontes de dados de terceiros possivelmente autorizadas pelo solicitante. A plataforma flexível de dados para desenvolvedores do MongoDB oferece suporte nativo a dados JSON e não exige que os documentos tenham o mesmo esquema, melhorando a capacidade de lidar com vários tipos de dados.
Para simplificar o processo de captura de dados e melhorar o desempenho da solicitação, é possível usar JSON no formulário de solicitação de crédito online. O JSON tem uma representação de dados estruturada, permitindo organizar os diferentes detalhes que precisam ser armazenados. O modelo de dados flexíveis se alinha bem com a natureza dinâmica dos requisitos para solicitação de cartão de crédito, permitindo armazenar dados relacionados juntos, mesmo que esses dados não tenham exatamente a mesma estrutura. Em geral, outros desenvolvedores também compreendem o JSON, o que facilita a colaboração e torna os dados fáceis de entender à primeira vista.
O MongoDB é eficaz no processamento de documentos JSON em solicitações de crédito pois oferece suporte nativo ao formato BSON similar ao JSON. A flexibilidade do banco de dados permite ajustes dinâmicos no esquema, o que combina com as mudanças constantes dos formulários de solicitação de crédito. A capacidade do MongoDB de lidar com estruturas de dados hierárquicas, além de robustas funcionalidades de consulta e indexação, garante a eficiência na recuperação e na organização de informações complexas de solicitações de crédito. Por ser uma solução dimensionável, o MongoDB acomoda volumes crescentes de dados de crédito, mantendo o desempenho.
Aprimorar a pontuação de crédito com AI
Utilizando o Atlas — a plataforma de dados para desenvolvedores do MongoDB — é possível criar perfis abrangentes para usuários do banco combinando pontos de dados relevantes.
Veja um diagrama arquitetônico para o pipeline de dados de processamento que prevê a probabilidade de inadimplência e a pontuação de crédito:

Figura 1. Diagrama do pipeline de dados de processamento para pontuação de crédito
O pipeline de dados para pontuação de crédito de um cliente envolve as seguintes etapas:
Coleta de dados: primeiro, o processo coleta dados de várias fontes, como órgãos de proteção ao crédito, open banking, sistemas de detecção de fraudes e outras fontes relevantes.
Processamento de dados: os dados coletados são processados usando ferramentas como o Spark Streaming Connector para criar uma visão unificada do perfil financeiro do cliente e armazenar esses dados em visualização única no MongoDB Atlas.
Geração de perfil de risco: a partir dessa visualização unificada, perfis de risco ou sugestões de produtos são gerados. Isso envolve o uso de métodos estatísticos para realizar análises descritivas e também técnicas de inteligência artificial (AI) ou aprendizado de máquina (ML) para identificar padrões nos dados e realizar pontuação de propensão ao risco.
Desenvolvimento de modelos: diversos algoritmos de aprendizado de máquina podem ser utilizados para pontuação de crédito e tomada de decisões. Algumas opções: regressão logística, árvores de decisão, máquinas de vetores de suporte e redes neurais.
Neste tutorial, vamos empregar o modelo XGBoost (Extreme Gradient Boosted Trees), um algoritmo de aprendizado de máquina muito utilizado devido ao seu desempenho preditivo. O algoritmo é um método de aprendizado supervisionado baseado em aproximação de função. Esse algoritmo tem as seguintes funcionalidades:
Otimizar funções de perda específicas.
Aplicar várias técnicas de regularização.
Lide com dados de alta dimensão.
Capturar padrões complexos para classificação e regressão.
O modelo justifica seu resultado de inferência, o que ajuda a explicar o resultado deste modelo preditivo.
Transformação de dados: antes de realizar a pontuação do perfil de risco, os dados brutos do usuário são transformados usando o Spark (ou um framework de análise gerenciado semelhante). Os dados são agrupados de várias fontes para criar uma visão única e materializada dos dados. Essa visão pode ser derivada diretamente da coleção do MongoDB Atlas para ser usada no desenvolvimento de modelos e em várias tarefas de análise descritiva. Esta etapa também pode envolver a inferência de modelos.
Coleção de decisões: os dados finais transformados são inseridos em uma coleção de decisões. Isso auxilia bancos e instituições financeiras a respaldar decisões financeiras e propósitos de auditoria.
O objetivo é avaliar com precisão a credibilidade de um cliente para tomar decisões informadas acerca de empréstimos e recomendações de produtos financeiros. O pipeline é uma demonstração dos atuais pipelines de avaliação de risco encontrados nas organizações.
Explicar a rejeição da solicitação de crédito
Compreender os motivos para a rejeição da solicitação de crédito é uma parte essencial do processo. Descubra como o MongoDB e os grandes modelos de linguagem (LLMs) podem explicar as previsões do modelo XGBoost (o modelo utilizado neste tutorial).
Aqui está o diagrama de arquitetura que explica a pontuação de crédito usando um LLM:

Figura 2. Diagrama de arquitetura de pontuação de crédito usando um LLM
O pipeline de aprendizado de máquina utilizado para o perfil de risco fornece uma pontuação de probabilidade que define o risco associado ao perfil para recomendação de produtos. Essa mensagem é comunicada de volta ao usuário de forma padronizada, em que apenas o status final da solicitação é comunicado ao usuário final. Na arquitetura proposta com LLMs, é possível usar a engenharia de prompts para explicar a razão do status final do produto aprovado, com justificativas válidas apresentadas ao cliente final.
Aqui, você pode encontrar o código e as respostas de exemplo. O código para gerar uma mensagem semelhante pode ser feito em Python em um notebook Jupyter. Os detalhes sobre a configuração do MongoDB Atlas e a obtenção de uma string de conexão estão disponíveis neste link.
Veja um exemplo de explicação para uma rejeição:

Figura 3. Exemplo de explicação de recusa
Esta mensagem endereçada ao cliente é uma forma de AI explicável, em que os recursos utilizados no modelo para determinar o perfil de risco são classificados e usados como parte do prompt personalizado para o LLM. Isso pode ajudar a gerar motivos mais detalhados para o cliente final explicar seu perfil de usuário, conforme mostrado acima. Os LLMs também podem ajudar a resumir a lista de motivos detalhados para oferecer uma visão simplificada da descrição. A solução pode permitir que o cliente se aprofunde nos detalhes caso deseje aprimorar seu perfil de crédito e a experiência do usuário.
Nesta demonstração, são utilizadas duas abordagens para avaliar a solicitação de crédito. O status da solicitação de crédito é determinado usando uma abordagem de aprendizado de máquina, conforme descrito na seção anterior, com o uso de mais de 20 recursos relacionados ao crédito. Veja um subconjunto das 15 funcionalidades mais importantes:

Figura 4. Gráfico de importância de recurso
Para obter mais detalhes sobre os recursos usados nesta demonstração, consulte o código-fonte fornecido no repositório de crédito do GitHub.
Para demonstrar a diferença entre a abordagem de aprendizado de máquina e a abordagem tradicional de pontuação de crédito, pense em como um método tradicional de pontuação de crédito pode avaliar a mesma solicitação de crédito, mas geralmente usando apenas alguns aspectos. Nesta demonstração, utilizamos vários recursos comumente empregados pelos principais provedores de pontuação de crédito:
O histórico de quitação de dívidas do solicitante de crédito
Utilização de crédito
Histórico de crédito
Solicitações e número de consultas de crédito
Recomende produtos de crédito alternativos
A instituição de crédito deve sempre tentar realizar vendas adicionais para o cliente com um produto relevante que atenda às suas necessidades, pois o cliente já está envolvido no processo e no aplicativo.
As instituições financeiras podem implementar um sistema de recomendação de produtos que ofereça uma explicação amigável sobre o raciocínio por trás da nova recomendação, o que abriria novas oportunidades de receita que os sistemas legados atuais não oferecem. Esses raciocínios podem criar um relacionamento mais personalizado com os clientes e aumentar ainda mais a aceitação do produto recomendado. Segue um exemplo de uma arquitetura de dados usada para isso:

Figura 5. Arquitetura de sistema de recomendação
O Atlas Vector Search é um recurso que permite realizar pesquisas semânticas e usar AI generativa em quaisquer tipos de dados. Ele integra banco de dados operacional e pesquisa vetorial em uma única plataforma unificada e totalmente gerenciada com uma interface nativa do MongoDB. É possível criar embeddings vetoriais com modelos de aprendizado de máquina e, em seguida, armazená-las e indexá-las no MongoDB Atlas para geração aumentada de recuperação (RAG), pesquisa semântica, mecanismos de recomendação, personalização dinâmica e outros casos de uso.
RAG é um paradigma que utiliza a pesquisa vetorial para recuperar documentos relevantes com base na query de entrada. Em seguida, fornece esses documentos recuperados como contexto para os LLMs a fim de ajudar a gerar uma resposta mais informada e precisa.
O tutorial acima cita as tecnologias que podem ser utilizadas para solucionar um caso de uso referente a um sistema de recomendação de produto (no caso, um cartão de crédito). As etapas deste processo são:
Carregar dados pessoais: cada produto de cartão de crédito tem diferentes ofertas. Esses produtos mudam ocasionalmente, assim como as taxas cobradas por vários benefícios de estilo de vida, como ingressos de cinema e serviços de concierge. Armazenar dados de produtos no MongoDB como repositório de dados operacional (ODS) ajuda a manter as alterações e constrói índices vetoriais ao mesmo tempo.
Os grandes pontos de dados podem ser atualizados, excluídos, inseridos ou substituídos conforme necessário.
As descrições dos produtos de cartão de crédito são muito extensas, portanto, dividi-las em partes menores ajuda a recuperar as informações relevantes de maneira adequada.
Você pode utilizar LLMs para encurtar a descrição do produto em resumos que contenham todas as características e custos salientes desse produto. Essa alteração permite que você recupere e recomende produtos relevantes rapidamente.
Recomendações impulsionadas por LLM: neste caso de uso, o LLM é utilizado como um sistema de recomendação onde o perfil do usuário gerado na etapa anterior pode ser usado como entrada para gerar sub-queries que podem ser usadas para fazer pesquisa de similaridade semântica em relação aos vetores de produtos armazenados no MongoDB Atlas.
Recomendação de produto com mensagens personalizadas: os produtos recomendados podem ser utilizados em um prompt personalizado para o LLM a fim de gerar resumos com recomendações de produtos relevantes para o usuário final.
Isso ajuda a instituição financeira a personalizar as recomendações e oferecer sugestões relevantes ao cliente final, o que aumenta as taxas de conversão.
A recomendação de produtos aumenta o engajamento do cliente e aprimora a experiência do usuário, melhorando a pontuação do índice de "probabilidade de recomendar" nos produtos oferecidos.
Aqui, você encontra o código e exemplos de recomendações de produtos alternativos. Veja alguns exemplos. O código para gerar uma recomendação de produto e personalizar a descrição da recomendação do produto pode ser executado com Python em um notebook Jupyter.

Figura 6. Exemplo de aplicativo aprovado
Resumidamente, a pontuação de crédito está passando por uma fase transformadora com a integração da AI generativa. À medida que exploramos a dinâmica dos modelos tradicionais, os desafios enfrentados por mutuários e o futuro previsto com a AI generativa, torna-se evidente que a transparência, a eficiência e a personalização estão na vanguarda do cenário em evolução da pontuação de crédito. A sinergia entre tecnologia e finanças está moldando um futuro em que as decisões de crédito são precisas e também servem como maneira de inspirar os tomadores de empréstimo.
O código para demonstrar todos os recursos do MongoDB para construir uma solução desse tipo está disponível neste repositório do GitHub. Nós desenvolvemos e implantamos o aplicativo no Fireworks.AI, um parceiro fundamental do MongoDB quando se trata de IA, para deixar a inovação com IA generativa mais rápida, eficiente e segura.
Principais Aprendizados
Os recursos funcionais e não funcionais da solução proposta incluem:
Compreender as funcionalidades da GenAI: sintetizar diversos conjuntos de dados para enfrentar as principais limitações dos modelos tradicionais de pontuação de crédito.
Status de crédito explicável: por meio de LLMs, a engenharia de prompts pode ser utilizada de forma eficaz para explicar o motivo do status de crédito, com razões válidas comunicadas ao cliente final.
Desafios dos modelos tradicionais de classificação de crédito: reconhecer a necessidade de modelos alternativos de classificação de crédito que possam se adaptar às mudanças nos comportamentos financeiros, lidar com fontes de dados não tradicionais e fornecer uma avaliação mais inclusiva e precisa da capacidade de crédito.
Dados alternativos: entender as vantagens dos dados alternativos para possibilitar uma pontuação de crédito mais precisa. Este modelo de pontuação de crédito, por exemplo, pode ser ainda mais aprimorado com pontos de dados alternativos, como contas de luz, água e internet, contas de celular e histórico educacional.
Lidar com alucinações: atenuar o risco de alucinações utilizando RAG para fundamentar as respostas do modelo em informações factuais de fontes atuais, garantindo que as respostas do modelo reflitam as informações mais atuais e precisas disponíveis.
Autores
Ashwin Gangadhar, soluções para parceiros, MongoDB
Wei You Pan, soluções para indústrias, MongoDB
Julian Boronat, Soluções para o Setor, MongoDB