Saiba como a IA generativa pode gerar avaliações de risco detalhadas e como os recursos multimodais do MongoDB possibilitam uma análise de risco de empréstimo abrangente e multidimensional.
Casos de uso: Gen AI, Empréstimos e locação
Setores: serviços financeiros
Produtos e ferramentas: Atlas, Dados geoespaciais
Parceiros: APIs do Google Maps, Fireworks.ai
Visão Geral da Solução
Os empréstimos empresariais são um pilar das operações bancárias e oferecem benefícios importantes tanto para instituições financeiras quanto para economias mais amplas. Por exemplo, em 2023, o valor dos empréstimos comerciais e industriais nos Estados Unidos atingiu quase US$2,8 trilhões. No entanto, esses empréstimos podem apresentar desafios e riscos únicos — e os bancos devem enfrentá-los. Os bancos não só lidam com o risco de crédito, em que o tomador do empréstimo pode inadimplir, mas também com o risco comercial, em que recessões econômicas ou quedas específicas do setor podem impactar a capacidade dos tomadores de quitar empréstimos. Esta solução explora o potencial da IA generativa (gen AI) para facilitar avaliações detalhadas de risco em empréstimos empresariais, bem como a maneira que os recursos multimodais do MongoDB podem ser utilizados para realizar análises de risco abrangentes e multidimensionais.
O código que demonstra todos os recursos do MongoDB utilizados para construir esta solução está disponível no seguinte repositório do GitHub.
O plano de negócios crítico
Um plano de negócios é essencial para obter um empréstimo empresarial, pois serve como um roteiro abrangente que detalha os planos, as estratégias e as projeções financeiras do tomador. Essas informações ajudam os credores a avaliar os objetivos, a viabilidade e a lucratividade do negócio, demonstrando como o empréstimo será utilizado para crescimento e quitação. Um plano de negócios detalhado inclui análise de mercado, posicionamento competitivo, planos operacionais e previsões financeiras, que são argumentos fortes para convencer o credor a investir e demonstram a capacidade da empresa de gerenciar riscos de forma eficaz, aumentando a probabilidade de obter o empréstimo.
Para agentes de crédito, ler minuciosamente as informações do tomador e um plano de negócios detalhado (aproximadamente 15 a 20 páginas) é um grande desafio: o tempo é curto, o material é complexo e é difícil extrair as principais métricas de projeções financeiras detalhadas, análises de mercado e fatores de risco. Lidar com detalhes técnicos e terminologia específica do setor pode ser desafiador e exigir conhecimento especializado. Identificar fatores de risco críticos e estratégias de mitigação só aumenta a complexidade, assim como garantir a precisão e a consistência entre os responsáveis pela gestão de dados e os comitês de aprovação.
Para superar esses desafios, a IA generativa pode ajudar os agentes de crédito analisando com eficiência os planos de negócios, extraindo informações essenciais, identificando os principais riscos e fornecendo interpretações consistentes, facilitando assim a tomada de decisões informadas.
Avaliação de empréstimos com AI generativa
Análise interativa de riscos utilizando chatbots com tecnologia de AI Generativa
A figura 1 abaixo mostra um exemplo de como o chatGPT-4o responde quando solicitado para avaliar o risco de um crédito empresarial. Embora a entrada da finalidade do crédito e da descrição do negócio seja simplista, a IA generativa pode oferecer uma análise detalhada.

Figura 1. Exemplo de uma resposta do ChatGPT-4.0 para avaliação de risco de empréstimo empresarial
Alucinações ou Ignorância?
Ao usar AI generativa nas avaliações de risco, credores podem explorar fatores de risco adicionais que a AI generativa pode avaliar. Um fator pode ser o risco de desastres naturais ou riscos climáticos mais abrangentes. Na Figura 2, adicionamos o risco de inundação especificamente como um fator à pergunta anterior para ver o que o ChatGPT-4o retorna.

Figura 2. Exemplo de uma resposta do ChatGPT-4.0 ao risco de inundações como fator
Com base na resposta, o risco de inundação é baixo. Para validar isso, perguntamos ao ChatGPT-4o de uma forma diferente, com foco em seu conhecimento sobre dados de inundação. (Ver Figura 3.) O ChatGPT-4o sugeriu consultar os mapas de inundações produzidos pela Federal Emergency Management Agency (FEMA) e o histórico de inundações locais, indicando que talvez não tivesse as informações mais recentes.

Figura 3. Exemplo de pergunta sobre inundação com localização específica
Na query mostrada, o ChatGPT-4o deu uma resposta oposta e indicou que há uma “inundação significativa”, fornecendo referências a evidências de inundação após fazer uma pesquisa na internet em quatro sites, o que não havia feito anteriormente.
A partir deste exemplo, podemos ver que quando o ChatGPT-4o não tem os dados relevantes, começa a fazer afirmações falsas que podem ser consideradas alucinações. Inicialmente, o ChatGPT-4o indicava um baixo risco de enchente devido à falta de informações. No entanto, quando questionado especificamente sobre o risco de inundação na segunda consulta, sugeriu revisar fontes externas, como os mapas de inundação da FEMA, reconhecendo suas limitações e a necessidade de validação externa.
Os chatbots com tecnologia de GenAI podem reconhecer e buscar fontes de dados adicionais de forma inteligente para preencher suas lacunas de conhecimento. No entanto, uma pesquisa básica na internet não irá fornecer o grau de precisão necessário.
Análise de risco de geração aumentada de recuperação (RAG)
O exemplo anterior promissor demonstra como a IA generativa pode ampliar a experiência dos agentes de crédito para a análise de empréstimos comerciais. No entanto, a interação com um chatbot de IA generativa depende de agentes de crédito que repetidamente solicitam e ampliam o contexto com informações relevantes. Isso pode ser demorado e impraticável devido à falta de habilidades de engenharia de prompt ou à falta de dados necessários.
Abaixo está uma solução simplificada de como a IA generativa pode ser utilizada para aprimorar o processo de análise de risco e preencher a lacuna de conhecimento do LLM. Esta demonstração utiliza o MongoDB como um repositório de dados operacionais, aproveitando consultas geoespaciais para identificar inundações num raio de cinco quilômetros da localização proposta para o negócio. A solicitação para esta análise de risco destaca a análise da avaliação de risco de inundação em vez das projeções financeiras.
Um teste semelhante foi realizado com o Llama 3, hospedado pela nossa parceira do MAAP Fireworks.AI. Foi testado o conhecimento do modelo sobre dados de inundações, revelando uma lacuna de conhecimento semelhante à do ChatGPT-4o. Curiosamente, em vez de fornecer respostas enganosas, o Llama 3 forneceu uma “lista alucinada de dados sobre inundações”, mas destacou que “esses dados são fictícios e apenas para fins de demonstração. Na verdade, você precisaria acessar fontes confiáveis, como os dados sobre inundações da FEMA ou relatórios de outras agências governamentais, para informações precisas.

Figura 4. Resposta do LLM a localizações fictícias de inundação
Tendo em vista essa demonstração consistente da lacuna de conhecimento para áreas especializadas nos LLMs, reforça-se a necessidade de explorar como uma plataforma de dados multimodal com RAG (geração aumentada de recuperação) pode ajudar.
Nesta demonstração simplificada, você seleciona o endereço comercial, o propósito da empresa e a descrição de um plano de negócios. Para facilitar a inserção de informações, um botão "Exemplo" foi adicionado para utilizar a AI generativa e gerar uma amostra de uma breve descrição da empresa, evitando a necessidade de digitar o modelo de descrição do zero.

Figura 5. Entrada do usuário para a demonstração de avaliação de risco de empréstimo
Após o envio, a solução fornecerá uma análise usando RAG com a engenharia de prompt apropriada. Assim, será apresentada uma análise simplificada do negócio, considerando a localização e o risco de inundação previamente baixado de fontes externas que contenham dados acerca de inundações.

Figura 6. Resposta de risco de empréstimo com uma arquitetura RAG
Na seção sobre avaliação de risco de inundação, a análise geoespacial com tecnologia de AI permite que os agentes de crédito descubram rapidamente ocorrências históricas de inundações e identifiquem as fontes de dados.
Você também pode revelar todas as localizações de amostra de inundações nas proximidades da localização da empresa selecionada clicando no ícone de marcador. Os marcadores de geolocalização incluem a localização da inundação, e o círculo azul indica o raio de cinco quilômetros em que os dados de inundação são consultados.

Figura 7. Localizações de inundações exibidas na demonstração
Segue abaixo uma amostra de um código de query geoespacial para ilustrar a facilidade de obter a localização de uma inundação (usando os dados da inundação que contêm geolocalizações carregadas no MongoDB) em torno de uma coordenada. Neste exemplo, o comando $geoNear é usado para buscar todas as localizações "próximas" de um ponto especificado pela longitude e latitude (por exemplo, o local da empresa) e também dentro de uma certa distância (por exemplo, cinco km). A query geoespacial pode ser processada no pipeline de agregação de dados do MongoDB para incluir também outros processamentos de dados, como selecionar qual campo de dados deve ser retornado do conjunto de dados por $project e filtrar com base em certas condições via $match (por exemplo, dados onde o ano é maior que 2016). Esses dados são extraídos do banco de dados de inundações dos Estados Unidos (United States Flood Database), que contém várias fontes, sendo que o conjunto de dados mais recente é de 2020.
pipeline = [ {"$geoNear": {"near": {"type": "Point", "coordinates": [longitude, latitude]}, "distanceField": "DISTANCE", "spherical": True, "maxDistance": radius * 1000}}, {"$project": {"year": 1, "COORD": 1, "DISTANCE": 1}}, {"$match": {"year": {"$gte": 2016}}} ]
Arquiteturas de referência
O diagrama a seguir fornece uma visão geral da arquitetura lógica do processo de dados RAG implementado nesta solução, destacando as diferentes tecnologias usadas, como o MongoDB, o Meta Llama 3 e o Fireworks.AI.

Figura 8. Diagrama da arquitetura de fluxo de dados da RAG
Com as capacidades multimodais do MongoDB, desenvolvedores podem melhorar o processo de RAG utilizando recursos como grafos de rede, séries temporais e pesquisa vetorial. Isso enriquece o contexto para o agente de AI generativa, permitindo que ele forneça uma análise de risco mais abrangente e multidimensional por meio de análises multimodais. O agente de AI generativa pode fornecer informações mais precisas e com conhecimento ao contexto (por exemplo, usar dados geoespaciais para identificar locais de risco de inundação) a fim de reduzir alucinações e oferecer informações detalhadas com o objetivo de aprimorar um processo complexo de avaliação de risco de empréstimo comercial.
Devido à natureza iterativa do processo de RAG, o modelo de AI generativa aprende e melhora continuamente com dados e feedbacks novos, o que resulta em avaliações de risco cada vez mais precisas e menos alucinações. Uma plataforma de dados multimodal permitiria maximizar totalmente as funcionalidades dos modelos de AI multimodais.
Autores
Wei You Pan, diretor global de soluções para o setor financeiro, MongoDB