대체 데이터, 인공지능, 생성형 인공지능의 융합이 신용 평가의 기초를 어떻게 재편하고 있는지 학습하세요.
사용 사례: Gen AI
제품 및 도구: Atlas, Spark Streaming Connector, Vector Search
파트너: LangChain, Fireworks.ai
솔루션 개요
이 솔루션에서는 대체 데이터, 인공지능,생성형 인공지능의 융합으로 신용 평가 기반을 재구성하는 방법을 알아봅니다. 보다 포괄적이고 미묘한 방식으로 신용도를 평가하는 대안적 신용 평가 방법이 채택되면서 기존 모델의 과제가 극복되고 있습니다. 이 솔루션은 샘플 온라인 신용카드 신청 과정을 안내하며, MongoDB로 신용 평가를 지원하는 방법을 보여줍니다. 개인 대출, 주택 담보 대출, 법인 대출, 무역 금융 신용 한도 등 다른 신용 상품에도 유사한 접근 방식을 적용할 수 있습니다.
기존 신용 평점의 과제
기존 신용 평가 모델의 과제와 한계는 다음과 같습니다.
제한적인 신용 이력: 신용 이력이 없거나 제한적이라 어려움을 겪는 사람들이 많습니다. 과거 데이터가 부족해 신용을 증명하기가 어려운 것입니다.
불규칙한 소득: 파트타임 근무나 프리랜서에서 흔히 볼 수 있는 불규칙한 소득은 기존 신용 평가 모델에 문제를 야기하며, 개인을 고위험군으로 분류하여 신청 거부 또는 제한적인 신용 한도로 이어질 수 있습니다.
기존 신용의 높은 활용도: 기존 신용에 대한 의존도가 높아 신용 활용률이 증가하며, 이로 인해 신용 신청 시 거부되거나 불리한 조건으로 승인될 수 있습니다.
거절 사유의 명확성 부족: 거절 사유의 투명성이 부족할 경우 고객은 근본 원인을 해결하고 향후 신청을 위해 신용도를 개선하는 데 어려움을 겪게 됩니다.
솔루션 빌드
다음 솔루션에서는 MongoDB가 신용 신청 프로세스의 주요 단계에 어떤 영향을 미칠 수 있는지 살펴봅니다.
데이터 수집 및 처리 과정을 간소화합니다.
AI로 신용 평가 체계를 개선하세요.
신용 신청 거부 사유를 설명합니다.
대체 신용 상품을 추천합니다.
데이터 캡처 및 처리 간소화
많은 경우 다음과 같은 이유로 신용 상품 신청 과정에 난관이 발생합니다.
신청 절차의 복잡성: 신용카드를 발급받기 위해서는 번거로운 단계를 여럿 거쳐야 합니다. 다음은 그 절차를 간략하게 요약한 것입니다.
카드 선택: 우선 자신의 상황에 적합한 신용카드를 선택해야 합니다. 여기에는 다양한 카드를 조사하고, 혜택을 비교하며, 약관을 이해하는 과정이 수반됩니다.
자격 확인: 다음, 은행이 설정한 자격 기준을 충족하는지 확인해야 합니다. 이러한 기준은 일반적으로 신용 등급, 연령, 수입, 부채와 같은 요소를 고려합니다.
문서 제출: 신원 증명 문서(예: 주민등록증, 여권, 운전면허증), 주소 증명 문서(예: 임대 계약서, 공과금 청구서), 소득 증명 문서(예: 은행 명세서, 급여 명세서, 양식 16)와 같은 여러 문서를 제출해야 합니다.
신청 양식: 신용카드 신청 양식을 작성하는 과정은 번거로울 수 있습니다. 은행 온라인 웹사이트 또는 인터넷 뱅킹을 활용하거나 지점을 방문하여 작성할 수 있습니다. 디지털 프로세스가 보편화되는 추세지만, 일부 은행은 서면 문서를 요구하기도 합니다.
검증 및 참고자료: 은행은 문서의 진위 여부를 확인하고 제공된 정보를 교차 검증합니다. 이 단계에는 AI/머신 러닝 알고리즘을 사용해 연체 가능성을 계산하는 작업도 포함됩니다.
중복 정보 수집: 은행은 다음과 같은 중복 데이터를 수집하는 경우가 많습니다.
KYC 세부 정보: KYC(Know Your Customer) 정보를 이미 보유하고 있음에도 불구하고 반복적으로 제출을 요구합니다.
소득 확인: 급여, 은행 거래 내역, 공과금 및 임대료 납부 내역, 모바일 결제 내역, 쇼핑 지출 내역과 같은 정보를 보유하고 있더라도, 은행에서는 이러한 세부 사항을 확인하기 위한 추가 증빙 자료를 요청할 수 있습니다.
중복 요청을 제거하고 기존 데이터를 활용하여 이 프로세스를 간소화하면 사용자 경험을 개선할 수 있습니다.
이 신용카드 신청 양식은 비교적 간단할 수 있지만 자동차 대출, 주택담보대출, 주식 거래 등 다른 신용 상품의 경우에는 더 복잡해집니다. 신청 양식에는 표 형식의 정보뿐 아니라 계층적인 정보도 기입해야 하며 여기에 차용인이 승인한 제3자 데이터 소스에서 제공받은 대체 데이터가 포함될 수 있습니다. MongoDB의 유연한 개발자 데이터 플랫폼은 JSON 데이터를 네이티브로 지원하며 문서에 동일한 스키마를 요구하지 않기 때문에 다양한 유형의 데이터를 처리하는 능력이 개선됩니다.
온라인 신용 신청서에 JSON을 사용하면 데이터 캡처 프로세스를 간소화하고 애플리케이션 성능을 향상할 수 있습니다. JSON은 구조화된 데이터 표현 방식을 제공하므로 다양한 세부 정보를 체계적으로 구성하여 저장할 수 있습니다. 유연한 데이터 모델은 신용카드 신청 요건의 동적 특성에 적합하며, 데이터의 성격이 정확히 일치하지 않더라도 관련 데이터를 함께 저장할 수 있습니다. JSON은 많은 개발자들이 이해하고 있으므로 협업이 가능하고, 데이터를 한눈에 손쉽게 파악할 수 있습니다.
MongoDB는 JSON과 유사한 BSON 형식을 네이티브로 지원하기 때문에 신용 신청 과정에서 JSON 문서를 처리하는 데 적합합니다. 데이터베이스의 유연성 덕분에 지속적으로 변화하는 신용 신청 양식의 특성에 맞춰 동적으로 스키마를 조정할 수 있습니다. MongoDB의 계층적 데이터 구조 처리 기능과 강력한 쿼리 및 인덱싱 기능으로 복잡한 신용 신청 정보를 효율적으로 조회하고 정리할 수 있습니다. MongoDB는 확장 가능한 솔루션으로서 증가하는 신용 데이터를 처리하면서도 성능을 유지합니다.
AI를 활용한 신용 평가 개선
MongoDB의 개발자 데이터 플랫폼인 Atlas를 활용하여 관련 데이터 포인트를 결합하여 포괄적인 사용자 뱅킹 프로필을 생성할 수 있습니다.
다음은 연체 가능성과 신용 점수를 예측하기 위한 데이터 처리 파이프라인의 아키텍처 다이어그램입니다.

그림 1. 신용 평가를 위한 데이터 처리 파이프라인 다이어그램
고객 신용 평가를 위한 데이터 파이프라인은 다음 단계로 구성됩니다.
데이터 수집: 우선, 이 단계에서는 신용 정보 기관, 오픈 뱅킹, 사기 탐지 시스템 및 기타 관련 출처의 데이터를 수집합니다.
데이터 처리: Spark Streaming Connector와 같은 도구로 수집한 데이터를 처리하여 고객 재무 프로필에 대해 통합된 뷰를 생성하고, 동일한 데이터를 MongoDB Atlas에 단일 뷰로 저장합니다.
위험 프로필 생성: 이 통합된 뷰에서 위험 프로필이나 제품 제안이 생성됩니다. 여기에는 통계적 방법을 사용하여 설명 분석을 수행하고 인공지능(AI) 또는 머신 러닝(ML) 기술을 사용하여 데이터의 패턴을 식별하여 위험에 대한 성향 점수를 매기는 것이 포함됩니다.
모델 개발: 신용 평가 및 의사결정에 다양한 머신 러닝 알고리즘을 사용할 수 있습니다. 로지스틱 회귀, 의사 결정 트리, 서포트 벡터 머신, 신경망 등을 예시로 고려할 수 있습니다.
이 튜토리얼에서는 예측 성능이 뛰어나 널리 사용되는 머신 러닝 알고리즘 XGBoost(Extreme Gradient Boosted Trees) 모델을 사용합니다. 이 알고리즘은 함수 근사에 기반한 지도 학습 방법으로, 다음과 같은 기능을 갖추고 있습니다.
특정 손실 함수를 최적화합니다.
여러 정규화 기법을 적용합니다.
고차원 데이터를 처리합니다.
복잡한 패턴을 포착하여 분류 및 회귀 작업을 진행합니다.
이 모델은 예측 결과를 뒷받침하는 추론 결과를 제공하여 결과를 설명하는 데 도움을 줍니다.
데이터 변환: 위험 프로필 점수를 매기기 전에 Spark(또는 유사한 managed 분석 프레임워크)를 사용하여 원시 사용자 데이터를 변환합니다. 여러 소스에서 데이터를 수집하여 구체화된 단일 뷰를 생성합니다. 이 뷰는 MongoDB Atlas 컬렉션에서 직접 파생된 것으로, 모델 개발 및 다양한 기술적 분석 작업에 사용할 수 있습니다. 이 단계에 모델 추론이 포함될 수도 있습니다.
의사결정 컬렉션: 최종 변환된 데이터가 의사결정 컬렉션에 입력됩니다. 이는 은행 및 금융 기관이 재무 의사결정 및 감사 업무를 지원하는 데 도움이 됩니다.
고객의 신용도를 정확히 평가하여 정보에 입각한 대출 결정을 내리고 금융 상품을 추천하는 것이 목표입니다. 파이프라인은 조직에서 유지 관리 중인 기존 위험 점수 파이프라인을 나타냅니다.
신용 신청 거절 사유 설명
신용 신청 거절 사유를 이해하는 것은 신청 절차에 반드시 필요한 부분입니다. MongoDB와 대규모 언어 모델(LLM)로 XGBoost 모델 예측(이 튜토리얼에서 사용한 모델)을 설명하는 방법을 알아보세요.
다음은 LLM을 활용한 신용 평가 체계를 설명하는 아키텍처 다이어그램입니다.

그림 2. LLM을 사용한 신용 평가 아키텍처 다이어그램
사용된 위험 프로파일링 머신 러닝 파이프라인은 제품 추천을 위한 프로파일과 관련된 위험을 정의하는 확률 점수를 제공합니다. 이 메시지는 표준화된 방식으로 최종 사용자에게 다시 전달되며, 신청 절차의 최종 상태 정보만 제공됩니다. 제안된 LLM 기반 아키텍처에서는 프롬프트 엔지니어링을 활용하여 최종 고객에게 최종 승인된 상품 상태의 사유를 타당한 이유와 함께 설명할 수 있습니다.
여기에서 코드와 예시 응답을 찾을 수 있습니다. 유사한 메시지를 생성하는 코드는 Python을 사용하여 Jupyter 노트북에서 수행할 수 있습니다. MongoDB Atlas를 설정하고 연결 문자열을 가져오는 방법에 대한 세부 정보는 이 링크에서 확인할 수 있습니다.
아래는 거부 사유 설명의 예시입니다.

그림 3. 거부 사유 설명의 예시
고객에게 전달되는 이 메시지는 설명 가능한 AI의 한 형태로, 위험 프로파일링을 수행하는 모델에서 사용된 특징의 순위를 매겨 LLM에 제공되는 사용자 지정 프롬프트의 일부로 활용합니다. 이는 위에서 설명한 것처럼 최종 고객이 자신의 사용자 프로필을 설명할 수 있도록 보다 구체적인 사유를 생성하는 데 도움이 됩니다. 또한 LLM은 구체적 사유 목록을 요약해 간결한 개요를 제공할 수 있습니다. 애플리케이션은 고객이 신용 프로필과 사용자 경험을 개선하고자 할 경우 세부 정보를 심층적으로 확인할 수 있도록 지원합니다.
이 데모에서는 신용 신청에 대한 평가에 두 가지 접근 방식을 사용합니다. 신용 신청 상태는 이전 섹션에서 설명한 것처럼 20개 이상의 신용 관련 특징을 활용한 머신 러닝 접근 방식을 통해 결정됩니다. 다음은 중요도가 높은 상위 15개 특징 중 일부입니다.

그림 4. 기능 중요도 차트
이 데모에서 사용된 기능의 자세한 내용은 신용 점수 GitHub 리포지토리의 소스 코드를 참조하세요.
머신 러닝과 전통적인 신용 평가 방식의 차이를 보여주기 위해, 전통적인 신용 평가 방식이 동일한 신용 신청서를 평가할 때 소수의 항목만 사용하는 일반적인 경우를 살펴보겠습니다. 이 데모에서는 주요 신용 점수 제공업체에서 일반적으로 사용하는 여러 특징을 활용했습니다.
신청자의 상환 기록
신용 사용률
신용 이력
미결제 금액 및 신용 조회 건수
대체 신용 상품 추천
신용 기관은 이미 프로세스 및 신청 포털에 참여 중인 고객의 요구에 부합하는 관련 상품을 적절하게 교차 판매하는 것이 바람직합니다.
금융 기관은 새로운 추천의 근거를 인간 친화적으로 설명하는 제품 추천 시스템을 구현할 수 있으며, 이는 현재의 레거시 시스템이 제공하지 않는 새로운 수익 기회를 창출할 것입니다. 이유를 설명하는 것은 고객과의 더 개인화된 관계를 구축하는 데 도움이 되며, 추천 제품의 수용도를 더욱 높일 수 있습니다. 다음은 이를 달성하기 위해 사용되는 데이터 아키텍처의 예시입니다.

그림 5. 추천 시스템 아키텍처
Atlas Vector Search는 모든 유형의 데이터에 대해 시맨틱 검색과 생성형 인공지능을 수행할 수 있는 기능으로, MongoDB 네이티브 인터페이스를 기반으로 운영 데이터베이스와 벡터 검색을 하나로 통합된 관리형 플랫폼에서 제공합니다. 머신 러닝 모델로 벡터 임베딩을 생성한 후 MongoDB Atlas에 저장하고 인덱싱하여 검색 증강 생성(RAG), 시맨틱 검색, 추천 엔진, 동적 개인화 등 다양한 사례에 활용할 수 있습니다.
RAG는 입력 쿼리에 기반해 관련 문서를 조회하기 위해 벡터 검색을 사용하는 패러다임입니다. 그런 다음 조회된 문서를 LLM에 컨텍스트로 제공하여 보다 정확하고 정보에 입각한 응답을 생성하는 데 도움을 줍니다.
위 튜토리얼에서는 신용카드 제품 추천 사용 사례의 해결에 사용 가능한 기술을 언급하고 있습니다. 해당 프로세스의 단계는 다음과 같습니다.
개인 데이터 로드: 각 신용카드 상품은 서로 다른 혜택을 제공합니다. 이들 상품은 가끔 변경되며, 영화 티켓이나 컨시어지 서비스와 같은 다양한 라이프스타일 혜택의 수수료도 변경됩니다. 상품 데이터를 MongoDB에 운영 데이터 저장소(ODS) 로 저장하면 변경 사항을 관리하는 동시에 벡터 인덱스를 함께 빌드할 수 있습니다.
대량 데이터 포인트는 필요에 따라 적절히 업데이트, 삭제, 삽입 또는 교체할 수 있습니다.
신용 카드 상품 설명이 매우 길기 때문에, 이를 더 작은 청크로 분할하면 관련 정보를 효율적으로 조회하는 데 도움이 됩니다.
LLM을 활용하여 제품 설명을 모든 주요 제품 기능과 비용을 포함하는 요약으로 간결하게 만들 수 있습니다. 이 변경 사항을 통해 관련 제품을 신속하게 조회하고 추천할 수 있습니다.
LLM 기반 추천: 이 사용 사례에서 LLM은 추천 시스템으로 사용되며, 이전 단계에서 생성된 사용자 프로필을 입력으로 하여 MongoDB Atlas에 저장된 제품 벡터와의 의미적 유사성을 수행하기 위한 서브 쿼리를 생성하는 데 사용됩니다.
개인화된 메시지를 통한 제품 추천: 추천 제품을 LLM의 사용자 지정 프롬프트로 사용하여 최종 사용자를 위한 관련 제품 추천 요약을 생성할 수 있습니다.
이를 통해 금융 기관은 추천을 개인화하고 최종 고객에게 적합한 제안을 제공함으로써 전환율을 높일 수 있습니다.
상품 추천은 고객 참여를 높이고 사용자 경험을 개선하여 제공되는 상품의 '추천 가능성' 점수를 향상시킵니다.
여기에서 대체 제품 추천의 코드와 예제를 찾을 수 있습니다. 다음은 몇 가지 예입니다. 제품 추천을 생성하고 제품 추천 설명을 사용자 지정하는 코드는 Jupyter 노트북에서 Python 사용하여 수행할 수 있습니다.

그림 6. 승인된 애플리케이션 예시
결론적으로, 생성형 인공지능의 통합으로 신용 평가는 혁신적인 변화를 겪고 있습니다. 전통적인 모델의 작동 방식, 차입자가 직면한 과제, 생성형 인공지능과 함께 그려지는 미래를 살펴보면 진화하는 신용 평가 환경의 핵심은 투명성, 효율성, 개인화에 있음을 알 수 있습니다. 기술과 금융의 시너지는 신용 의사결정의 정확성을 개선할 뿐 아니라 차입자에게 힘을 실어주는 미래를 만들어가고 있습니다.
솔루션 빌드를 지원하는 MongoDB의 모든 기능을 시연하는 코드는 이 GitHub 리포지토리에서 확인할 수 있습니다. 당사는 MongoDB의 핵심 AI 파트너인 Fireworks.AI에서 애플리케이션을 개발하고 배포하여 생성형 인공지능을 통한 혁신의 속도와 효율성, 안전성을 더욱 강화했습니다.
주요 학습 사항
제안된 솔루션의 기능적 및 비기능적 기능은 다음과 같습니다.
생성형 인공지능의 역량 이해: 다양한 데이터 세트를 결합해 전통적인 신용 평가 모델의 주요 한계점을 해결합니다.
설명 가능한 신용 상태: LLM을 통해 프롬프트 엔지니어링을 효과적으로 활용하여 신용 상태의 근거를 타당한 이유와 함께 최종 고객에게 설명할 수 있습니다.
기존 신용 평가 모델의 과제: 변화하는 금융 행동에 적응하고, 비전통적인 데이터 소스를 처리하고, 신용도에 대한 보다 포괄적이고 정확한 평가를 제공할 수 있는 대체 신용 평가 모델의 필요성을 인식합니다.
대체 데이터: 보다 정확한 신용 평가를 위해 대체 데이터의 장점을 이해합니다. 예를 들어, 공과금, 휴대폰 요금, 교육 이력과 같은 대체 데이터 포인트를 활용해 신용 평가 모델을 더욱 개선할 수 있습니다.
환각 문제 해결: RAG를 활용하여 모델의 응답이 최신 출처의 사실 정보에 기반하도록 하여 환각 위험을 줄이고, 모델의 응답이 항상 최신이면서 정확한 정보를 반영할 수 있도록 합니다.
작성자
Ashwin Gangadhar, MongoDB 파트너 솔루션
Wei You Pan, MongoDB 산업 솔루션
Julian Boronat, MongoDB 산업 솔루션