Join us Sept 17 at .local NYC! Use code WEB50 to save 50% on tickets. Learn more >
MongoDB Event
Docs Menu
Docs Home
/ /
Atlas 아키텍처 센터
/ / /

생성형 인공지능을 활용한 비즈니스 대출 리스크 평가

생성형 인공지능이 상세한 위험 평가를 생성하는 방법과 MongoDB의 다중 모드 기능이 포괄적이고 다차원적인 대출 위험 분석을 가능하게 하는 방법을 학습하세요.

  • 사용 사례: 생성형 AI, 대출 및 리스

  • 산업: 금융 서비스

  • 제품 및 도구: Atlas, 지리 공간적 데이터

  • 파트너: Google Maps API, Fireworks.ai

기업 대출은 은행 운영의 핵심으로, 금융 기관과 전체 경제에 상당한 이점을 제공합니다. 예를 들어, 2023년 미국에서 상업 및 산업 대출의 가치는 약 2.8조 달러에 달했습니다. 그러나 이러한 대출은 은행이 해결해야 하는 고유한 과제와 위험을 수반합니다. 차입자의 채무 불이행에 따른 신용 위험 외에도, 경제 침체나 특정 산업의 침체로 인해 차입자의 상환 능력이 영향을 받는 사업 위험도 존재합니다. 이 솔루션은 기업 대출에 대한 세부적 위험 평가를 지원함에 있어 생성형 인공지능의 가능성을 알아보고, MongoDB의 멀티모달 기능을 적용해 포괄적이고 다차원적인 위험 분석을 수행하는 방법을 설명합니다.

이 솔루션을 빌드하기 위한 MongoDB 의 모든 기능을 시연하는 코드는 다음 GitHub 리포지토리에서 확인할 수 있습니다.

사업 계획서는 사업 대출 확보를 위해 반드시 필요한 것으로, 대출자의 계획, 전략, 재무 예측을 상세히 설명하는 포괄적인 로드맵 역할을 합니다. 이는 대출 기관이 사업의 목표, 실행 가능성, 수익성을 평가하고 대출금이 성장과 상환에 어떻게 사용될지 파악하는 데 도움이 됩니다. 시장 분석, 경쟁 포지셔닝, 운영 계획, 재무 전망 등을 포함한 상세한 사업 계획은 투자 타당성을 설득력 있게 제시하고, 사업의 위험 관리 능력을 입증해 대출 승인 가능성을 높입니다.

시간적 제약과 자료의 복잡성, 상세한 재무 예측과 시장 분석, 위험 요인에서 주요 지표를 도출하기가 어렵다는 점을 고려할 때, 대출 담당자에게 있어 대출 신청자의 신용 정보와 15~20페이지 분량의 상세한 사업 계획서를 읽는 것은 쉽지 않은 일입니다. 기술적 세부 사항과 업계별 전문 용어를 파악하는 것도 어렵고, 전문 지식이 필요합니다. 중요한 위험 요인을 파악하고 완화 전략을 수립하는 작업은, 대출 담당자와 승인 위원회 간의 정확성과 일관성을 보장해야 한다는 과제와 맞물리며 복잡성을 더욱 가중시킵니다.

이러한 과제를 극복하기 위해, 생성형 AI는 대출 담당자가 정보에 기반한 의사 결정을 내릴 수 있도록 사업 계획을 효율적으로 분석하고, 필수 정보를 추출하며, 주요 위험을 식별하고, 일관적인 해석을 제공합니다.

아래 그림 1은 사업 대출 위험 평가 요청에 대한 ChatGPT-4o의 응답을 보여주는 예시입니다. 생성형 인공지능은 대출 목적과 사업 설명의 입력 내용이 단순한 경우에도 상세한 분석을 제공할 수 있습니다.

기업 대출 위험 평가 요청에 대한 ChatGPT-4o의 응답 예시
클릭하여 확대

그림 1. ChatGPT 예시-4.0의 예 비즈니스 대출 위험 평가에 대한 응답

대출 기관은 생성형 인공지능을 위험 평가에 적용해 생성형 인공지능으로 평가 가능한 추가 위험 요소를 탐색할 수 있습니다. 자연 재해나 더 광범위한 기후 위험을 일례로 들 수 있습니다. 그림 2에서는 이전 질문에 홍수 위험을 추가 요인으로 적용하여 ChatGPT-4가 반환하는 결과를 확인했습니다.

그림 2: ChatGPT-4o가 홍수 위험을 요인으로 응답한 예시
클릭하여 확대

그림 2. ChatGPT 예시-4.0의 예 홍수 위험을 요인으로 고려한 대응

응답에 따르면 홍수 위험은 낮습니다. 이를 검증하기 위해 홍수 데이터 지식에 초점을 맞춰 ChatGPT-4에 다른 방식으로 질문했습니다. (그림 3 참조) 그 결과, 최신 정보가 아닐 수 있음을 인정하며 FEMA 홍수 지도와 지역 홍수 기록을 검토할 것을 제안했습니다.

그림 3: 위치 특정 홍수 질문
클릭하여 확대

그림 3. 위치별 홍수 관련 질문의 예시

표시된 쿼리에서 ChatGPT-4o는 반대의 답변을 제공하고, 이전에는 수행하지 않았던 4개 사이트에 대한 인터넷 검색을 수행한 후 홍수 증거를 참조하여 '심각한 홍수'가 있다고 지적했습니다.

이 예시에서 볼 수 있듯, ChatGPT-4o가 관련 데이터를 보유하지 않을 경우 환각으로 간주될 수 있는 허위 주장을 하기도 합니다. 초기 응답에서는 정보 부족으로 인해 홍수 위험이 낮다고 표시되었습니다. 그러나 두 번째 쿼리에서 홍수 위험을 구체적으로 질문하자 FEMA 홍수 지도를 비롯한 외부 자료를 참고할 것을 제안하며, 자체적인 한계와 외부 검증의 필요성을 인정했습니다.

생성형 AI 기반 챗봇은 지식의 공백을 메우기 위해 추가 데이터 소스를 인식하고 지능적으로 탐색할 수 있습니다. 그러나 단순한 웹 검색만으로는 필요한 수준의 세부 정보를 확보하기 어렵습니다.

위의 유망한 예시는 생성형 AI가 대출 담당자의 전문성을 강화하여 분석 업무 대출을 지원하는 데 어떻게 기여할 수 있는지 보여줍니다. 그러나 생성형 AI 챗봇과의 상호작용은 대출 담당자가 반복적으로 관련 정보를 제공하여 맥락을 보완하고 유도하는 과정에 의존합니다. 이 작업은 신속한 엔지니어링 스킬의 부족이나 필요한 데이터의 부족으로 인해 시간이 많이 소요되고 비실용적일 수 있습니다.

아래는 생성형 AI를 활용하여 위험 분석 프로세스를 보완하고 LLM의 지식 격차를 해소하는 간단한 솔루션입니다. 이 데모는 MongoDB를 운영 데이터 저장소로 사용하며 지리 공간적 쿼리를 활용해 제안된 사업 위치로부터 5킬로미터 이내에서 발생한 홍수를 탐지합니다. 이 위험 분석의 프롬프트는 재무 예측보다는 홍수 위험 평가의 분석을 강조합니다.

MAAP 제휴하다 Fireworks가 호스팅하는 Llama 3 에서도 유사한 테스트를 수행했습니다. AI . 이 모델의 플러드 데이터 지식을 테스트한 결과, 채팅GPT- o와 유사한 지식 격차를 보였습니다.4흥미롭게도 Llama 는 오해의 소지가 있는 답변을 3 제공하는 대신 "홍수 데이터의 환영 목록"을 제공했지만 "이 데이터는 허구이며 데모 목적으로만 사용됩니다. 실제로 정확한 정보를 얻으려면 FEMA의 홍수 데이터나 기타 정부 기관의 보고서와 같은 신뢰할 수 있는 출처 액세스 해야 합니다.”

그림 4: 가상의 홍수 LLM 위치 응답
클릭하여 확대

그림 4. 가상의 홍수 위치에 대한 LLM 응답

이처럼 전문 분야에서 LLM의 지식 공백이 일관적으로 드러남에 따라, 멀티모달 데이터 플랫폼 기반의 RAG(검색 증강 생성)의 활용 가능성을 탐구할 필요성이 한층 강조되고 있습니다.

이 간소화된 데모에서는 사업 위치, 사업 목적, 사업 계획 설명을 선택합니다. 간편한 입력을 위해 '예시' 버튼을 추가하여 생성형 AI가 간단한 사업 설명 샘플을 생성하도록 했습니다. 따라서 설명 템플릿을 처음부터 작성할 필요가 없습니다.

그림 5: 지도에서 위치를 선택하고 간단한 계획 설명을 작성하기
클릭하여 확대

그림 5. 대출 리스크 평가 시연을 위한 사용자 입력

제출 시, 적절한 프롬프트 엔지니어링을 적용한 RAG를 활용하여 위치와 이전에 외부 홍수 데이터 소스에서 다운로드한 홍수 위험을 함께 고려해 단순화된 분석을 제공합니다.

그림 6: RAG를 사용한 대출 리스크 대응
클릭하여 확대

그림 6. RAG 아키텍처를 사용한 대출 위험 대응

홍수 위험 평가 섹션에서 AI 기반 지리 공간적 분석은 대출 담당자가 과거 홍수 발생 사례를 신속하게 발견하고 데이터 소스를 식별할 수 있도록 합니다.

선택한 사업장 위치 주변의 모든 샘플 홍수 위치를 표시하려면 "핀" 아이콘을 클릭하세요. 지리적 위치 핀에는 홍수 위치가 표시되며, 파란색 원은 홍수 데이터가 조회되는 5km 반경 영역을 나타냅니다.

그림 7: 핀으로 표시된 홍수 위치
클릭하여 확대

그림 7. 데모에 표시된 홍수 위치

주어진 좌표 주변의 홍수 위치를 가져오는 것이 얼마나 쉬운지를 보여주기 위해, 지리적 위치 정보가 포함된 홍수 데이터를 MongoDB에 로드한 후, 아래에 지리 공간적쿼리 코드의 샘플 스니펫을 제시합니다. 이 예시에서 $geoNear 명령어를 사용하면 경도와 위도로 지정된 점(예: 사업장 위치) 근처에 있는 모든 위치와 특정 거리(예: 5km) 내에 있는 모든 위치를 가져올 수 있습니다. 지리 공간적 쿼리는 MongoDB의 데이터 집계 파이프라인에서 처리할 수 있으며, $project를 사용하여 데이터 세트에서 반환할 필드를 선택하는 등의 다른 데이터 처리도 포함할 수 있습니다. 또한, $match를 통해 특정 조건에 따라 필터링할 수 있습니다(예: 연도가 2016보다 큰 데이터). 이 데이터는 미국 홍수 데이터베이스에서 가져온 것으로, 여러 소스를 포함하고 있으며 2020년이 최신 데이터 세트입니다.

pipeline = [
{"$geoNear": {"near": {"type": "Point", "coordinates": [longitude, latitude]},
"distanceField": "DISTANCE", "spherical": True, "maxDistance": radius * 1000}},
{"$project": {"year": 1, "COORD": 1, "DISTANCE": 1}},
{"$match": {"year": {"$gte": 2016}}}
]

다음 다이어그램은 이 솔루션에 구현된 RAG 데이터 프로세스의 논리적 아키텍처 개요를 보여주며, MongoDB, Meta Llama 3, Fireworks.AI 등 사용된 여러 기술을 강조합니다.

그림 8: RAG 데이터 흐름 아키텍처 다이어그램
클릭하여 확대

그림 8. RAG 데이터 흐름 아키텍처 다이어그램

MongoDB의 멀티모달 기능을 활용하면 네트워크 그래프, time series, 벡터 검색 등의 기능을 적용해 RAG 프로세스를 개선할 수 있습니다. 이를 통해 생성형 AI 에이전트의 컨텍스트가 풍부해져, 멀티모달 분석으로 보다 포괄적이고 다차원적인 위험 분석을 제공할 수 있습니다. 보다 정확한 컨텍스트 기반 인사이트(예: 지리 공간적 데이터를 활용하여 홍수 위험 지역 식별)로 환각을 줄이고, 심층적인 인사이트를 제공하여 복잡한 기업 대출 위험 평가 프로세스를 강화할 수 있습니다.

RAG 프로세스의 반복적인 특성으로 인해, 생성형 AI 모델은 새로운 데이터와 피드백을 통해 지속적으로 학습하고 개선되어 점점 더 정확한 위험 평가를 제공하고 환각 현상을 최소화합니다. 멀티모달 데이터 플랫폼은 멀티모달 AI 모델의 역량을 최대한 발휘할 수 있게 해줍니다.

  • Wei You Pan, MongoDB 금융 산업 솔루션 글로벌 디렉터

돌아가기

AI 기반 인터랙티브 뱅킹

이 페이지의 내용