제품 및 도구: Time Series, MongoDB Atlas Charts, MongoDB Connector for Spark, MongoDB Atlas 데이터베이스, MongoDB 구체화된 뷰, 집계 파이프라인
파트너: Databricks
솔루션 개요
이 솔루션은 MongoDB, 머신 러닝, 실시간 데이터 처리 사용하여 커넥티드 카의 디지털 언더라이팅 프로세스 자동화하는 방법을 보여줍니다. 이 솔루션을 사용하여 고객의 습관과 행동을 고려한 개인화된 사용량 기반 프리미엄을 제공할 수 있습니다.
이를 위해서는 데이터를 수집하고 분석을 위해 머신 러닝 플랫폼으로 보낸 다음 결과를 사용하여 고객을 위한 개인화된 프리미엄을 생성해야 합니다. 또한 데이터를 시각화하여 추세를 식별하고 인사이트를 얻을 수도 있습니다. 이 고유한 맞춤형 접근 방식을 통해 고객이 보험 비용을 더 잘 제어할 수 있고 더 정확하고 공정한 가격을 제공할 수 있습니다.
GitHub 리포지토리 에는 MongoDB Atlas 에서 샘플 데이터를 로드하고 변환 파이프라인 빌드 방법과 Databricks에서 이벤트를 생성, 전송 및 프로세스 방법에 대한 자세한 단계별 지침이 포함되어 있습니다.
이 데모가 끝나면 Atlas Charts 사용하여 자동화된 보험료 변경을 거의 실시간으로 추적하는 데이터 시각화 만들 수 있습니다.
이 솔루션의 개념을 다음을 포함한 다른 산업에 적용 할 수 있습니다.
금융 서비스: 은행 및 금융 기관은 거래, 사기 탐지 등을 위해 타임스탬프가 포함된 금융 트랜잭션을 이해하고 해석할 수 있어야 합니다.
소매: 소매업체는 현재 시장 데이터에 대한 실시간 인사이트가 필요합니다.
의료: 운송 모드에서 패키지 자체에 이르기까지, IoT 센서는 운송 중 및 현장에서 공급망 최적화를 가능하게 합니다.
참조 아키텍처
아래 다이어그램은 아키텍처를 다음과 같이 설명합니다.
그림 1. MongoDB가 있는 참조 아키텍처
먼저, 자동차 여행으로 인한 총 거리가 포함된 데이터 세트를 MongoDB 에 로드하고 매일 자정에 일일 크론 작업 실행 일일 여행을 요약합니다. 그런 다음 일일 여행을 customerTripDaily라는 새 컬렉션 에 저장된 문서 로 컴파일합니다. 매월 25일에 월간 크론 작업 실행하여 일일 문서를 집계하고 customerTripMonthly이라는 새 컬렉션 만듭니다. 새로운 월별 요약이 생성될 때마다 Atlas 함수는 월별 총 거리와 기준 프리미엄을 ML 예측용 Databricks에 게시합니다. 그런 다음 ML 예측은 MongoDB 로 다시 전송되어 customerTripMonthly에 추가됩니다. 마지막 단계로 모든 데이터를 MongoDB Charts 로 시각화합니다.
데이터 모델 접근 방식
이 사용 사례 의 경우 기본 데이터 모델 에는 고객, 고객이 여행하는 여행, 구매하는 정책 및 해당 정책에 의해 보장되는 차량이 포함됩니다.
이 예시 3개의 MongoDB 컬렉션과 2개의 구체화된 뷰를 빌드합니다. MongoDB 객체를 정의하기 위한 전체 데이터 모델 GitHub 리포지토리 에서 확인할 수 있습니다.

그림 2. MongoDB 데이터 모델 접근 방식
솔루션 빌드
이 솔루션을 복제하려면 해당 GitHub 리포지토리 확인하세요.README 다음 단계를 더 자세히 다루는 리포지토리의 를 따르세요.
구체화된 뷰로 데이터 처리 파이프라인 만들기
데이터 처리 파이프라인 구성 요소는 샘플 데이터, 일별 구체화된 뷰 및 월별 구체화된 뷰로 구성됩니다. IoT 차량 원격 측정 데이터의 샘플 데이터 세트는 고객이 이동한 자동차 여행을 customerTripRaw 나타냅니다. 라는 컬렉션 에 로드됩니다. 데이터 세트는 GitHub에서 찾을 수 있으며 mongoimport 또는 다른 방법을 통해 로드할 수 있습니다. 구체화된 뷰를 생성하기 위해 예정된 customerTripDaily 트리거 집계 파이프라인 실행하는 함수를 실행합니다. 그런 다음 customerTripDaily customerTripMonthly원시 IoT 데이터의 일일 요약을 생성하여 이라는 구체화된 뷰 컬렉션 에 배치합니다. 월별 구체화된 뷰의 경우 마찬가지로 예정된 트리거 컬렉션 의 정보를 월 단위로 요약하고 이를 이라는 구체화된 뷰 컬렉션 에 배치하는 집계 파이프라인 실행하는 함수를 실행합니다.
다음 Github 리포지토리를 확인하여 데이터 처리 파이프라인 만듭니다.
1단계: 샘플 데이터를 불러옵니다.
3단계: 매월 cron 작업을 설정하세요.
그림 3. 데이터 처리 파이프라인 만들기
머신 러닝 모델로 보험료 계산 자동화
의사 결정 구성 요소는 필요한 데이터를 수집하고 페이로드를 Databricks ML Flow API 엔드포인트에 게시하는 예정된 트리거 로 구성됩니다. 이 모델은 이전에 Databricks의 MongoDB Spark Connector 사용하여 학습되었습니다. 그런 다음 특정 고객이 주행한 월별 마일을 기준으로 계산된 프리미엄으로 모델이 응답할 때까지 기다립니다. 그런 다음 예정된 트리거 customerPolicy 컬렉션 업데이트하여 새 월별 프리미엄 계산을 monthlyPremium 배열 내에 새 하위 문서로 추가합니다.
다음 Github 리포지토리를 확인하여 데이터 처리 파이프라인 만듭니다.
4단계: 프리미엄 계산 트리거를 설정합니다.
단계 5: Databricks 연결을 설정합니다.
그림 4. 머신 러닝 모델을 사용한 계산 자동화
주요 학습 사항
빌드 방법 알아보기 Time Series 데이터 에 대한 구체화된 1뷰:3 GitHub 리포지토리의 ~ 단계를 참조하세요.
크론 표현식에 집계 파이프라인을 활용합니다:2 3 GitHub 리포지토리의 또는 단계를 참조하세요.
MongoDB Atlas 데이터로 머신러닝 모델 제공: 4 GitHub리포지토리의 단계를 참조하세요.
Atlas 데이터베이스 에 머신러닝 모델 예측 5 6 작성 : GitHub 리포지토리의 및 단계를 참조하세요.
지속적으로 변화하는 모델 결과에 대한 거의실시간 인사이트를 시각화합니다: GitHub 리포지토리의 '보너스' 단계를 참조하세요.
작성자
Jeff Needham, MongoDB
Ainhoa Múgica, MongoDB
Luca Napoli, MongoDB
Karolina Ruiz Rogelj, MongoDB