실시간 데이터 처리로 기계 학습을 활용하고 디지털 언더라이팅을 자동화합니다.
제품 및 도구: Time Series, Atlas Charts, Spark Connector
파트너: Databricks
솔루션 개요
고객들에게 운전 습관과 행동을 고려한 맞춤형 사용량 기반 보험료를 제공할 수 있다고 상상해 보세요. 이렇게 하려면 커넥티드 차량에서 데이터를 수집하고, 분석을 위해 머신 러닝 플랫폼으로 전송한 다음, 그 결과를 사용하여 고객을 위한 개인화된 프리미엄을 생성해야 합니다. 또한 데이터를 시각화하여 추세를 식별하고 인사이트를 얻을 수 있습니다. 이 고유한 맞춤형 접근 방식을 통해 고객은 보험 비용을 더 잘 통제할 수 있으며 보다 정확하고 공정한 가격을 제공할 수 있습니다.
GitHub 리포지토리 에서는 MongoDB Atlas 플랫폼 기능을 활용하여 데이터 업로드 및 변환 파이프라인 빌드 방법과 이벤트를 생성, 전송 및 프로세스 방법에 대한 자세한 단계별 지침을 찾을 수 있습니다. 데이터브릭.
이 데모를 마치면 Atlas Charts를 사용하여 자동 보험료의 변화를 거의 실시간으로 추적하는 데이터 시각화를 만들 수 있습니다.
기타 적용 가능한 산업 및 사용 사례
금융 서비스: 은행 및 금융 기관은 거래, 사기 탐지 등을 위해 타임스탬프가 포함된 금융 트랜잭션을 이해하고 해석할 수 있어야 합니다.
소매: 현재 상황에 대한 실시간 인사이트를 제공합니다.
의료: 운송 모드에서 패키지 자체에 이르기까지, IoT 센서는 운송 중 및 현장에서 공급망 최적화를 가능하게 합니다.
참조 아키텍처
그림 1. MongoDB가 있는 참조 아키텍처
데이터 모델 접근 방식
사용 사례를 지원하기 위한 기본 예시 데이터 모델에는 고객, 고객이 이용하는 여행, 고객이 구매하는 보험, 해당 보험에 가입된 차량이 포함됩니다.
이 예시 세 개의 MongoDB 컬렉션과 두 개의 구체화된 뷰를 빌드합니다. 이 예시 내의 모든 MongoDB 객체를 정의하는 전체 Hackloade 데이터 모델 GitHub에서 찾을 수 있습니다.

그림 2. MongoDB 데이터 모델 접근 방식
솔루션 구축
자동차 여정에서 주행한 총 거리를 포함한 데이터 세트가 MongoDB에 로드되고 매일 자정에 일일 크론 작업이 실행되어 일일 여행을 요약하고 "CustomerTripDaily"라는 새 컬렉션에 저장된 문서로 컴파일합니다. 월별 cron 작업은 매월 25일에 실행되어 일일 문서를 집계하고 "Customer Trip Monthly"라는 새 컬렉션을 만듭니다. 새 월별 요약이 생성될 때마다 Atlas 함수는 ML 예측을 위해 해당 월의 총 거리와 기준 프리미엄을 Databricks에 게시합니다. 그런 다음 ML 예측이 MongoDB로 다시 전송되어 "Customer Trip Monthly" 문서에 추가됩니다. 마지막 단계로, MongoDB Charts를 사용하여 모든 데이터를 시각화할 수 있습니다.
구체화된 뷰를 사용하여 데이터 처리 파이프라인 만들기
이 예시 의 데이터 처리 파이프라인 구성 요소는 샘플 데이터, 일별 구체화된 뷰 및 월별 구체화된 뷰로 구성됩니다. IoT 차량 원격 측정 데이터의 샘플 데이터 세트는 고객이 이동한 자동차 여행을1 나타냅니다. 'customerTripRaw'()라는 컬렉션 에 로드됩니다. 데이터 세트는 GitHub에서 찾을 수 있으며 MongoImport 또는 다른 방법을 통해 로드할 수 있습니다. 구체화된 뷰를 생성하기 위해 예정된 트리거 집계 파이프라인 실행하는 함수를 실행합니다. 그런 다음 원시 IoT 데이터의 일일 2 요약을 생성하여 'customerTripDaily'()라는 구체화된 뷰 컬렉션 에 배치합니다. 월별 구체화된 뷰의 경우 마찬가지로 예정된 트리거 'customerTripDaily' 컬렉션 의 정보를 매월 요약하여 'customerTripMonthly'()라는 구체화된 뷰 컬렉션 에 배치하는 집계 파이프라인 실행하는 함수를3 실행합니다.
데이터 처리 파이프라인을 만들기 위해서는 다음 Github 리포지토리를 참조하세요.
1단계: 샘플 데이터를 불러옵니다.
3단계: 매월 cron 작업을 설정하세요.
그림 3. 데이터 처리 파이프라인 생성
머신 러닝 모델을 사용하여 보험료 계산 자동화
이 예시의 의사 결정 처리 구성 요소는 필요한 데이터를 수집하고 Databricks 머신 러닝 Flow API 엔드포인트에 페이로드를 게시하는 예정된 트리거로 구성됩니다. (이 모델은 이전에 Databricks의 MongoDB Spark connector 사용하여 학습되었습니다.) 그런 다음 모델이 한 달 동안 지정된 고객이 주행한 마일을 기준으로 계산된 프리미엄으로 응답할 때까지 기다립니다. 그런 다음 예정된 트리거는 'customerPolicy' 컬렉션을 업데이트하여 새 월별 보험료 계산을 'monthlyPremium' 배열 내의 새 하위 문서로 추가합니다.
데이터 처리 파이프라인을 만들기 위해서는 다음 Github 리포지토리를 참조하세요.
4단계: 프리미엄 계산 트리거를 설정합니다.
단계 5: Databricks 연결을 설정합니다.
그림 4. 머신 러닝 모델을 사용한 계산 자동화
사용된 기술 및 제품
MongoDB 개발자 데이터 플랫폼
파트너 기술
주요 고려 사항
Time Series 데이터 에 대한 13 구체화된 뷰 빌드: GitHub 리포지토리의 ~ 단계를 참조하세요.
크론 표현식에 집계 파이프라인 활용:2 3 GitHub 리포지토리의 또는 단계를 참조하세요.
MongoDB Atlas 데이터로 머신 러닝 모델 제공:4 GitHub리포지토리의 단계를 참조하세요.
Atlas 데이터베이스 에 머신 러닝 모델 예측 쓰기 :GitHub 리포지토리의 단계를 참조하세요.
지속적으로 변화하는 모델 결과에 대한 거의 실시간 인사이트 시각화: GitHub 리포지토리의 '보너스' 단계를 참조하세요.
작성자
Jeff Needham, MongoDB
Ainhoa Múgica, MongoDB
Luca Napoli, MongoDB
Karolina Ruiz Rogelj, MongoDB