Docs Menu
Docs Home
/

MongoDB와 Microsoft를 활용한 AI 기반 의료

MongoDB와 Microsoft는 유방암 치료를 위한 AI 기반 솔루션을 제공하여 데이터를 통합하고 예측 모델링, 지능형 챗봇 및 분석을 가능하게 합니다.

사용 사례: 분석, 생성형 AI, 상호 운용성

산업: 의료

제품 및 도구: MongoDB Atlas, MongoDB Atlas Search, MongoDB Atlas Vector Search, MongoDB Atlas Data Federation, MongoDB Atlas Charts

파트너: Microsoft

"Leafy 병원"이라고 명명된 이 솔루션은 MongoDB Atlas 와 Microsoft AI 통합하여 유방암 진단 및 환자 관리를 개선합니다. 이 시스템은 MongoDB의 유연한 데이터 플랫폼을 활용하여 운영 메타데이터 와 AI 데이터를 통합하고, 이를 Azure OpenAI, Microsoft Fabric, Power BI 와 같은 Microsoft 제품과 결합하여 포괄적인 의료 분석 및 진단 솔루션을 만듭니다. 이 솔루션은 세 가지 주요 기술적 접근 방식을 보여줍니다.

  • 조기 발견을 위한 예측 AI : 딥 러닝 모델을 사용하여 유방 조영술을 분석 하고 유방 영상 보고 및 데이터 시스템(BI-RADS) 점수를 예측합니다.

  • 워크플로 자동화 위한 제너레이티브 AI : 지능적인 정보 검색을 위해 검색-증강 생성(RAG) 기반 Vector Search 기능과 챗봇을 사용합니다.

  • 고급 분석 : Power BI 통합을 통해 실시간 운영 인사이트와 장기적인 추세 분석을 결합합니다.

이 솔루션을 통해 의료 제공자는 민감한 환자 정보를 안전하게 처리하면서 진단 프로세스를 간소화하고, 의료 문서화를 자동화하고, 데이터 기반 의사 결정을 내릴 수 있습니다.

다음 다이어그램은 Leafy 병원 솔루션이 다양한 구성 요소를 통합하는 방법을 보여줍니다.

Leafy Hospital 솔루션 아키텍처

그림 1. Leafy Hospital 솔루션 아키텍처

이 솔루션은 세 가지 주요 기술 영역에 걸쳐 구성 요소를 통합합니다.

  1. 예측 AI 계층 (하단 노란색 상자)

    • 유방조영술 이미지와 임상 데이터를 처리합니다.

    • BI-RADS 점수 및 생검 유형 분석을 처리합니다.

    • 악성 또는 양성 분류를 결정합니다.

    • Azure Blob Storage에서 이미지를 수신합니다.

    • MongoDB Atlas에 운영 데이터를 출력합니다.

  2. 생성형 AI 계층(중간 보라색 상자)

    • Azure AI Studio를 사용하여 MongoDB Atlas 와 통합합니다.

    • 임상 문서의 자동 보고서 생성을 활성화합니다.

    • 질문 답변 기능을 갖춘 챗봇을 제공합니다.

    • Atlas 에서 운영 및 벡터 데이터를 처리합니다.

    • 시스템과 자연 언어로 상호 작용을 쉽게 할 수 있게 합니다.

  3. 고급 분석 계층 (중간 녹색 상자)

    • 패브릭 Power BI 와 패브릭 OneLake를 결합합니다.

    • 처리된 데이터로부터 보고서와 대시보드를 생성합니다.

    • MongoDB Atlas와 데이터 시각화를 위해 통합됩니다.

    • 포괄적인 분석 역량을 제공합니다.

Azure Blob Storage에 먼저 저장된 의료 이미지는 다양한 계층을 통해 처리됩니다.

  1. 이미지와 운영 데이터는 AI 처리를 위해 Fabric Data Science를 통해 흐릅니다.

  2. 결과는 중앙 운영 데이터베이스로 사용되는 MongoDB Atlas에 저장됩니다.

  3. Azure AI Studio는 저장된 데이터를 활용하여 생성형 AI 작업을 처리합니다.

  4. 마지막으로 Fabric Power BI와 OneLake는 고급 분석 및 시각화를 가능하게 합니다.

이 아키텍처는 원시 의료 데이터에서 실행 가능한 인사이트로의 정보 흐름을 원활하게 보장하며, 시스템 전반에 걸쳐 보안과 성능을 유지합니다.

Leafy 병원 데모는 다음 섹션에 설명된 몇 가지 주요 구성 요소를 통해 MongoDB Atlas 와 Microsoft의 AI 및 분석 서비스 통합을 보여줍니다.

코드 샘플과 구체적인 구성 지침을 포함하여 이 솔루션을 구현하는 방법에 대한 자세한 단계별 가이드를 보려면 이 솔루션의 Github 리포지토리방문하세요.

이 솔루션에서 MongoDB Atlas 실시간 AI 애플리케이션의 운영 데이터 저장소 역할을 하고, Microsoft OneLake는 장기 추세 분석을 위한 분석 처리합니다. 이 아키텍처를 사용하면 다음과 같은 기능을 사용할 수 있습니다.

  • 환자 데이터와 의료 이미지의 실시간 처리.

  • 운영 시스템과 분석 시스템 간의 통합.

  • 트랜잭션 처리에서 분석 처리로의 효율적인 데이터 흐름.

  • 밀리초 단위 응답의 운영 쿼리와 복잡한 분석 워크로드를 모두 지원합니다.

실시간 데이터에서 분석 데이터로의 파이프라인

그림 2: 실시간 분석 데이터 파이프라인

예측 AI 의료에서 대규모 데이터 세트에서 정확한 진단을 생성하는 데 사용할 수 있습니다. Microsoft 패브릭 데이터 과학 은 ML 모델을 교육 및 실험하고 MLOps 주기를 관리 수 있는 강력한 플랫폼을 제공합니다. 이 솔루션은 다음과 같은 목적으로 모델을 사용합니다.

  1. BI-RADS 예측

    BI-RADS는 유방 조영술 결과를 분석 업계 표준 메커니즘입니다. 의료 전문가는 BI-RADS를 사용하여 유방 영상 검사 결과를 0 부터 6까지의 숫자로 설명하며, 점수가 높을수록 악성 가능성이 높습니다.

    이 솔루션은 VGG16 심층 컨볼루션 신경망(CNN)을 사용하여 이미지에서 BI-RADS 점수를 예측합니다. 이 모델은 Kaggle 데이터 세트의 맘모그램 이미지로 학습됩니다. 각 이미지는 BI-RADS에 해당하는 폴더로 그룹화됩니다.

    패브릭 데이터 과학은 이 작업 위해 여러 모델의 성능을 분석하고 가장 적합한 모델을 선택합니다. 모델을 학습시키고, 실험을 실행하고, 여러 버전을 관리합니다. 교육 이미지는 Lakehouse UI 사용하여 사용자의 로컬 머신에서 OneLake의 Lakehouse에 직접 업로드됩니다. 또한 wget 또는 curl 명령, 바로 가기 또는 데이터 파이프라인 사용하여 Azure Blob Storage에 저장된 이미지를 쉽게 참조할 수 있습니다. 이 솔루션은 이미지 메타데이터 와 최종 예측을 MongoDB Atlas 에 저장합니다.

  2. 생검 분류

    분류 또는 회귀 모델을 사용하여 종양을 악성 또는 양성으로 분류할 수 있습니다. 랜덤 포리스트 분류기 모델은 덩어리 두께, 셀 크기 및 모양의 균일성, 베어 뉴클레이, 유사분열과 같은 입력 매개변수를 포함하는 Kaggle 데이터 세트 에서 훈련됩니다. 그런 다음 이 모델은 종양이 악성인지 양성인지 예측할 수 있습니다. 프로덕션 환경에서는 데이터 세트에 더 많은 매개 변수를 추가하고 이러한 값을 기반으로 모델을 학습시켜 더 정확한 예측을 할 수 있습니다. 솔루션 개발 중 랜덤 포리스트 모델의 정확도는 97%를 초과했습니다. 이 솔루션은 MongoDB Atlas 에서 교육 데이터 세트를 가져오고, MongoDB Spark Connector사용하여 MongoDB 에서 예측 출력을 업데이트합니다.

패브릭 데이터 과학은 각 모델 및 실험에 대한 관련 매개변수를 자동으로 기록하여 모델을 쉽게 교육 하고 관리할 수 있도록 합니다.

이 솔루션의 지능형 쿼리 시스템은 다음 다이어그램과 같이 Vector Search를 사용합니다.

벡터 검색 구현 프로세스 흐름

그림 3. 벡터 검색 구현 프로세스 흐름

  1. 데이터 준비:

    • Azure OpenAI의 text-embedding-ada-002 모델은 임상 기록을 처리합니다.

    • 데이터는 고차원 공간 표현을 위해 벡터 임베딩으로 변환됩니다.

    • 벡터 임베딩은 최적화된 검색 인덱스를 사용하여 MongoDB Atlas에 저장됩니다.

  2. 쿼리 처리:

    • 언어 쿼리는 벡터 표현으로 변환됩니다.

    • 의미론적 이해는 복잡한 의학적 쿼리를 가능하게 합니다.

    • 쿼리 벡터는 저장된 임베딩과 일치합니다.

  3. Document retrieval:

    • 의미적 일치를 기반으로 관련 의료 기록을 반환합니다.

    • 환자 정보에 대한 직관적인 액세스를 활성화합니다.

    • Atlas Vector Search 유사성 기반 검색을 실행합니다.

챗봇 구현은 다음 다이어그램에 표시된 것처럼 다음 컨텍스트에서 RAG 아키텍처를 활용합니다.

챗봇 아키텍처 청사진

그림 4. 챗봇 아키텍처 청사진

  1. 환자 정보 검색:

    • 최신 환자 세부 정보를 가져오기 위해 쿼리를 실행합니다.

    • MongoDB 컬렉션에서 구조화된 환자 데이터를 검색합니다.

    • 중요한 환자 정보에 대한 즉시 액세스를 제공합니다.

  2. 기록 데이터 처리:

    • MongoDB Atlas에서 10년간의 환자 기록에 접근합니다.

    • Azure OpenAI LLM을 사용해 과거 데이터를 해독하고 요약합니다.

    • 컨텍스트 인식 응답을 위해 사고 연쇄를 구현합니다.

  3. 의료 지식 통합:

    • 벡터화된 의료 문서를 사용합니다.

    • 쿼리의 컨텍스트를 기반으로 실시간 벡터 검색을 수행합니다.

    • 관련 의학 문헌과 사례 연구를 통합합니다.

이 솔루션은 분석 위해 다음 두 가지 시각화 플랫폼을 사용합니다.

먼저, MongoDB Atlas Charts는 MongoDB 데이터와 직접 연결된 네이티브 실시간 운영 대시보드를 제공합니다. 데이터 변환이나 추가 도구 없이 직관적인 시각화를 통해 중요한 의료 지표에 대한 인사이트를 즉각적으로 제공합니다. 운영 대시보드(그림 5)는 환자 수, 예약 상태, 클리닉 분포를 포함한 주요 지표를 보여줍니다.

Atlas Charts 대시보드

그림 5. Atlas Charts를 사용한 운영 대시보드

둘째, Power BI 통합은 엔터프라이즈 전체의 데이터 분석 및 고급 시각화를 가능하게 하여 분석 기능을 확장합니다. MongoDB Atlas Connector를 통해 의료 데이터를 Microsoft OneLake의 다른 엔터프라이즈 소스와 결합할 수 있습니다. 지리적 시각화 대시보드 (그림 6)는 이러한 통합을 보여 주어 환자 분포를 표시하고 정교한 분석 기능을 가능하게 합니다.

Power BI와 MongoDB Atlas의 통합

그림 6. Power BI와 MongoDB Atlas의 통합

이 플랫폼들은 함께 완전한 분석 솔루션을 제공하여 즉각적인 운영 요구와 장기적인 분석 요구를 모두 처리합니다.

이 솔루션은 MongoDB Atlas 운영 데이터, Vector Search 기능, 분석 요구 사항을 처리하다 Microsoft의 AI 및 시각화 도구와 원활하게 통합되는 방법을 보여줍니다. 이 아키텍처를 통해 의료 제공자는 단일 시스템 내에서 실시간 운영 인사이트와 장기적인 분석 기능을 활용할 수 있습니다.

  • 통합 데이터 플랫폼: MongoDB Atlas 운영 데이터, 메타데이터, AI 데이터를 통합하여 의료 시스템의 다양한 구성 요소를 원활하게 통합할 수 있는 중앙 리포지토리 역할을 합니다.

  • AI 통합 기능: 이 아키텍처는 Microsoft의 AI 서비스와 MongoDB Atlas 사용하여 예측, 생성, 분석 등 다양한 유형의 AI 단일 의료 솔루션에 효과적으로 통합하는 방법을 보여줍니다.

  • 워크플로 자동화: 이 솔루션은 AI 진단 예측부터 보고서 생성에 이르기까지 중요한 의료 워크플로를 자동화하는 방법을 보여줍니다. 또한 챗봇을 통한 지능적인 쿼리가 가능하여 수작업과 잠재적 오류를 줄일 수 있습니다.

  • 확장 가능한 분석: MongoDB Atlas와 Microsoft Fabric 및 Power BI의 결합은 실시간 운영 분석과 장기적 트렌드 분석을 가능하게 하여, 의료 의사결정에 포괄적인 인사이트를 제공합니다.

  • 안전한 의료 아키텍처: 이 솔루션은 데이터 보안과 개인 정보 보호를 유지하면서 고급 AI 기능과 데이터 분석을 가능하게 하는 현대적인 의료 시스템을 구축하는 방법을 보여줍니다.

  • Francesc Mateu, MongoDB

  • Diana Annie Jenosh, MongoDB

  • Sebastian Rojas Arbulu, MongoDB

돌아가기

결제 현대화 가속화 솔루션

이 페이지의 내용