AI 기반 의료 보고서 생성기

산업: 의료

솔루션 개요

의료 팀은 환자 관리의 질을 위협하는 문서화 위기에 직면해 있습니다. 종양학과 같은 전문 병동에서는 환자가 수년간의 진료를 거쳐 다른 곳에서 오는 경우가 많으며, 스캔한 보고서, PDF, 병리학 설명, 영상 요약, 검사 결과 등으로 구성된 긴 기록을 가지고 있습니다. 이러한 문서는 연결이 끊긴 디지털 시스템에 흩어져 있는 경우가 많고 여전히 종이 사본에 물리적으로 저장되어 각 환자의 데이터가 파편화되고 탐색하기가 어렵습니다.

개별 환자 사례에 대해 논의하기 위해MDT는 매주 또는 매월 회의를 진행합니다. 그러나 조정자, 간호사 또는 레지던트는 각 회의가 시작되기 전에 스토리를 재구성하고, 주요 사실을 추출하고, 모순을 해결하고, 용어를 정규화하고, 일관된 타임라인을 빌드 해야 합니다. 결과적으로 이러한 의사들은 환자의 의료 기록을 정리하기 위해 구조화되지 않은 의료 문서에서 중요한 데이터를 수동으로 추출하는 데 많은 시간을 소비하게 됩니다.

이러한 수동 추출은 임상 의사 결정 속도를 늦추고, 인적 오류를 발생시키며, 환자 기록 전반의 관리에 영향 수 있는 불일치를 발생시킵니다. 그 결과 문서 관리 가 아니라 사람을 돌보기 위해 의료를 선택한 의료 전문가들 사이에서 진료가 지연되고, 비효율적인 운영이 이루어지며, 번아웃이 증가하고 있습니다.

여기에 설명된 솔루션은 구성 가능한 템플릿을 사용하여 전문 분야별 엔터티를 추출하고 추출된 각 사실을 출처와 함께 저장하여 임상의가 빠르게 유효성을 검사할 수 있도록 하여 준비를 자동화합니다. MongoDB 템플릿, 추출된 엔터티 및 소스 문서로 다시 연결되는 링크에 대해 유연하고 감사 가능한 기록 시스템을 제공합니다.

솔루션: AI 기반 문서 처리

AI 기반 의료 보고서 생성기는 이러한 운영상의 과제 전략적인 이점으로 전환합니다. 고급 인공 지능은 의료 문서를 빠르게 처리하여 PDF, 이미지, 의료 텍스트를 포함한 다양한 문서 형식에서 특수 엔터티를 추출합니다.

MongoDB의 유연한 문서 구조는 의료 엔터티 간의 관계를 유지하면서 AI 가 추출한 복잡한 환자 데이터를 저장하고 구성합니다. 시스템은 완전한 MDT 보고서를 자동으로 생성하여 준비 시간을 몇 시간에서 몇 분으로 줄이는 동시에 정확성과 일관성 향상시킵니다.

또한 MongoDB 템플릿 버전과 소스 문서로 다시 연결되는 참조 링크를 저장하므로 MDT 초안의 모든 팩트를 검증할 수 있습니다.

엔터티 템플릿을 통한 사용자 지정 가능한 MDT

의사는 유연한 템플릿 정의를 통해 시스템이 추출하는 정보를 정확하게 제어할 수 있습니다. 의료팀은 특정 사례 요구 사항에 맞는 엔터티 유형, 처리 규칙 및 집계 전략을 정의합니다. 인스턴스 를 들어, 종양학 팀이 템플릿을 구성하여 종양 마커와 병기 정보를 추출하는 동안 심장 팀은 동일한 서비스 내에서 다양한 진단 기준에 집중할 수 있습니다.

따라서 이 데모는 MDT 보고서를 대상으로 하지만 템플릿 기반 워크플로는 엔터티 템플릿 및 서식 지정 규칙을 업데이트하여 모든 보고서 유형을 지원 수 있습니다.

각 템플릿은 소스 문서 우선 순위, 필터링 규칙, 엔터티 설명, 추출 지침 및 출력 형식을 지정하여 MDT 보고서가 임상에서 선호하는 결과와 일치하도록 합니다. 이 사용자 지정은 일반 출력을 제거하고 각 의료 전문 분야의 고유한 요구 사항에 맞게 특별히 설계된 보고서를 제공합니다.

데이터 애그리게이션 및 보안

의료팀은 직관적인 인터페이스를 통해 문서를 업로드할 수 있으며, AI 프로세스는 환자의 인구 통계, 진단, 분자 이상 및 치료 기록을 실시간 추출합니다. 그러나 데이터 개인정보 보호 및 보안을 위해 이 데모에서는 업로드 기능을 비활성화하고 처리 사전 설정된 샘플 데이터에서만 실행됩니다.

이 플랫폼은 여러 소스의 정보를 집계하고, 필터링 규칙을 적용하며, 의료팀이 환자의 의료 기록을 확인하는 데 사용할 수 있는 구조화된 보고서를 생성합니다. MongoDB의 확장 가능한 아키텍처는 의료 환경에 필수적인 데이터 무결성 및 보안 표준을 유지하면서 수백 건의 동시 문서 처리 요청을 처리합니다.

이 설계는 의미 있는 운영상의 영향 제공합니다. 이 플랫폼은 MDT 워크플로의 병목 현상을 줄이고, 더 빠른 치료 계획을 지원하며, 접근 가능한 방식으로 환자 정보를 한데 모아줍니다. 실제로 이는 팀이 증가하는 문서화 요구를 처리하다 , 리소스를 최적화하며, 환자 관리에 더 많은 시간을 할애하는 데 도움이 될 수 있습니다.

참조 아키텍처

임상 팀은 데모의 사전 정의된 데이터 세트에서 기존 환자를 선택하여 모든 관련 의료 기록이 구성된 인터페이스에 표시되는 환자 문서 개요 페이지로 리디렉션됩니다. 보안상의 이유로 데모에서는 새 문서나 환자 추가를 제한하지만 이러한 기능은 시스템 설정 중 구성 단계에 따라 활성화할 수 있습니다.

환자 개요 페이지에서 의사는 해당 환자 기록 과 이미 연결된 기존 의료 문서를 검토 할 수 있습니다. 이 단계에서 문서는 처리 나 엔티티 추출 없이 MongoDB 에 저장된 원시 파일로 존재합니다. 전체 프로덕션 시스템에서 팀은 PDF, 의료 이미지, 텍스트 파일 및 XML 문서를 포함한 모든 형식을 허용하는 직관적인 드래그 앤 드롭 기능을 통해 새 문서를 업로드할 수 있습니다.

그림 1. 환자 문서 개요

문서를 처리 전에 의사는 인터페이스의 오른쪽 상단 섹션에 있는 메뉴를 통해 템플릿 구성에 액세스하여 추출 요구 사항을 사용자 지정할 수 있습니다. 이 구성 패널을 통해 의료팀은 AI 도구가 추출해야 하는 엔티티 유형, 처리 규칙 및 출력 형식을 정확히 정의할 수 있습니다. 이 시스템은 환자 인구 통계, 진단, 치료, 분자 마커 등 의료 엔터티의 포괄적인 라이브러리와 함께 제공됩니다. 팀은 자신의 전문 분야와 관련된 엔터티만 선택하거나 만들 수 있습니다. 예시 를 들어, 암팀은 심장학 또는 트라우마팀과는 다른 추출 매개변수를 구성하여 시스템이 특정 요구 사항에 맞게 조정되도록 할 수 있습니다.

그림 2. 템플릿 정의 프로세스

템플릿이 이미 구성된 경우, 의사는 분석 하려는 각 환자 문서 번들에 대해 문서 처리 수동으로 트리거하다 할 수 있습니다. 이 조치 문서가 OCR을 사용하여 이미지와 스캔한 자료에서 텍스트를 추출하는 문서 프로세서에 들어가는 엔티티 추출 단계를 시작합니다. 시스템은 형식 불일치를 정규화하고 이러한 구현 위해 AWS 기반암과 같은 LLM 제공자 통해 지능적 분석을 위한 콘텐츠를 준비합니다. AI 는 사전 구성된 템플릿 사양에 따라 엔터티를 추출하고, 추출된 이러한 엔터티는 소스 문서에 연결된 MongoDB 에 저장됩니다.

문서가 처리되고 엔티티가 추출되면 의사는 MDT 보고서를 생성할 수 있습니다. MDT 보고서 생성기는 인터페이스의 보고서 섹션에서 별도의 기능으로 작동합니다. 생성기는 새 엔터티 추출을 수행하는 대신 이전에 문서 처리 단계에서 추출되고 저장된 엔터티를 집계하고 구성합니다. 시스템은 선택한 환자에 대해 처리된 여러 문서의 엔터티를 결합하고 템플릿 서식 지정 규칙을 적용하며 데이터를 시간순으로 구성합니다.

그림 3. MDT 보고서 뷰어

MDT 보고서가 생성되면 임상 팀은 관찰 가능성 섹션에서 비교를 위해 제공된 그라운드 트루스 데이터를 사용하여 AI 성능을 검증할 수 있습니다. 이 평가 기능을 통해 의료 전문가는 확인된 엔티티 추출을 참조 표준으로 업로드하고 AI 에서 생성한 MDT 보고서와 비교할 수 있습니다. 이 평가 프로세스 팀이 AI의 성능 특성을 이해하고 특정 임상 컨텍스트에서 최적의 결과를 얻을 수 있도록 템플릿 구성을 수정하는 데 도움이 됩니다.

이 전체 워크플로에서 MongoDB 원본 문서, 처리된 엔터티, 생성된 보고서를 명확하게 구분하는 동시에 각 구성 요소를 빠르게 검색할 수 있습니다.

마지막으로, 환자 문서에서 추출한 임상 인사이트와 AI 시스템 자체의 성능 지표 포괄적으로 이해하는 것으로 여행을 마무리합니다. 이 접근 방식을 통해 팀은 귀중한 MDT 보고서를 받을 수 있을 뿐만 아니라 이 MDT 생성 뒤에 숨겨진 AI 처리 의 안정성과 정확성에 대한 확신을 얻을 수 있습니다.

그림 4. AI 기반 의료 보고서 생성기 아키텍처 다이어그램

임상 엔티티 추출에서 AI 의 역할

AI 기반 엔터티 추출 프로세스 구조화되지 않은 의료 문서를 실행 가능한 임상 데이터로 변환하는 핵심 인텔리전스를 나타냅니다. 고급 LLM은 템플릿 기반 지침과 도메인별 이해를 결합하는 그림 5에 설명된 정교한 다단계 프로세스 따라 클라우드 기반 AI 서비스를 프라이머리 추출 엔진 으로 작동합니다.

그림 5. AI 워크플로 다이어그램

추출 프로세스 처리된 문서가 엔티티 추출기 구성 요소에 도달하면 시작되며, 여기서 LLM 모델은 구성 가능한 템플릿을 통해 특정 지침을 수신합니다. 그림 5에 설명된 대로 이러한 템플릿은 전문 분야별 처리 로직을 적용하면서 LLM이 관련 의료 개념으로 주의를 집중하도록 하는 상세한 프롬프트 엔지니어링 역할을 합니다.

템플릿에 지정된 각 엔터티 정의는 LLM에 정확한 추출 매개 변수를 제공합니다. 예시 를 들어 진단 날짜 엔터티는 모델에 생검 진단 날짜를 증상 시작 또는 치료 시작 날짜와 구분하면서 찾도록 지시합니다. LLM은 정확한 식별을 보장하기 위해 문서 유형, 예상 형식 및 임상적 중요성에 대한 컨텍스트를 수신하고 사용 가능한 문서를 처리 때 해당 컨텍스트와 제약 조건을 적용합니다.

템플릿 시스템은 LLM의 추출 동작을 가이드 세 가지 처리 유형을 구현합니다.

일치 처리: 이 방법은 모델이 환자 인구 통계와 같은 최종 엔터티의 신뢰할 수 있는 초기 인스턴스 추출하도록 지시합니다.
애그리게이션 처리: 이 옵션을 선택하면 LLM이 약품 기록과 같은 누적 정보에 대한 모든 멘션을 수집한 다음 지능형 중복 제거 로직을 적용하도록 지시합니다.
소스 필터링 처리: 활성화하면 특정 엔터티를 추출할 때 특정 문서 유형의 우선 순위를 지정하도록 모델을 안내합니다.

템플릿 정의 단계가 완료되고 새 템플릿이 선택되면 'LLM 메시지' 단계가 시작됩니다( 그림 2 참조). 이 플랫폼은 의료 엔티티를 추출하는 고급 쿼리를 구성합니다. 각 쿼리 간결한 시스템 프롬프트로 시작하는 표준화된 구조를 따릅니다.

문서에서 관련 데이터를 추출하는 전문가입니다. 다음을 수행해야 합니다.

이 시스템 수준 지침에서는 특정 추출 작업 제시하기 전에 LLM의 역할 과 전문성 컨텍스트를 설정합니다. 최종 쿼리 구조화된 XML 태그 내에 문서 콘텐츠와 엔터티 사양을 캡슐화합니다. 문서 섹션에는 처리된 의료 텍스트가 포함되어 있고, 엔터티 섹션에는 각 대상 엔터티에 대한 자세한 추출 지침을 제공합니다. 이 접근 방식을 사용하면 LLM이 명확하고 구조화된 지시문을 받을 수 있습니다.

모델에 의해 생성된 추출된 엔터티는 최종 제품인 MDT 보고서를 생성하기 위한 지능적인 임상 합성을 가능하게 하는 구조화된 데이터가 됩니다. 모델의 상황에 맞는 이해는 추출된 개념 간의 임상 관계를 보존하여 플랫폼이 이전에 구조화되지 않은 의료 정보에서 구조화된 출력을 구성할 수 있도록 합니다.

이 LLM 기반 접근 방식은 도메인별 템플릿과 소스 인식 처리 로직을 적절히 안내할 때 고급 언어 모델이 의료 환경에서 어떻게 효과적인 도구로 제공 수 있는지 보여줍니다.

결과적으로, 이 솔루션을 통해 의료팀은 수천 개의 임상 문서에서 의미를 추출해야 하는 기존의 과제 임상 전문성 보강하는 자동화된 프로세스 로 전환할 수 있습니다.

솔루션 빌드

자세한 설정 지침은 README 산업 솔루션 GitHub 리포지토리 의 에 설명된 단계를 따르세요. 이 리포지토리 AI 기반 의료 보고서 생성기 데모의 백엔드 와 프론트엔드 호스팅합니다.

사용자 환경에서 이 데모를 재현하려면 다음 단계를 따르세요.

Atlas 또는 로컬에서 MongoDB 설정

MongoDB Atlas 포털에 로그인하고 데이터를 저장 하기 위해 선택한 이름으로 데이터베이스 만듭니다.

다음 단계를 위해 연결 문자열 저장합니다.

Atlas 배포서버를 위한 액세스 목록에 IP 주소 추가되어 있는지 확인하세요.

Github 리포지토리 복제

다음 명령을 사용하여 원하는 위치 에 리포지토리 복제합니다.

git clone https://github.com/mongodb-industry-solutions/hc-mdt-report-generator.git
cd hc-mdt-report-generator

AWS 기반 액세스 활성화

AWS 기반 액세스 위한 자격 증명 설정합니다.

AWS CLI 구성하거나 Claude 3 하이쿠 모델 액세스 에 대한 베드락 권한이 있는 IAM 역할을 생성합니다. SSO 로그인으로 작업하는 경우 다음 명령을 실행 이 연결을 구성할 수 있습니다.
```
aws sso login
```
지침에 따라 로그인.
완료되면 브라우저를 닫고 다음 단계를 계속 진행합니다.

환경 변수 구성

./generate_env.sh 파일 사용하여 템플릿 구성을 생성합니다.

생성된 .env 파일 특정 구성으로 업데이트합니다.

MONGODB_URI=mongodb+srv://<user>:<password>@<cluster-url>/?retryWrites=true&w=majority
MONGODB_DB=your_database_name
AWS_REGION=us-east-1
AWS_ACCESS_KEY_ID=your_access_key (if used)
AWS_SECRET_ACCESS_KEY=your_secret_key (if used)
SECRET_KEY=your_secure_secret_key
LLM_PROVIDER=bedrock

종속성 설치

Makefile 를 사용하여 백엔드 및 프론트엔드 에 필요한 모든 종속성을 설치합니다.

루트 디렉토리 로 이동하여 다음 명령을 실행하여 종속성을 설치합니다.

make install

샘플 데이터로 데이터베이스 초기화

다음 명령을 실행 하여 샘플 환자 문서와 엔터티 정의를 로드합니다.

python scripts/bulk_data_ingestion.py
python scripts/add_template_to_mongodb.py

Makefile을 사용하여 두 서비스를 모두 배포합니다.

두 개의 서로 다른 터미널에서 다음 명령을 실행하여 서비스를 독립적으로 시작합니다.

터미널 1: 백엔드

make backend

터미널 2: 프론트엔드

make frontend

이 단계를 완료하면 모든 기능을 갖춘 AI 기반 의료 보조를 사용할 수 있습니다. 다음 URL에서 모든 리소스를 찾을 수 있습니다.

프론트엔드: http://localhost:3000
API docs: http://localhost:8000/docs
상태 확인: http://localhost:8000/health

주요 학습 사항

데이터 추출 자동화 및 수동 오류 감소: PDF, 스캔, 무료 텍스트 보고서에서 정보를 수동으로 추출하기 위해 의사에게 의존하면 프로세스가 비효율적이 되고 사람의 실수로 인한 오류가 증가합니다. 환자 기록의 규모와 복잡성이 증가함에 따라 수동 접근 방식을 유지하면 기록 전반에 걸쳐 불일치가 발생하고 임상 결정이 느려집니다.
AI 사용하여 의료 팀 보강 : 이러한 맥락에서 AI 의 가치는 자율적인 의사 결정이 아니라 비정형 데이터에서 구조화된 의료 항목을 빠르고 일관적인 추출하는 것입니다. 이 AI 기반 솔루션은 여러 문서에서 임상 데이터를 처리 하고 통찰력 있는 보고서를 생성함으로써 의료 팀이 의사 결정 워크플로를 변경하지 않고도 문서화 과제를 관리 있도록 도와줍니다.
템플릿으로 의료 항목 추출 사용자 지정: 의료 전문 분야마다 데이터 요구 사항이 다릅니다. 종양학, 심장학 및 트라우마학 팀은 환자 문서에서 동일한 신호를 찾지 않습니다. 이 템플릿 기반 엔터티 추출은 AI 시스템이 다양한 임상 상황에 적응하는 데 도움이 되며, 출력이 관련성 있고, 사용 가능하며, 각 전문 분야의 요구 사항에 부합하도록 보장합니다.
출처 및 감사 가능성 보존: MongoDB 템플릿 버전과 출처를 포함한 전체 추출 컨텍스트를 유지하여 의사가 추출한 각 사실을 출처까지 추적할 수 있도록 합니다.

작성자

Patricia Renart Carnicero, MongoDB
Francesc Mateu Amengual, MongoDB
Sakshi Gark, MongoDB

자세히 알아보기

돌아가기

AI 기반 의료

Hybrid FHIR ODL