Generador de informes médicos con tecnología de IA

caso de uso: Inteligencia artificial

Industrias: Salud

Resumen de la solución

Los equipos de atención médica se enfrentan a una crisis de documentación que amenaza la calidad de la atención al paciente. En unidades especializadas como oncología, los pacientes suelen llegar tras años de atención en otros centros con un largo historial de informes escaneados, archivos PDF, descripciones de patología, resúmenes de imágenes y resultados de laboratorio. Estos documentos suelen estar dispersos en sistemas digitales desconectados y aún se almacenan físicamente en copias impresas, lo que deja los datos de cada paciente fragmentados y difíciles de navegar.

Para discutir casos de pacientes individuales, Los equipos multidisciplinarios se reúnen semanal o mensualmente. Sin embargo, antes de cada reunión, los coordinadores, enfermeros o residentes deben reconstruir la historia clínica, extraer datos clave, resolver contradicciones, normalizar la terminología y crear una cronología coherente. Como resultado, estos profesionales clínicos terminan dedicando muchas horas a extraer manualmente datos cruciales de documentos médicos no estructurados solo para compilar el historial clínico del paciente.

Esta extracción manual ralentiza la toma de decisiones clínicas, propicia el error humano y genera inconsistencias que pueden afectar la atención en los historiales clínicos. El resultado es una atención retrasada, operaciones ineficientes y un creciente agotamiento entre los profesionales sanitarios que eligieron la medicina para atender a las personas, no para gestionar documentos.

La solución descrita aquí automatiza dicha preparación extrayendo entidades específicas de cada especialidad mediante plantillas configurables y almacenando cada dato extraído con su procedencia para que los médicos puedan validarlo rápidamente. MongoDB proporciona un sistema de registro flexible y auditable para plantillas, entidades extraídas y sus enlaces a los documentos fuente.

La solución: procesamiento de documentos impulsado por IA

El generador de informes médicos con tecnología de IA transforma este desafío operativo en una ventaja estratégica. La inteligencia artificial avanzada procesa documentos médicos con rapidez, extrayendo entidades especializadas de diversos formatos, como PDF, imágenes y textos clínicos.

La estructura flexible de documentos de MongoDB almacena y organiza datos complejos de pacientes extraídos por la IA, a la vez que mantiene las relaciones entre las entidades médicas. El sistema genera automáticamente informes MDT completos, lo que reduce el tiempo de preparación de horas a minutos y mejora la precisión y la consistencia.

MongoDB también almacena versiones de plantillas y referencias a enlaces que apuntan a los documentos fuente, de modo que se puede validar cada dato en el borrador de MDT.

MDT personalizables mediante plantillas de entidad

Los médicos controlan con precisión la información que extrae el sistema mediante definiciones de plantillas flexibles. Los equipos médicos definen tipos de entidades, reglas de procesamiento y estrategias de agregación que se adaptan a las necesidades específicas de cada caso. Por ejemplo, mientras los equipos de oncología configuran plantillas para extraer marcadores tumorales e información de estadificación, los equipos de cardiología pueden centrarse en diferentes criterios de diagnóstico, todo dentro del mismo servicio.

Por lo tanto, si bien esta demostración está orientada a los informes MDT, el flujo de trabajo impulsado por plantillas puede admitir cualquier tipo de informe actualizando las plantillas de entidad y las reglas de formato.

Cada plantilla especifica las prioridades del documento fuente, las reglas de filtrado, las descripciones de las entidades, las instrucciones de extracción y el formato de salida para garantizar que los informes de MDT se ajusten a los resultados clínicos preferidos. Esta personalización elimina los resultados genéricos y genera informes diseñados específicamente para los requisitos específicos de cada especialidad médica.

Agregación y seguridad de datos

Los equipos médicos pueden cargar documentos mediante una interfaz intuitiva, mientras que los procesos de IA extraen datos demográficos, diagnósticos, anomalías moleculares e historial de tratamiento de los pacientes en tiempo real. Sin embargo, para garantizar la privacidad y seguridad de los datos, en esta demostración la función de carga está desactivada y el procesamiento se ejecuta exclusivamente con datos de muestra predefinidos.

La plataforma agrega información de múltiples fuentes, aplica reglas de filtrado y genera informes estructurados que los equipos clínicos pueden usar para consultar el historial médico de sus pacientes. La arquitectura escalable de MongoDB gestiona cientos de solicitudes simultáneas de procesamiento de documentos, manteniendo la integridad de los datos y los estándares de seguridad esenciales para los entornos sanitarios.

Este diseño ofrece un impacto operativo significativo. La plataforma ayuda a reducir los cuellos de botella en los flujos de trabajo de los equipos multidisciplinarios (EMD), facilita una planificación del tratamiento más rápida y reúne la información del paciente de forma accesible. En la práctica, esto puede ayudar a los equipos a gestionar la creciente demanda de documentación, optimizar recursos y dedicar más tiempo a la atención al paciente.

Arquitecturas de Referencia

Los equipos clínicos comienzan su proceso seleccionando un paciente existente del conjunto de datos predefinido de la demostración, lo que los redirige a la página de resumen de documentos del paciente, donde se muestran todos los historiales médicos asociados en una interfaz organizada. Por razones de seguridad, la demostración restringe la adición de nuevos documentos o pacientes, pero estas funcionalidades pueden activarse siguiendo los pasos de configuración durante la configuración del sistema.

Desde la página de resumen del paciente, los profesionales clínicos pueden revisar los documentos médicos existentes asociados a ese historial. En esta etapa, los documentos existen como archivos sin procesar almacenados en MongoDB sin necesidad de procesamiento ni extracción de entidades. En el sistema de producción completo, los equipos cargarían nuevos documentos mediante la intuitiva función de arrastrar y soltar, que acepta cualquier formato, incluyendo PDF, imágenes médicas, archivos de texto y documentos XML.

Figura 1. Resumen de los documentos del paciente

Antes de procesar los documentos, los profesionales clínicos pueden personalizar sus requisitos de extracción accediendo a la Configuración de Plantillas a través de un menú ubicado en la parte superior derecha de la interfaz. Este panel de configuración permite a los equipos médicos definir con precisión los tipos de entidades, las reglas de procesamiento y los formatos de salida que las herramientas de IA deben extraer. El sistema incluye una completa biblioteca de entidades médicas, que incluye datos demográficos de pacientes, diagnósticos, tratamientos y marcadores moleculares. Los equipos pueden seleccionar o crear únicamente las entidades relevantes para sus especialidades. Por ejemplo, los equipos de oncología pueden configurar parámetros de extracción diferentes a los de los equipos de cardiología o traumatología, lo que garantiza que el sistema se adapte a requisitos específicos.

Figura 2. Proceso de definición de plantilla

Con las plantillas ya configuradas, los profesionales clínicos pueden activar manualmente el procesamiento de documentos para cada paquete de documentos de pacientes que deseen analizar. Esta acción inicia la fase de extracción de entidades, donde los documentos ingresan al procesador de documentos, que utiliza OCR para extraer texto de imágenes y materiales escaneados. El sistema normaliza las inconsistencias de formato y prepara el contenido para el análisis inteligente mediante un proveedor de LLM, como AWS Bedrock para esta implementación. La IA extrae las entidades según las especificaciones de la plantilla preconfigurada, y estas entidades extraídas se almacenan en MongoDB vinculadas a sus documentos de origen.

Una vez procesados los documentos y extraídos los datos, los profesionales clínicos pueden generar informes MDT. El generador de informes MDT funciona como una función independiente en la sección de informes de la interfaz. En lugar de extraer nuevos datos, el generador agrega y organiza los datos extraídos y almacenados previamente durante el procesamiento de documentos. El sistema combina datos de varios documentos procesados para el paciente seleccionado, aplica reglas de formato de plantilla y organiza los datos cronológicamente.

Figura 3. Visor de informes MDT

Una vez generados los informes MDT, los equipos clínicos pueden validar el rendimiento de la IA con los datos de Ground Truth proporcionados para compararlos en la sección de Observabilidad. Esta función de evaluación permite a los profesionales médicos cargar extracciones de entidades verificadas como estándares de referencia y compararlas con los informes MDT generados por la IA. Este proceso de evaluación ayuda a los equipos a comprender las características de rendimiento de la IA y a refinar la configuración de sus plantillas para obtener resultados óptimos en su contexto clínico específico.

A lo largo de todo este flujo de trabajo, MongoDB mantiene una separación clara entre los documentos sin procesar, las entidades procesadas y los informes generados, al tiempo que permite una rápida recuperación de cada componente.

Finalmente, el proceso concluye con una comprensión integral tanto de la información clínica extraída de los documentos de los pacientes como de las métricas de rendimiento del propio sistema de IA. Este enfoque garantiza que los equipos no solo reciban valiosos informes de MDT, sino que también confíen en la fiabilidad y precisión del procesamiento de IA que sustenta esta generación de MDT.

Diagrama de arquitectura del generador de informes médicos con tecnología de IA

Figura 4. Diagrama de arquitectura del generador de informes médicos con IA

El papel de la IA en la extracción de entidades clínicas

El proceso de extracción de entidades basado en IA representa la inteligencia fundamental que transforma documentos médicos no estructurados en datos clínicos procesables. Los LLM avanzados funcionan mediante servicios de IA en la nube como motor de extracción principal, siguiendo un sofisticado proceso de varios pasos, descrito en la Figura 5, que combina instrucciones basadas en plantillas con comprensión específica del dominio.

Figura 5. Diagrama de flujo de trabajo de IA

El proceso de extracción comienza cuando los documentos procesados llegan al componente Extractor de Entidades, donde el modelo LLM recibe instrucciones específicas mediante plantillas configurables. Como se explica en la Figura 5, estas plantillas funcionan como ingeniería de indicaciones detallada que dirige la atención del LLM hacia conceptos médicos relevantes, aplicando la lógica de procesamiento específica de la especialidad.

Cada definición de entidad especificada en una plantilla proporciona al LLM parámetros de extracción precisos. Por ejemplo, la entidad Fecha de Diagnóstico indica al modelo que localice las fechas de diagnóstico de la biopsia, distinguiéndolas de las fechas de inicio de los síntomas o del tratamiento. El LLM recibe información sobre los tipos de documento, los formatos esperados y la relevancia clínica para garantizar una identificación precisa, y aplica dicha información y restricciones al procesar los documentos disponibles.

El sistema de plantillas implementa tres tipos de procesamiento distintos que guían el comportamiento de extracción del LLM:

Procesamiento de coincidencias: este método dirige al modelo para extraer la instancia confiable inicial de entidades definitivas, como los datos demográficos del paciente.
Procesamiento agregado: cuando se selecciona, le indica al LLM que recopile todas las menciones de información acumulada, como historiales de medicamentos, y luego aplica una lógica de deduplicación inteligente.
Procesamiento filtrado por origen: si está habilitado, guía al modelo para priorizar tipos de documentos específicos al extraer entidades particulares.

Tras finalizar el paso de Definición de Plantilla y seleccionar una nueva, comienza la fase de "Indicación de LLM" (véase la Figura 2). La plataforma construye consultas avanzadas que extraen entidades médicas. Cada consulta sigue una estructura estandarizada que comienza con una indicación concisa del sistema:

Eres experto en extraer datos relevantes de documentos. Deberás…

Esta instrucción a nivel de sistema establece el rol y el contexto de experiencia del LLM antes de presentar la tarea de extracción específica. La consulta final encapsula el contenido del documento y las especificaciones de las entidades en etiquetas XML estructuradas. La sección del documento contiene el texto médico procesado, mientras que la sección de entidades proporciona instrucciones detalladas de extracción para cada entidad objetivo. Este enfoque garantiza que el LLM reciba instrucciones claras y estructuradas.

Las entidades extraídas generadas por el modelo se convierten en datos estructurados que permiten la síntesis clínica inteligente para la creación del producto final, el Informe MDT. La comprensión contextual del modelo preserva las relaciones clínicas entre los conceptos extraídos, lo que permite a la plataforma generar resultados estructurados a partir de información médica previamente no estructurada.

Este enfoque basado en LLM demuestra cómo los modelos de lenguaje avanzados pueden servir como herramientas efectivas en el entorno clínico cuando se los guía adecuadamente a través de plantillas específicas del dominio y una lógica de procesamiento consciente de la fuente.

Como resultado, esta solución permite a los equipos médicos transformar el desafío tradicional de extraer significado de miles de documentos clínicos en un proceso automatizado que aumenta la experiencia clínica.

Construir la solución

Para obtener instrucciones de configuración detalladas, siga los pasos descritos en la README del repositorio de GitHubde Soluciones IndustrialesEste repositorio aloja el backend y el frontend para la demostración del generador de informes médicos impulsado por IA.

Para reproducir esta demostración en su propio entorno, siga estos pasos:

Configurar MongoDB en Atlas o localmente

Inicie sesión en su portal MongoDB Atlas y cree una base de datos con el nombre que elija para almacenar los datos.

Guarde la cadena de conexión para los próximos pasos.

Asegúrese de que su dirección IP se agregue a la lista de acceso para las implementaciones de Atlas.

Clonar el repositorio de GitHub

Clone el repositorio en su ubicación preferida usando los siguientes comandos:

git clone https://github.com/mongodb-industry-solutions/hc-mdt-report-generator.git
cd hc-mdt-report-generator

Habilitar el acceso a AWS Bedrock

Configure sus credenciales para acceder a AWS Bedrock:

Configure su AWS CLI o cree roles de IAM con permisos de Bedrock para acceder al modelo Claude 3 Haiku. Si trabaja con inicio de sesión único (SSO), puede ejecutar el siguiente comando para configurar esta conexión:
```
aws sso login
```
Siga las instrucciones para iniciar sesión.
Cierra el navegador cuando termines y luego continúa con los siguientes pasos.

Configurar las variables ambientales

Utilice el archivo ./generate_env.sh para generar sus configuraciones de plantilla.

Actualice el archivo .env generado con su configuración específica:

MONGODB_URI=mongodb+srv://<user>:<password>@<cluster-url>/?retryWrites=true&w=majority
MONGODB_DB=your_database_name
AWS_REGION=us-east-1
AWS_ACCESS_KEY_ID=your_access_key (if used)
AWS_SECRET_ACCESS_KEY=your_secret_key (if used)
SECRET_KEY=your_secure_secret_key
LLM_PROVIDER=bedrock

Instale las dependencias

Utilice Makefile para instalar todas las dependencias necesarias para el backend y el frontend.

Vaya al directorio raíz y ejecute el siguiente comando para instalar las dependencias:

make install

Inicialice su base de datos con datos de muestra

Cargue los documentos de muestra del paciente y las definiciones de entidad ejecutando estos comandos:

python scripts/bulk_data_ingestion.py
python scripts/add_template_to_mongodb.py

Implementar ambos servicios con el Makefile

En dos terminales diferentes, ejecute los siguientes comandos para iniciar los servicios de forma independiente:

Terminal 1: Sistema backend

make backend

Terminal 2: Interfaz

make frontend

Tras completar estos pasos, podrá utilizar su asistente médico basado en IA totalmente funcional. Encontrará todos los recursos en las siguientes URL:

Interfaz: http://localhost:3000
API docs: http://localhost:8000/docs
verificación de estado: http://localhost:8000/salud

Aprendizajes clave

Automatice la extracción de datos y reduzca los errores manuales: Depender de que los médicos extraigan manualmente información de archivos PDF, escaneos e informes de texto libre reduce la eficiencia de los procesos y aumenta los errores humanos. A medida que los historiales de los pacientes aumentan en tamaño y complejidad, mantener un enfoque manual genera inconsistencias en los registros y ralentiza la toma de decisiones clínicas.
Fortalezca a los equipos clínicos con IA: El valor de la IA en este contexto no reside en la toma de decisiones autónoma, sino en la extracción rápida y consistente de entidades médicas estructuradas a partir de datos no estructurados. Al procesar datos clínicos de múltiples documentos y crear informes detallados, esta solución basada en IA ayuda a los equipos clínicos a gestionar los desafíos de la documentación sin alterar el flujo de trabajo de la toma de decisiones.
Personalice la extracción de entidades médicas con plantillas: Las distintas especialidades médicas tienen diferentes requisitos de datos. Los equipos de oncología, cardiología y traumatología no buscan las mismas señales en los documentos de los pacientes. Esta extracción de entidades basada en plantillas ayuda a los sistemas de IA a adaptarse a diferentes situaciones clínicas, garantizando que los resultados sean relevantes, utilizables y estén alineados con las necesidades de cada especialidad.
Preserve la procedencia y la auditabilidad: MongoDB ayuda a conservar el contexto de extracción completo, incluidas las versiones de plantilla y la procedencia, lo que permite a los médicos rastrear cada hecho extraído hasta su origen.

Autores

Patricia Renart Carnicero, MongoDB
Francesc Mateu Amengual, MongoDB
Sakshi Gark, MongoDB

Obtén más información

Volver

Atención médica impulsada por IA

Hybrid FHIR ODL