caso de uso: Inteligencia artificial
Industrias: Salud
Productos: MongoDB Atlas
Descripción general de la solución
Los equipos de atención médica se enfrentan a una crisis de documentación que amenaza la calidad de la atención al paciente. En unidades especializadas como la oncología, los pacientes a menudo llegan después de años de atención en otros lugares y tienen un largo historial de informes escaneados, PDFs, narrativas de patología, resúmenes de imágenes y resultados de laboratorio. Estos documentos a menudo están dispersos en sistemas digitales desconectados y aún se almacenan físicamente en copias en papel, lo que deja los datos de cada paciente fragmentados y difíciles de navegar.
Para discutir casos individuales de pacientes, MDT se reúnen semanalmente o mensualmente. Sin embargo, antes de cada reunión, los coordinadores, enfermeros/as o residentes deben reconstruir la historia, extraer los datos clave, resolver las contradicciones, normalizar la terminología y compilar una cronología coherente. Como resultado, estos profesionales clínicos terminan dedicando muchas horas a la extracción manual de datos críticos de documentos médicos no estructurados, sólo para armar el historial médico de un paciente.
Esta extracción manual ralentiza la toma de decisiones clínicas, introduce errores humanos y crea inconsistencias que pueden afectar la atención en los registros de los pacientes. El resultado es la atención retrasada, operaciones ineficientes y un creciente agotamiento entre los profesionales de la salud que eligieron la medicina para cuidar a las personas, no para gestionar documentos.
La solución descrita aquí automatiza esa preparación extrayendo entidades específicas de cada especialidad mediante plantillas configurables y almacenando cada hecho extraído con procedencia para que los clínicos puedan validarlo rápidamente. MongoDB proporciona un sistema flexible y auditable de registro para plantillas, entidades extraídas y sus enlaces de regreso a los documentos origen.
La solución: procesamiento de documentos impulsado por IA
El Generador de Informes Médicos con IA transforma este desafío operativo en una ventaja estratégica. La inteligencia artificial avanzada procesa rápidamente documentos médicos, extrayendo entidades especializadas de muchos formatos de documentos, incluidos PDF, imágenes y textos clínicos.
La estructura flexible de documentos de MongoDB almacena y organiza los datos complejos de los pacientes extraídos por la IA, manteniendo las relaciones entre las entidades médicas. El sistema genera automáticamente informes MDT completos, reduciendo el tiempo de preparación de horas a minutos mientras mejora la precisión y la coherencia.
MongoDB también almacena versiones de plantillas y referencia enlaces a los documentos fuente, por lo que cada hecho en el borrador de MDT puede ser validado.
MDT personalizables a través de plantillas de entidades
Los clínicos controlan exactamente qué información extrae el sistema mediante definiciones de plantillas flexibles. Los equipos médicos definen tipos de entidades, reglas de procesamiento y estrategias de agregación que se ajustan a los requisitos específicos de su caso. Por instancia, mientras los equipos de oncología configuran plantillas para extraer marcadores tumorales e información de estadificación, los equipos cardíacos pueden centrarse en diferentes criterios diagnósticos, todo dentro del mismo servicio.
Por lo tanto, si bien esta demostración está dirigida a informes MDT, el flujo de trabajo impulsado por plantillas puede admitir cualquier tipo de informe actualizando las plantillas de entidad y las reglas de formato.
Cada plantilla especifica las prioridades de documentos fuente, reglas de filtrado, descripciones de entidades, instrucciones de extracción y formato de salida para garantizar que los informes MDT se alineen con los resultados preferidos clínicos. Esta personalización remueve los informes genéricos y proporciona informes diseñados específicamente para los requisitos únicos de cada especialidad médica.
Agregación de datos y seguridad
Los equipos médicos pueden cargar documentos a través de una interfaz intuitiva, mientras que los procesos de IA extraen en tiempo real demografía de pacientes, diagnósticos, anomalías moleculares e historiales de tratamientos. Sin embargo, para garantizar la privacidad y seguridad de los datos, en esta demostración la funcionalidad de carga está desactivada y el procesamiento se realiza exclusivamente con datos de muestra preestablecidos.
La plataforma consolida información de múltiples fuentes, aplica reglas de filtrado y genera informes estructurados que pueden ser utilizados por los equipos clínicos para revisar el historial médico de sus pacientes. La arquitectura escalable de MongoDB gestiona cientos de solicitudes simultáneas de procesamiento de documentos mientras mantiene los estándares de integridad y seguridad de datos esenciales para entornos de atención médica.
Este diseño ofrece un impacto operativo significativo. La plataforma ayuda a reducir los cuellos de botella en los flujos de trabajo de MDT, admite una planificación de tratamiento más rápida y reúne la información del paciente de una manera accesible. En la práctica, esto puede ayudar a los equipos a gestionar las crecientes demandas de documentación, optimizar los recursos y dedicar más tiempo a la atención al paciente.
Arquitecturas de Referencia
Los equipos clínicos inician su proceso seleccionando un paciente existente de los datos predefinidos del demo, lo que los redirige a la página de vista general del documento del paciente, donde se muestran todos los registros médicos asociados en una interfaz organizada. Por motivos de seguridad, la demostración restringe la adición de nuevos documentos o pacientes, pero estas funcionalidades pueden activarse siguiendo los pasos de configuración durante la instalación del sistema.
Desde la página de resumen del paciente, los médicos pueden revisar los documentos médicos existentes ya asociados con ese registro del paciente. En esta etapa, los documentos existen como archivos sin procesar almacenados en MongoDB sin ningún procesamiento ni extracción de entidades. En el sistema de producción completo, los equipos podrían cargar nuevos documentos mediante una funcionalidad de arrastrar y soltar intuitiva, aceptando cualquier formato, incluidos PDFs, imágenes médicas, archivos de texto y documentos XML.
Figura 1. Resumen de los documentos del paciente
Antes de procesar documentos, los clínicos pueden personalizar sus requisitos de extracción accediendo a la Configuración de plantillas a través de un menú situado en la sección superior derecha de la interfaz. Este panel de configuración permite a los equipos médicos definir exactamente qué tipos de entidades, reglas de procesamiento y formatos de salida deben extraer las herramientas de IA. El sistema incluye una completa librería de entidades médicas que abarca datos demográficos de los pacientes, diagnósticos, tratamientos y marcadores moleculares. Los equipos pueden seleccionar o crear únicamente las entidades relevantes para sus especialidades. Por ejemplo, los equipos de oncología pueden configurar diferentes parámetros de extracción que los equipos de cardiología o traumatología, asegurando que el sistema se adapte a requerimientos específicos.
Figura 2. Proceso de definición de plantilla
Con las plantillas ya configuradas, los clínicos pueden activar manualmente el procesamiento de documentos para cada paquete documental de pacientes que deseen analizar. Esta acción inicia la fase de extracción de entidades donde los documentos ingresan al Procesador de Documentos, que utiliza OCR para extraer texto de imágenes y materiales escaneados. El sistema normaliza las inconsistencias de formato y prepara el contenido para un análisis inteligente a través de un proveedor de LLM, como AWS Bedrock para esta implementación. La IA extrae entidades de acuerdo con las especificaciones de la plantilla preconfigurada, y estas entidades extraídas se almacenan luego en MongoDB vinculadas a sus documentos de origen.
Cuando los documentos se hayan procesado y las entidades hayan sido extraídas, los profesionales de la salud pueden generar informes MDT. El Generador de Informes MDT opera como una función separada en la sección de informes de la interfaz. En lugar de realizar una nueva extracción de entidades, el generador recopila y organiza las entidades que se extrajeron y almacenaron previamente durante la fase de procesamiento de documentos. El sistema combina entidades de múltiples documentos procesados para el paciente seleccionado, aplica reglas de formato de plantillas y organiza los datos cronológicamente.
Figura 3. Visor de informes MDT
Una vez que se generan los informes MDT, los equipos clínicos pueden validar el desempeño de la IA con los datos Ground Truth proporcionados para realizar una comparación en la sección Observability. Esta funcionalidad de evaluación permite a los profesionales médicos subir extracciones de entidades verificadas como estándares de referencia y compararlas con los informes MDT generados por IA. Este proceso de evaluación ayuda a los equipos a comprender las características de rendimiento de la IA y a perfeccionar sus configuraciones de plantillas para obtener resultados óptimos en su contexto clínico específico.
A lo largo de todo este flujo de trabajo, MongoDB mantiene una separación clara entre los documentos primarios, las entidades procesadas y los informes generados, al tiempo que permite la recuperación rápida de cada componente.
Finalmente, el recorrido concluye con una comprensión integral tanto de las perspectivas clínicas extraídas de los documentos de los pacientes como de las métricas de rendimiento del propio sistema de IA. Este enfoque garantiza que los equipos no solo reciban valiosos informes de MDT, sino que también ganen confianza en la fiabilidad y precisión del procesamiento de IA detrás de esta generación de MDT.
Figura 4. Diagrama de arquitectura del generador de informes médicos impulsado por IA
El papel de la IA en la extracción de entidades clínicas
El proceso de extracción de entidades impulsado por IA representa la inteligencia central que transforma documentos médicos no estructurados en datos clínicos procesables. Los LLMs avanzados operan a través de servicios de IA basados en la nube como motor principal de extracción, siguiendo un proceso sofisticado de varios pasos, descrito en la Figura 5, que combina instrucciones basadas en plantillas con una comprensión específica de cada dominio.
Figura 5. Diagrama de flujo de IA
El proceso de extracción comienza cuando los documentos procesados llegan al componente Extractor de Entidades, donde el modelo LLM recibe instrucciones específicas a través de plantillas configurables. Como se explica en la Figura 5, estas plantillas funcionan como ingeniería de instrucciones detallada que dirige la atención del LLM hacia conceptos médicos relevantes mientras aplica una lógica de procesamiento específica de cada especialidad.
Cada definición de entidad especificada en una plantilla proporciona al LLM parámetros de extracción precisos. Por ejemplo, la entidad Fecha de Diagnóstico instruye al modelo para que localice las fechas de diagnóstico de biopsias, distinguiéndolas de las fechas de inicio de síntomas o de inicio de tratamiento. El LLM recibe información contextual sobre tipos de documentos, formatos esperados y relevancia clínica para garantizar la identificación precisa y aplica ese contexto y restricciones al procesamiento de los documentos disponibles.
El sistema de plantillas implementa tres tipos de procesamiento distintos que guían el comportamiento de extracción del LLM:
Procesamiento de coincidencias: Este método orienta al modelo a extraer la instancia inicial confiable de entidades definitivas como la demografía del paciente.
Procesamiento agregado: cuando se selecciona, le indica al LLM que recopile todas las menciones de información acumulada, como historiales de medicación, y luego aplica la lógica de deduplicación inteligente.
Procesamiento filtrado por origen: Si está habilitado, guía al modelo que priorice ciertos tipos de documentos al extraer entidades específicas.
Después de finalizar el paso de definición de la plantilla y seleccionar una nueva plantilla, comienza la fase de "generación de LLM" (ver Figura 2). La plataforma construye consultas avanzadas que extraen entidades médicas. Cada query sigue una estructura estandarizada que comienza con una indicación concisa del sistema:
Eres un experto en extraer datos relevantes de documentos. Tendrás que …
Esta instrucción a nivel de sistema establece el rol y el contexto de experiencia de la LLM antes de presentar la tarea específica de extracción. La query final encapsula el contenido del documento y las especificaciones de la entidad dentro de etiquetas XML estructuradas. La sección de Documentos contiene el texto médico procesado, mientras que la sección de Entidades proporciona instrucciones detalladas de extracción para cada entidad objetivo. Este enfoque garantiza que el LLM reciba directrices claras y estructuradas.
Las entidades extraídas generadas por el modelo se convierten en datos estructurados que permiten una síntesis clínica inteligente para la creación del producto final, el Informe MDT. La comprensión contextual del modelo preserva las relaciones clínicas entre los conceptos extraídos, lo que permite que la plataforma construya resultados estructurados a partir de información médica previamente no estructurada.
Este enfoque potenciado por LLM demuestra cómo los modelos avanzados de lenguaje pueden servir como herramientas eficaces en el entorno clínico cuando se guían adecuadamente a través de plantillas específicas del dominio y una lógica de procesamiento consciente de las fuentes.
Como resultado, esta solución permite a los equipos médicos transformar el desafío tradicional de extraer significado de miles de documentos clínicos en un proceso automatizado que potencia la experiencia clínica.
Compilar la solución
Para obtener instrucciones detalladas de configuración, sigue los pasos descritos en la
README de las soluciones para la industria repositorio de GitHub. Este repositorio alberga el backend y el frontend de la demostración del Generador de Informes Médicos Potenciado por IA.
Para reproducir esta demo en tu propio entorno, sigue estos pasos:
Configura MongoDB en Atlas de forma local
Inicie sesión en su portal de MongoDB Atlas y cree una base de datos con el nombre que elija para almacenar los datos.
Guarda la cadena de conexión para los siguientes pasos.
Asegúrate de que tu dirección IP esté añadida a la lista de acceso para las implementaciones de Atlas.
Activar el acceso a AWS Bedrock
Configura tus credenciales para el acceso a AWS Bedrock:
Configura tu AWS CLI o crea roles de IAM con permisos de Bedrock para el acceso al modelo Haiku de Claude 3. Si trabajas con un inicio de sesión SSO, puedes ejecutar el siguiente comando para configurar esta conexión:
aws sso login Sigue las instrucciones para iniciar sesión.
Cierra el navegador cuando hayas terminado y luego continúa con los siguientes pasos.
Configura las variables ambientales
Utiliza el archivo ./generate_env.sh para generar las configuraciones de tus plantillas.
Actualice el archivo .env generado con su configuración especifica:
MONGODB_URI=mongodb+srv://<user>:<password>@<cluster-url>/?retryWrites=true&w=majority MONGODB_DB=your_database_name AWS_REGION=us-east-1 AWS_ACCESS_KEY_ID=your_access_key (if used) AWS_SECRET_ACCESS_KEY=your_secret_key (if used) SECRET_KEY=your_secure_secret_key LLM_PROVIDER=bedrock
Implementa ambos servicios con el Makefile.
En dos terminales diferentes, ejecuta los siguientes comandos para iniciar los servicios de forma independiente:
Terminal 1: Sistema backend
make backend
Terminal 2: Interfaz de usuario
make frontend
Una vez que completes estos pasos, podrás usar tu asistente médico con IA totalmente funcional. Encontrarás todos los recursos a continuación en las siguientes URLs:
Frontend: http://localhost:3000
API docs: http://localhost:8000/docs
verificación de estado: http://localhost:8000/health
Lecciones clave
Automatice la extracción de datos y reduzca los errores manuales: La dependencia de los clínicos para extraer manualmente información de PDFs, escaneos e informes en texto libre hace que los procesos sean ineficientes y aumenta los errores por fallos humanos. A medida que los historiales de los pacientes aumentan en tamaño y complejidad, mantener un enfoque manual introduce inconsistencias en los registros y retrasa la toma de decisiones clínicas.
Potenciar los equipos clínicos mediante IA: El valor de la IA en este contexto no reside en la toma de decisiones autónoma, sino en la extracción rápida y coherente de entidades médicas estructuradas a partir de datos no estructurados. Al realizar el procesamiento de datos clínicos de múltiples documentos y generar informes útiles, esta solución impulsada por IA ayuda a los equipos clínicos a gestionar los desafíos de documentación sin alterar el flujo de trabajo de toma de decisiones.
Personalización de la extracción de entidades médicas con plantillas: Las diferentes especialidades médicas tienen diferentes requisitos de datos. Los equipos de oncología, cardiología y traumatología no buscan las mismas señales en los documentos de los pacientes. Esta extracción de entidades dirigida por plantillas ayuda a los sistemas de IA a adaptarse a diferentes situaciones clínicas, garantizando que los resultados sean relevantes, utilizables y alineados con las necesidades de cada especialidad.
Preservar la procedencia y la auditabilidad: MongoDB ayuda a retener el contexto completo de la extracción, incluidas las versiones de plantilla y la procedencia, lo que permite a los profesionales médicos rastrear cada hecho extraído hasta su fuente.
Autores
Patricia Renart Carnicero, MongoDB
Francesc Mateu Amengual, MongoDB
Sakshi Gark, MongoDB