Make the MongoDB docs better! We value your opinion. Share your feedback for a chance to win $100.
MongoDB Branding Shape
Click here >
Docs Menu

Atención médica impulsada por IA con MongoDB y Microsoft

MongoDB y Microsoft ofrecen soluciones impulsadas por IA para la atención del cáncer de mama, unificando datos y permitiendo el modelado predictivo, chatbots inteligentes y análisis.

caso de uso: Análisis, Gen IA, Interoperabilidad

Industrias: Salud

Productos y herramientas: MongoDB Atlas, MongoDB Atlas Search, MongoDB Atlas Vector Search, MongoDB Atlas Data Federation, MongoDB Atlas Charts

emparejar: Microsoft

Esta solución, denominada "Leafy Hospital", integra MongoDB Atlas e IA de Microsoft para mejorar el diagnóstico del cáncer de mama y la atención a los pacientes. Este sistema aprovecha la plataforma de datos flexibles de MongoDB para unificar los metadatos operativos y los datos de IA, y los combina con productos de Microsoft como Azure OpenAI, Microsoft Fabric y Power BI para crear una solución completa de análisis y diagnóstico sanitario. La solución demuestra tres enfoques tecnológicos clave:

  • IA predictiva para detección temprana: Utilizar modelos de aprendizaje profundo para analizar mamografías y predecir las puntuaciones del sistema BI-RADS (Breast Imaging-Reporte and Data System).

  • IA generativa para la automatización de flujos de trabajo: Utiliza capacidades de búsqueda vectorial y chatbots potenciados por generación de recuperación aumentada (RAG) para la recuperación inteligente de información.

  • Análisis avanzado: Combine perspectivas operativas en tiempo real con el análisis de tendencias a largo plazo mediante la integración con Power BI.

Esta solución permite a los proveedores de atención médica optimizar los procesos de diagnóstico, automatizar la documentación clínica y tomar decisiones basadas en datos, al mismo tiempo que garantiza el manejo seguro de información confidencial de los pacientes.

El siguiente diagrama ilustra cómo Leafy Hospital Solution integra varios componentes:

Arquitectura de solución de Leafy Hospital

Figura 1. Arquitectura de la solución hospitalaria Leafy

Esta solución integra componentes en tres áreas tecnológicas principales:

  1. Capa de IA predictiva (caja amarilla inferior)

    • Procesa imágenes de mamografías y datos clínicos.

    • Gestiona la puntuación BI-RADS y el análisis del tipo de biopsia.

    • Determina la clasificación benigna o maligna.

    • Recibe imágenes desde Azure Blob almacenamiento.

    • Genera datos operativos en MongoDB Atlas.

  2. Capa de IA generativa (caja morada del medio)

    • Se integra con MongoDB Atlas mediante Azure IA Studio.

    • Permite la generación automatizada de informes para documentación clínica.

    • Incluye una funcionalidad de chatbot para capacidades de pregunta-respuesta.

    • Procesa datos operativos y vectoriales de Atlas.

    • Facilita las interacciones del lenguaje natural con el sistema.

  3. Capa avanzada de análisis (cuadro verde central)

    • Combina Fabric Power BI y Fabric OneLake.

    • Genera informes y tableros a partir de los datos procesados.

    • Se integra con MongoDB Atlas para la visualización de datos.

    • Proporciona capacidades de análisis integral.

Las imágenes médicas que se almacenan primero en Azure Blob Storage se procesan luego a través de las distintas capas:

  1. Las imágenes y el flujo de datos operativos pasan por Fabric Data Science para el procesamiento de IA.

  2. Los resultados se almacenan en MongoDB Atlas, que funciona como la base de datos operativa central.

  3. Azure AI Studio gestiona tareas de IA generativa utilizando los datos almacenados.

  4. Finalmente, Fabric Power BI y OneLake permiten análisis avanzados y visualización.

Esta arquitectura garantiza un flujo sin interrupciones de información, desde los datos médicos en bruto hasta perspectivas procesables, manteniendo la seguridad y el rendimiento en todo el sistema.

La demostración de Leafy Hospital muestra la integración de MongoDB Atlas con los servicios de IA y análisis de Microsoft a través de varios componentes clave, que se describen en las siguientes secciones.

Para obtener una guía detallada paso a paso sobre cómo implementar esta solución, incluidas muestras de código e instrucciones específicas de configuración, visite el repositorio de GitHubde esta solución.

En esta solución, MongoDB Atlas sirve como base de datos operativa para aplicaciones de IA en tiempo real, mientras que Microsoft OneLake gestiona el análisis de tendencias a largo plazo. Esta arquitectura permite las siguientes funcionalidades:

  • Procesamiento en tiempo real de datos de pacientes e imágenes médicas.

  • Integración entre sistemas operativos y analíticos.

  • Flujo de datos eficiente desde el procesamiento transaccional hasta el analítico.

  • Soporte tanto para consultas operativas con tiempos de respuesta en milisegundos como para cargas de trabajo analíticas complejas.

pipeline de datos en tiempo real para análisis

Figura 2: pipeline de datos en tiempo real a análisis

La IA predictiva puede utilizarse en sanidad para generar un diagnóstico preciso a partir de grandes conjuntos de datos. Microsoft Fabric Data Science presenta una plataforma sólida para entrenar y experimentar con modelos de aprendizaje automático y administrar ciclos de MLOps. Esta solución utiliza modelos para los siguientes fines:

  1. Predicción BI-RADS

    BI-RADS es un mecanismo estándar en la industria para analizar los hallazgos de mamografías. Los especialistas en salud utilizan BI-RADS para describir los resultados de las pruebas de imágenes mamarias con un número del 0 al 6, la posibilidad de malignidad aumenta con la puntuación.

    Esta solución utiliza la red neuronal convolucional profunda VGG16 (CNN) para predecir los puntajes BI-RADS a partir de imágenes. El modelo se entrena con mamografías de un conjunto de datos de Kaggle. Cada imagen está agrupada en carpetas que corresponden a su BI-RADS.

    Fabric Data Science analiza el rendimiento de varios modelos para esta tarea y selecciona el mejor. Entrena los modelos, ejecuta experimentos y gestiona múltiples versiones. Las imágenes de entrenamiento se cargan directamente en Lakehouse dentro de OneLake desde la máquina local del usuario mediante la Interfaz de Usuario de Lakehouse. Además, puedes hacer referencia fácilmente a las imágenes almacenadas en Azure Blob Storage utilizando los comandos wget o curl, utilizando accesos directos, o mediante un pipeline de datos. La solución almacena los metadatos de la imagen y las predicciones finales en MongoDB Atlas.

  2. Clasificación de la biopsia

    Los modelos de clasificación o regresión pueden utilizarse para clasificar tumores como malignos o benignos. El modelo clasificador de bosque aleatorio se entrena en un conjunto de datos de Kaggle que incluye parámetros de entrada como el grosor de los aglomerados, la uniformidad del tamaño y la forma de las células, los núcleos desnudos y las mitosis. Luego, el modelo puede predecir si un tumor es maligno o benigno. En producción, puede agregar más parámetros al conjunto de datos y entrenar el modelo con estos valores para hacer predicciones más precisas. Durante el desarrollo de la solución, el modelo de bosque aleatorio tuvo una tasa de precisión superior al 97%. La solución obtiene el conjunto de datos de entrenamiento de MongoDB Atlas, y el resultado de la predicción se actualiza en MongoDB utilizando el MongoDB Spark Connector.

Fabric Data Science facilita el entrenamiento y la gestión de modelos al registrar automáticamente los parámetros relacionados con cada modelo y experimento.

El sistema de query inteligente de esta solución se basa en la Búsqueda Vectorial, como se muestra en el diagrama siguiente.

Flujo de proceso de implementación de búsqueda vectorial

Figura 3. Flujo del proceso de implementación de búsqueda vectorial

  1. Preparación de datos:

    • El modelo text-embedding-ada-002 de Azure OpenAI procesa notas clínicas.

    • Los datos se convierten en incrustaciones vectoriales para su representación en un espacio de alta dimensión.

    • Las incrustaciones vectoriales se almacenan en MongoDB Atlas con índices de búsqueda optimizados.

  2. Procesamiento de query:

    • Las consultas en lenguaje natural se convierten en representaciones vectoriales.

    • La comprensión semántica permite queries médicas complejas.

    • Los vectores de query se comparan con las incrustaciones almacenadas.

  3. Document retrieval:

    • Devuelve registros médicos relevantes según la coincidencia semántica.

    • Facilita el acceso intuitivo a la información del paciente.

    • Atlas búsqueda vectorial ejecuta búsquedas basadas en similitud.

La implementación del bot conversacional aprovecha la arquitectura RAG en los siguientes contextos, como se muestra en el siguiente diagrama:

Guía para la arquitectura del Chatbot

Figura 4. Hoja de ruta para la arquitectura del chatbot

  1. Recuperación de información del paciente:

    • Ejecuta consultas para obtener los detalles actuales del paciente.

    • Recupera datos estructurados de pacientes desde las colecciones de MongoDB.

    • Proporciona acceso inmediato a información crítica del paciente.

  2. Procesamiento de datos históricos:

    • Accede al historial de pacientes de 10años de MongoDB Atlas.

    • Decodifica y resume datos históricos a través de Azure OpenAI LLM.

    • Implementa encadenamiento de ideas para respuestas conscientes del contexto.

  3. Integración de conocimientos médicos:

    • Usa documentación médica vectorizada.

    • Realiza búsquedas vectoriales en tiempo real basadas en el contexto de la query.

    • Integra literatura médica relevante y estudios de casos.

Esta solución utiliza las siguientes dos plataformas de visualización para análisis.

En primer lugar, MongoDB Atlas Charts ofrece tableros operativos nativos y en tiempo real conectados directamente a los datos de MongoDB. Permite obtener perspectivas inmediatas sobre métricas críticas de atención médica mediante visualizaciones intuitivas sin necesidad de transformaciones de datos ni herramientas adicionales. El tablero operativo (Figura 5) muestra métricas clave, incluyendo el número de pacientes, el estado de las citas y la distribución de la clínica.

Atlas Charts tablero

Figura 5. Tablero operativo con Atlas Charts

En segundo lugar, la integración con Power BI amplía las capacidades analíticas, permitiendo un análisis de datos a nivel empresarial y visualizaciones avanzadas. A través del MongoDB Atlas Connector, los datos de atención de la salud pueden combinarse con otras fuentes empresariales en Microsoft OneLake. El tablero de visualización geográfica (Figura 6) muestra esta integración, presentando la distribución de pacientes y permitiendo capacidades analíticas sofisticadas.

Integración de PowerBI con MongoDB Atlas

Figura 6. Integración de PowerBI con MongoDB Atlas

Juntas, estas plataformas proporcionan una solución analítica completa que gestiona tanto las necesidades operativas inmediatas como los requisitos analíticos a largo plazo.

Esta solución demuestra cómo MongoDB Atlas puede gestionar datos operativos, capacidades de búsqueda vectorial y requisitos de análisis mientras se integra perfectamente con las herramientas de IA y visualización de Microsoft. Esta arquitectura permite a los proveedores de atención médica aprovechar perspectivas operativas en tiempo real y capacidades de análisis a largo plazo dentro de un único sistema.

  • Plataforma unificada de datos: MongoDB Atlas actúa como un repositorio central que unifica datos operativos, metadatos y datos de IA, permitiendo la integración fluida entre diferentes componentes del sistema de salud.

  • Capacidades de integración de IA: La arquitectura demuestra cómo diferentes tipos de IA, como la predictiva, generativa y analítica, pueden integrarse eficazmente en una única solución sanitaria utilizando los servicios de IA de Microsoft y MongoDB Atlas.

  • Automatización del flujo de trabajo: La solución muestra cómo la IA puede automatizar flujos de trabajo críticos en el cuidado de la salud, desde predicciones de diagnóstico hasta la generación de informes. También permite la consulta inteligente a través de chatbots, reduciendo el esfuerzo manual y los posibles errores.

  • Análisis escalables: La combinación de MongoDB Atlas con Microsoft Fabric y Power BI permite tanto el análisis operativo en tiempo real como el análisis de tendencias a largo plazo, proporcionando perspectivas integrales para la toma de decisiones en salud.

  • Arquitectura segura para el sector sanitario: La solución ejemplifica cómo compilar un sistema sanitario moderno que mantenga la seguridad y privacidad de los datos y, al mismo tiempo, permita capacidades avanzadas de IA y análisis de datos.

  • Francesc Mateu, MongoDB

  • Diana Annie Jenosh, MongoDB

  • Sebastian Rojas Arbulu, MongoDB