Join us at MongoDB.local London on 7 May to unlock new possibilities for your data. Use WEB50 to save 50%.
Register now >
Docs Menu
Docs Home
/

Atención médica impulsada por IA con MongoDB y Microsoft

MongoDB y Microsoft ofrecen soluciones impulsadas por IA para la atención del cáncer de mama, unificando datos y permitiendo el modelado predictivo, chatbots inteligentes y análisis.

caso de uso: Análisis, Gen IA, Interoperabilidad

Industrias: Salud

Productos y herramientas: MongoDB Atlas, MongoDB Atlas Search, MongoDB Atlas Vector Search, MongoDB Atlas Data Federation, MongoDB Atlas Charts

Socios: Microsoft

Esta solución, denominada "Leafy Hospital", integra MongoDB Atlas e IA de Microsoft para mejorar el diagnóstico del cáncer de mama y la atención a los pacientes. Este sistema aprovecha la plataforma de datos flexibles de MongoDB para unificar los metadatos operativos y los datos de IA, y los combina con productos de Microsoft como Azure OpenAI, Microsoft Fabric y Power BI para crear una solución completa de análisis y diagnóstico sanitario. La solución demuestra tres enfoques tecnológicos clave:

  • IA predictiva para detección temprana: Utilizar modelos de aprendizaje profundo para analizar mamografías y predecir las puntuaciones del sistema BI-RADS (Breast Imaging-Reporte and Data System).

  • IA generativa para la automatización de flujos de trabajo: Utiliza capacidades de búsqueda vectorial y chatbots potenciados por generación de recuperación aumentada (RAG) para la recuperación inteligente de información.

  • Análisis avanzado: combine información operativa en tiempo real con análisis de tendencias a largo plazo mediante la integración de Power BI.

Esta solución permite a los proveedores de atención médica optimizar los procesos de diagnóstico, automatizar la documentación clínica y tomar decisiones basadas en datos, garantizando al mismo tiempo el manejo seguro de la información confidencial de los pacientes.

El siguiente diagrama ilustra cómo Leafy Hospital Solution integra varios componentes:

Arquitectura de solución de Leafy Hospital

Figura 1. Arquitectura de la solución hospitalaria Leafy

Esta solución integra componentes en tres áreas tecnológicas principales:

  1. Capa de IA predictiva (caja amarilla inferior)

    • Procesa imágenes de mamografías y datos clínicos.

    • Gestiona la puntuación BI-RADS y el análisis del tipo de biopsia.

    • Determina la clasificación benigna o maligna.

    • Recibe imágenes desde Azure Blob almacenamiento.

    • Genera datos operativos en MongoDB Atlas.

  2. Capa de IA generativa (caja morada del medio)

    • Se integra con MongoDB Atlas mediante Azure IA Studio.

    • Permite la generación automatizada de informes para documentación clínica.

    • Cuenta con un chatbot con capacidad de responder preguntas.

    • Procesa datos operativos y vectoriales de Atlas.

    • Facilita las interacciones en lenguaje natural con el sistema.

  3. Capa avanzada de análisis (cuadro verde central)

    • Combina Fabric Power BI y Fabric OneLake.

    • Genera informes y paneles a partir de datos procesados.

    • Se integra con MongoDB Atlas para la visualización de datos.

    • Proporciona capacidades de análisis integral.

Las imágenes médicas que se almacenan primero en Azure Blob Storage se procesan luego a través de las distintas capas:

  1. Las imágenes y el flujo de datos operativos pasan por Fabric Data Science para el procesamiento de IA.

  2. Los resultados se almacenan en MongoDB Atlas, que funciona como la base de datos operativa central.

  3. Azure AI Studio gestiona tareas de IA generativa utilizando los datos almacenados.

  4. Finalmente, Fabric Power BI y OneLake permiten análisis avanzados y visualización.

Esta arquitectura garantiza un flujo sin interrupciones de información, desde los datos médicos en bruto hasta perspectivas procesables, manteniendo la seguridad y el rendimiento en todo el sistema.

La demostración de Leafy Hospital muestra la integración de MongoDB Atlas con los servicios de inteligencia artificial y análisis de Microsoft a través de varios componentes clave, que se describen en las siguientes secciones.

Para obtener una guía detallada paso a paso sobre la implementación de esta solución, incluidos ejemplos de código e instrucciones de configuración específicas, visite el repositorio de GitHub de esta solución.

En esta solución, MongoDB Atlas sirve como base de datos operativa para aplicaciones de IA en tiempo real, mientras que Microsoft OneLake gestiona el análisis de tendencias a largo plazo. Esta arquitectura permite las siguientes funcionalidades:

  • Procesamiento en tiempo real de datos de pacientes e imágenes médicas.

  • Integración entre sistemas operativos y analíticos.

  • Flujo de datos eficiente desde el procesamiento transaccional hasta el analítico.

  • Soporte tanto para consultas operativas con tiempos de respuesta en milisegundos como para cargas de trabajo analíticas complejas.

Canalización de datos analíticos en tiempo real

Figura 2: Canalización de datos analíticos en tiempo real

La IA predictiva se puede utilizar en el ámbito sanitario para generar diagnósticos precisos a partir de grandes conjuntos de datos. Microsoft Fabric Data Science ofrece una plataforma robusta para entrenar y experimentar con modelos de aprendizaje automático (ML) y gestionar ciclos de operaciones de aprendizaje automático (MLOps). Esta solución utiliza modelos para los siguientes fines:

  1. Predicción BI-RADS

    BI-RADS es un mecanismo estándar en la industria para analizar los hallazgos de mamografías. Los especialistas en salud utilizan BI-RADS para describir los resultados de las pruebas de imágenes mamarias con un número del 0 al 6, la posibilidad de malignidad aumenta con la puntuación.

    Esta solución utiliza la red neuronal convolucional profunda VGG16 (CNN) para predecir los puntajes BI-RADS a partir de imágenes. El modelo se entrena con mamografías de un conjunto de datos de Kaggle. Cada imagen está agrupada en carpetas que corresponden a su BI-RADS.

    Fabric Data Science analiza el rendimiento de múltiples modelos para esta tarea y selecciona el mejor. Entrena los modelos, ejecuta experimentos y administra múltiples versiones. Las imágenes de entrenamiento se cargan directamente en Lakehouse en OneLake desde el equipo local del usuario mediante la interfaz de usuario de Lakehouse. Además, puede referenciar fácilmente las imágenes almacenadas en Azure Blob Storage mediante wget o curl comandos, utilizando atajos, o utilizando un pipeline de datos. La solución almacena los metadatos de la imagen y las predicciones finales en MongoDB Atlas.

  2. Clasificación de biopsias

    Los modelos de clasificación o regresión permiten clasificar tumores como malignos o benignos. El modelo clasificador de bosque aleatorio se entrena con un conjunto de datos de Kaggle que incluye parámetros de entrada como el grosor del grupo, la uniformidad del tamaño y la forma celular, los núcleos desnudos y las mitosis. El modelo puede predecir si un tumor es maligno o benigno. En producción, se pueden añadir más parámetros al conjunto de datos y entrenar el modelo con estos valores para realizar predicciones más precisas. Durante el desarrollo de la solución, el modelo de bosque aleatorio tuvo una precisión superior al 97%. La solución obtiene el conjunto de datos de entrenamiento de MongoDB Atlas y el resultado de la predicción se actualiza en MongoDB mediante el conector Spark de MongoDB.

Fabric Data Science facilita el entrenamiento y la gestión de sus modelos al registrar automáticamente los parámetros relacionados para cada modelo y experimento.

El sistema de consulta inteligente de esta solución se basa en Vector Search, como se muestra en el siguiente diagrama.

Flujo del proceso de implementación de búsqueda vectorial

Figura 3. Flujo del proceso de implementación de búsqueda vectorial

  1. Preparación de datos:

    • El modelo text-embedding-ada-002 de Azure OpenAI procesa notas clínicas.

    • Los datos se convierten en incrustaciones vectoriales para una representación espacial de alta dimensión.

    • Las incrustaciones vectoriales se almacenan en MongoDB Atlas con índices de búsqueda optimizados.

  2. Procesamiento de query:

    • Las consultas en lenguaje natural se convierten en representaciones vectoriales.

    • La comprensión semántica permite queries médicas complejas.

    • Los vectores de consulta se comparan con las incrustaciones almacenadas.

  3. Document retrieval:

    • Devuelve registros médicos relevantes según la coincidencia semántica.

    • Facilita el acceso intuitivo a la información del paciente.

    • Atlas búsqueda vectorial ejecuta búsquedas basadas en similitud.

La implementación del chatbot aprovecha la arquitectura RAG en los siguientes contextos, como se muestra en el siguiente diagrama:

Guía para la arquitectura del Chatbot

Figura 4. Hoja de ruta para la arquitectura del chatbot

  1. Recuperación de información del paciente:

    • Ejecuta consultas para obtener los detalles actuales del paciente.

    • Recupera datos estructurados de pacientes de colecciones de MongoDB.

    • Proporciona acceso inmediato a información crítica del paciente.

  2. Procesamiento de datos históricos:

    • Accede al historial de pacientes de 10años de MongoDB Atlas.

    • Decodifica y resume datos históricos a través de Azure OpenAI LLM.

    • Implementa encadenamiento de pensamientos para obtener respuestas conscientes del contexto.

  3. Integración de conocimientos médicos:

    • Usa documentación médica vectorizada.

    • Realiza búsquedas vectoriales en tiempo real basadas en el contexto de la query.

    • Integra literatura médica relevante y estudios de casos.

Esta solución utiliza las siguientes dos plataformas de visualización para análisis.

En primer lugar, MongoDB Atlas Charts ofrece tableros operativos nativos y en tiempo real conectados directamente a los datos de MongoDB. Permite obtener perspectivas inmediatas sobre métricas críticas de atención médica mediante visualizaciones intuitivas sin necesidad de transformaciones de datos ni herramientas adicionales. El tablero operativo (Figura 5) muestra métricas clave, incluyendo el número de pacientes, el estado de las citas y la distribución de la clínica.

Atlas Charts tablero

Figura 5. Tablero operativo con Atlas Charts

En segundo lugar, la integración con Power BI amplía las capacidades analíticas, permitiendo un análisis de datos a nivel empresarial y visualizaciones avanzadas. A través del MongoDB Atlas Connector, los datos de atención de la salud pueden combinarse con otras fuentes empresariales en Microsoft OneLake. El tablero de visualización geográfica (Figura 6) muestra esta integración, presentando la distribución de pacientes y permitiendo capacidades analíticas sofisticadas.

Integración de PowerBI con MongoDB Atlas

Figura 6. Integración de PowerBI con MongoDB Atlas

Juntas, estas plataformas proporcionan una solución analítica completa que gestiona tanto las necesidades operativas inmediatas como los requisitos analíticos a largo plazo.

Esta solución demuestra cómo MongoDB Atlas puede gestionar datos operativos, funciones de búsqueda vectorial y requisitos analíticos, integrándose a la perfección con las herramientas de IA y visualización de Microsoft. Esta arquitectura permite a los profesionales sanitarios aprovechar la información operativa en tiempo real y las capacidades analíticas a largo plazo en un único sistema.

  • Plataforma unificada de datos: MongoDB Atlas actúa como un repositorio central que unifica datos operativos, metadatos y datos de IA, permitiendo la integración fluida entre diferentes componentes del sistema de salud.

  • Capacidades de integración de IA: La arquitectura demuestra cómo diferentes tipos de IA, como la predictiva, generativa y analítica, pueden integrarse eficazmente en una única solución sanitaria utilizando los servicios de IA de Microsoft y MongoDB Atlas.

  • Automatización del flujo de trabajo: La solución muestra cómo la IA puede automatizar flujos de trabajo críticos en el cuidado de la salud, desde predicciones de diagnóstico hasta la generación de informes. También permite la consulta inteligente a través de chatbots, reduciendo el esfuerzo manual y los posibles errores.

  • Análisis escalables: La combinación de MongoDB Atlas con Microsoft Fabric y Power BI permite tanto el análisis operativo en tiempo real como el análisis de tendencias a largo plazo, proporcionando perspectivas integrales para la toma de decisiones en salud.

  • Arquitectura segura para el sector sanitario: La solución ejemplifica cómo compilar un sistema sanitario moderno que mantenga la seguridad y privacidad de los datos y, al mismo tiempo, permita capacidades avanzadas de IA y análisis de datos.

  • Francesc Mateu, MongoDB

  • Diana Annie Jenosh, MongoDB

  • Sebastian Rojas Arbulu, MongoDB

  • Automatizar la suscripción digital con aprendizaje automático

  • Optime el rendimiento de la IA con MongoDB Atlas y Fireworks AI

  • Conversión de noticias de texto a audio con IA generativa

Volver

Acelerador de modernización de pagos

En esta página