Docs Menu
Docs Home
/

Atención médica impulsada por IA con MongoDB y Microsoft

MongoDB y Microsoft ofrecen soluciones impulsadas por IA para la atención del cáncer de mama, unificando datos y habilitando modelos predictivos, chatbots inteligentes y análisis.

Casos de uso: Análisis, Gen AI, Interoperabilidad

Industrias: Salud

Productos y herramientas: MongoDB Atlas, MongoDB Atlas Search, MongoDB Atlas Vector Search, MongoDB Atlas Data Federation, MongoDB Atlas Charts

Socios: Microsoft

Esta solución, denominada "Leafy Hospital", integra MongoDB Atlas y Microsoft AI para mejorar el diagnóstico de cáncer de mama y la atención a las pacientes. Este sistema aprovecha la plataforma de datos flexible de MongoDB para unificar metadatos operativos y datos de IA, y la combina con productos de Microsoft como Azure OpenAI, Microsoft Fabric y Power BI para crear una solución integral de análisis y diagnóstico de la salud. La solución demuestra tres enfoques tecnológicos clave:

  • IA predictiva para la detección temprana: utilice modelos de aprendizaje profundo para analizar mamografías y predecir las puntuaciones del sistema de datos e informes de imágenes mamarias (BI-RADS).

  • IA generativa para la automatización del flujo de trabajo: utilice capacidades de búsqueda vectorial y chatbots impulsados ​​por Retrieval-Augmented Generation (RAG) para la recuperación inteligente de información.

  • Análisis avanzado: combine información operativa en tiempo real con análisis de tendencias a largo plazo mediante la integración de Power BI.

Esta solución permite a los proveedores de atención médica optimizar los procesos de diagnóstico, automatizar la documentación clínica y tomar decisiones basadas en datos, garantizando al mismo tiempo el manejo seguro de la información confidencial de los pacientes.

El siguiente diagrama ilustra cómo la solución Leafy Hospital integra varios componentes:

Arquitectura de la solución Leafy Hospital

Figura 1. Arquitectura de la solución Leafy Hospital

Esta solución integra componentes de tres áreas tecnológicas principales:

  1. Capa de IA predictiva (cuadro amarillo inferior)

    • Procesa imágenes de mamografías y datos clínicos.

    • Maneja la puntuación BI-RADS y el análisis del tipo de biopsia.

    • Determina la clasificación maligna o benigna.

    • Recibe imágenes de Azure Blob Storage.

    • Genera datos operativos en MongoDB Atlas.

  2. Capa de IA generativa (recuadro morado central)

    • Se integra con MongoDB Atlas mediante Azure AI Studio.

    • Permite la generación automatizada de informes para la documentación clínica.

    • Cuenta con un chatbot con capacidad de responder preguntas.

    • Procesa datos operativos y vectoriales del Atlas.

    • Facilita las interacciones en lenguaje natural con el sistema.

  3. Capa de análisis avanzado (cuadro verde central)

    • Combina Fabric Power BI y Fabric OneLake.

    • Genera informes y paneles a partir de datos procesados.

    • Se integra con MongoDB Atlas para visualización de datos.

    • Proporciona capacidades de análisis integrales.

Las imágenes médicas que primero se almacenan en Azure Blob Storage luego se procesan a través de las distintas capas:

  1. Las imágenes y los datos operativos fluyen a través de Fabric Data Science para el procesamiento de IA.

  2. Los resultados se almacenan en MongoDB Atlas, que actúa como base de datos operativa central.

  3. Azure AI Studio gestiona tareas de IA generativa utilizando los datos almacenados.

  4. Por último, Fabric Power BI y OneLake permiten análisis y visualización avanzados.

Esta arquitectura garantiza un flujo continuo de información, desde datos médicos sin procesar hasta información procesable, manteniendo al mismo tiempo la seguridad y el rendimiento de todo el sistema.

La demostración de Leafy Hospital muestra la integración de MongoDB Atlas con los servicios de inteligencia artificial y análisis de Microsoft a través de varios componentes clave, que se describen en las siguientes secciones.

Para obtener una guía detallada paso a paso sobre la implementación de esta solución, incluidos ejemplos de código e instrucciones de configuración específicas, visite el repositorio de GitHub de esta solución.

En esta solución, MongoDB Atlas sirve como base de datos operativa para aplicaciones de IA en tiempo real, mientras que Microsoft OneLake gestiona el análisis de tendencias a largo plazo. Esta arquitectura permite las siguientes funcionalidades:

  • Procesamiento en tiempo real de datos de pacientes e imágenes médicas.

  • Integración entre sistemas operativos y analíticos.

  • Flujo de datos eficiente desde el procesamiento transaccional al analítico.

  • Admite consultas operativas con respuesta de milisegundos y cargas de trabajo analíticas complejas.

Canalización de datos analíticos en tiempo real

Figura 2: Canalización de datos analíticos en tiempo real

La IA predictiva se puede utilizar en el ámbito sanitario para generar diagnósticos precisos a partir de grandes conjuntos de datos. Microsoft Fabric Data Science ofrece una plataforma robusta para entrenar y experimentar con modelos de aprendizaje automático (ML) y gestionar ciclos de operaciones de aprendizaje automático (MLOps). Esta solución utiliza modelos para los siguientes fines:

  1. Predicción BI-RADS

    BI-RADS es un mecanismo estándar en la industria para analizar los hallazgos de las mamografías. Los especialistas en salud utilizan BI-RADS para describir los resultados de las pruebas de imagen mamaria con un valor de 0 a 6, donde la probabilidad de malignidad aumenta con la puntuación.

    Esta solución utiliza la16 red neuronal convolucional profunda (CNN) VGG para predecir las puntuaciones BI-RADS a partir de imágenes. El modelo se entrena con imágenes de mamografía de un conjunto de datos de Kaggle. Cada imagen se agrupa en carpetas que corresponden a su BI-RADS.

    Fabric Data Science analiza el rendimiento de múltiples modelos para esta tarea y selecciona el mejor. Entrena los modelos, ejecuta experimentos y administra múltiples versiones. Las imágenes de entrenamiento se cargan directamente en Lakehouse en OneLake desde el equipo local del usuario mediante la interfaz de usuario de Lakehouse. Además, puede referenciar fácilmente las imágenes almacenadas en Azure Blob Storage mediante wget o,curl mediante atajos o una canalización de datos. La solución almacena los metadatos de la imagen y las predicciones finales en MongoDB Atlas.

  2. Clasificación de biopsias

    Los modelos de clasificación o regresión permiten clasificar tumores como malignos o benignos. El modelo clasificador de bosque aleatorio se entrena con un conjunto de datos de Kaggle que incluye parámetros de entrada como el grosor del grupo, la uniformidad del tamaño y la forma celular, los núcleos desnudos y las mitosis. El modelo puede predecir si un tumor es maligno o benigno. En producción, se pueden añadir más parámetros al conjunto de datos y entrenar el modelo con estos valores para realizar predicciones más precisas. Durante el desarrollo de la solución, el modelo de bosque aleatorio tuvo una precisión superior al 97%. La solución obtiene el conjunto de datos de entrenamiento de MongoDB Atlas y el resultado de la predicción se actualiza en MongoDB mediante el conector Spark de MongoDB.

Fabric Data Science facilita el entrenamiento y la gestión de sus modelos al registrar automáticamente los parámetros relacionados para cada modelo y experimento.

El sistema de consulta inteligente de esta solución se basa en Vector Search, como se muestra en el siguiente diagrama.

Flujo del proceso de implementación de búsqueda vectorial

Figura 3. Flujo del proceso de implementación de búsqueda vectorial

  1. Preparación de datos:

    • El modelo text-embedding-ada-002 de Azure OpenAI procesa notas clínicas.

    • Los datos se convierten en incrustaciones vectoriales para una representación espacial de alta dimensión.

    • Las incrustaciones vectoriales se almacenan en MongoDB Atlas con índices de búsqueda optimizados.

  2. Procesamiento de consultas:

    • Las consultas en lenguaje natural se convierten en representaciones vectoriales.

    • La comprensión semántica permite realizar consultas médicas complejas.

    • Los vectores de consulta se comparan con las incrustaciones almacenadas.

  3. Document retrieval:

    • Devuelve registros médicos relevantes según la coincidencia semántica.

    • Permite el acceso intuitivo a la información del paciente.

    • Atlas Vector Search ejecuta búsquedas basadas en similitud.

La implementación del chatbot aprovecha la arquitectura RAG en los siguientes contextos, como se muestra en el siguiente diagrama:

Plano para la arquitectura del Chatbot

Figura 4. Plano de la arquitectura del chatbot

  1. Recuperación de información del paciente:

    • Ejecuta consultas para obtener detalles actuales del paciente.

    • Recupera datos estructurados de pacientes de colecciones de MongoDB.

    • Proporciona acceso inmediato a información crítica del paciente.

  2. Procesamiento de datos históricos:

    • Accede al historial de pacientes de 10años desde MongoDB Atlas.

    • Descodifica y resume datos históricos a través de Azure OpenAI LLM.

    • Implementa encadenamiento de pensamientos para obtener respuestas conscientes del contexto.

  3. Integración de conocimientos médicos:

    • Utiliza documentación médica vectorizada.

    • Realiza búsquedas vectoriales en tiempo real según el contexto de la consulta.

    • Integra literatura médica relevante y estudios de casos.

Esta solución utiliza las siguientes dos plataformas de visualización para análisis.

En primer lugar, MongoDB Atlas Charts proporciona paneles operativos nativos en tiempo real, conectados directamente a los datos de MongoDB. Permite obtener información inmediata sobre métricas críticas de atención médica mediante visualizaciones intuitivas, sin necesidad de transformaciones de datos ni herramientas adicionales. El panel operativo (Figura 5) muestra métricas clave, como el número de pacientes, el estado de las citas y la distribución de las clínicas.

Panel de control de Atlas Charts

Figura 5. Panel de control operativo con gráficos Atlas

En segundo lugar, la integración con Power BI amplía las capacidades analíticas al permitir el análisis de datos a nivel empresarial y visualizaciones avanzadas. Mediante el Conector Atlas de MongoDB, los datos de atención médica se pueden combinar con otras fuentes empresariales en Microsoft OneLake. El panel de visualización geográfica 6 (Figura) muestra esta integración, mostrando la distribución de pacientes y habilitando sofisticadas capacidades analíticas.

Integración de PowerBI con MongoDB Atlas

Figura 6. Integración de PowerBI con MongoDB Atlas

Juntas, estas plataformas proporcionan una solución analítica completa que gestiona tanto las necesidades operativas inmediatas como los requisitos analíticos a largo plazo.

Esta solución demuestra cómo MongoDB Atlas puede gestionar datos operativos, funciones de búsqueda vectorial y requisitos analíticos, integrándose a la perfección con las herramientas de IA y visualización de Microsoft. Esta arquitectura permite a los profesionales sanitarios aprovechar la información operativa en tiempo real y las capacidades analíticas a largo plazo en un único sistema.

  • Plataforma de datos unificada: MongoDB Atlas funciona como un repositorio central que unifica datos operativos, metadatos y datos de IA, lo que permite una integración perfecta entre los diferentes componentes del sistema de atención médica.

  • Capacidades de integración de IA: la arquitectura demuestra cómo diferentes tipos de IA, como la predictiva, la generativa y la analítica, se pueden integrar de manera efectiva en una única solución de atención médica utilizando los servicios de IA de Microsoft y MongoDB Atlas.

  • Automatización del flujo de trabajo: La solución demuestra cómo la IA puede automatizar flujos de trabajo críticos en el ámbito sanitario, desde las predicciones diagnósticas hasta la generación de informes. También permite realizar consultas inteligentes mediante chatbots, lo que reduce el esfuerzo manual y los posibles errores.

  • Análisis escalables: la combinación de MongoDB Atlas con Microsoft Fabric y Power BI permite realizar análisis operativos en tiempo real y análisis de tendencias a largo plazo, lo que proporciona información completa para la toma de decisiones en el ámbito sanitario.

  • Arquitectura de atención médica segura: la solución ejemplifica cómo construir un sistema de atención médica moderno que mantenga la seguridad y la privacidad de los datos al tiempo que permite capacidades avanzadas de inteligencia artificial y análisis de datos.

  • Francesc Mateu, MongoDB

  • Diana Annie Jenosh, MongoDB

  • Sebastian Rojas Arbulu, MongoDB

  • Automatizar la suscripción digital con aprendizaje automático

  • Optimice el rendimiento de la IA con MongoDB Atlas y Fireworks AI

  • Conversión de noticias de texto a audio con IA generativa

Volver

Acelerador de modernización de pagos

En esta página