Atlas Data Federation se adhiere a los siguientes principios:
Conexiones seguras: al utilizar Atlas Data Federation, las instancias de bases de datos federadas residen en VPCs. Todo el tráfico de datos hacia los clústeres de Atlas o el almacenamiento en la nube utiliza cifrado TLS, que es la principal forma de seguridad de red disponible con la Federación de Datos de Atlas. Si tu instancia federada de base de datos y la fuente de datos (clúster de Atlas, S3, Blob o almacenamiento de Google Cloud) comparten el mismo proveedor de nube, el tráfico de datos utiliza la infraestructura de red del proveedor de nube o Internet pública, según las capacidades del proveedor de nube. Si se encuentran en diferentes proveedores de nube, el tráfico de datos utiliza el internet público.
Query Routing: Atlas Data Federation y las instancias federadas de base de datos usan una interfaz unificada que abstrae las fuentes de datos subyacentes para rutar queries entre varias fuentes de datos. Las instancias federadas de base de datos permiten el acceso a fuentes de datos externas creando colecciones virtuales para representar datos externos en un formato similar a MongoDB. Las bases de datos lógicas agrupan colecciones virtuales y colecciones de clústeres conectadas en namespaces unificados para una consulta sin interrupciones entre diversas fuentes de datos.
Análisis de queries: Cuando ejecutas una query, Atlas Data Federation la analiza y planifica rutas de ejecución eficientes a través de las fuentes de datos mapeadas en las colecciones virtuales. Atlas aplica operaciones, como filtrado y agregación, a la fuente cuando es posible. Para otras operaciones, como uniones o agregaciones entre varias fuentes, la instancia federada de base de datos recupera y procesa los datos internamente, y luego combina los resultados dentro de la base de datos lógica para entregar un conjunto de resultados unificado. Esto te permite consultar diversas fuentes de datos como si fueran una sola base de datos.
El siguiente diagrama ilustra estos principios:

Plano de datos
El Data Plane en el diagrama anterior es donde reside tu información. Puede configurar la Federación de Datos de Atlas para acceder a los datos en una variedad de servicios de almacenamiento. Específicamente, puede configurar Atlas Data Federation para acceder a datos en sus AWS S3 buckets, contenedores Azure Blob Storage, buckets Google Cloud Storage, clusters Atlas, Atlas Online Archives y HTTP y HTTPS URLs. Para aprender más sobre cómo configurar Atlas Data Federation para acceder a tus almacenes de datos, consulta Configure almacenes de datos para una instancia de base de datos federada.
Plano de Cómputo
Atlas Data Federation preserva la localidad de los datos y maximiza el procesamiento local, cuando sea posible, para minimizar la transferencia de datos y optimizar el rendimiento. El plano de cómputo en el diagrama anterior muestra dónde Atlas Data Federation procesa todas las solicitudes. Atlas Data Federation utiliza un pool elástico de agentes en la región más cercana a tu almacén de datos para procesar estos datos para tus queries. Para aprender más sobre las regiones admitidas, consulta Regiones de Atlas Data Federation.
Atlas Data Federation no conserva los datos subyacentes, pero sí conserva temporalmente los datos del cursor en la región frontend de la conexión. Los metadatos necesarios para la ejecución de consultas se almacenan en el backend global. Usar una región frontend idéntica a la de datos puede contribuir al cumplimiento de las regulaciones de soberanía de datos.
Plano de control
El Control Plane en el diagrama anterior gestiona funciones clave como la terminación de TLS, la gestión de cursores y el almacenar temporalmente datos de cursores durante la ejecución de queries. También se coordina con el plano de cómputo, que procesa consultas de query y agrega resultados finales.
Al ejecutar una consulta, el plano de control la procesa primero y determina la estrategia de ejecución más eficiente. Esta consulta planificada se distribuye posteriormente al plano de cómputo, que ejecuta la lógica de consulta directamente en los almacenes de datos y devuelve los resultados al plano de control. Si su única fuente de datos es un clúster de Atlas, el plano de control envía la consulta directamente al clúster, omitiendo el plano de cómputo y simplificando la operación. Para obtener más información,consulte Consultar una instancia de base de datos federada.
Después, puedes configurar control de acceso basado en roles para tus instancias federadas de base de datos. Puedes controlar cómo tu cliente se conecta a tu instancia federada de base de datos, ya sea a través de una opción de conexión global o fijándola a una región específica. Para obtener más información, consulta Configurar la conexión para tu instancia federada de base de datos.