Atlas Data Federation se adhiere a los siguientes principios:
Secure Connections: When using Atlas Data Federation, instancias federadas de base de datos reside in regional VPCs. Todo el tráfico de datos hacia los clusters de Atlas o el almacenamiento en la nube utiliza cifrado TLS, que es la principal forma de seguridad de red disponible con Atlas Data Federation. Si tu instancia de la base de datos federada y la fuente de datos (clúster de Atlas, S3, Blob o Google Cloud Almacenamiento) comparten el mismo proveedor de nube, el tráfico de datos utiliza la infraestructura de red del mismo o internet pública, dependiendo de las capacidades del proveedor de nube. Si están en diferentes proveedores de nube, el tráfico de datos utiliza Internet público.
Query Routing: Atlas Data Federation y las instancias federadas de base de datos usan una interfaz unificada que abstrae las fuentes de datos subyacentes para rutar queries entre varias fuentes de datos. Las instancias federadas de base de datos permiten el acceso a fuentes de datos externas creando colecciones virtuales para representar datos externos en un formato similar a MongoDB. Las bases de datos lógicas agrupan colecciones virtuales y colecciones de clústeres conectadas en namespaces unificados para una consulta sin interrupciones entre diversas fuentes de datos.
Análisis de queries: Cuando ejecutas una query, Atlas Data Federation la analiza y planifica rutas de ejecución eficientes a través de las fuentes de datos mapeadas en las colecciones virtuales. Atlas aplica operaciones, como filtrado y agregación, a la fuente cuando es posible. Para otras operaciones, como uniones o agregaciones entre varias fuentes, la instancia federada de base de datos recupera y procesa los datos internamente, y luego combina los resultados dentro de la base de datos lógica para entregar un conjunto de resultados unificado. Esto te permite consultar diversas fuentes de datos como si fueran una sola base de datos.
El siguiente diagrama ilustra estos principios:

Plano de datos
El Data Plane en el diagrama anterior es donde reside tu información. Puede configurar la Federación de Datos de Atlas para acceder a los datos en una variedad de servicios de almacenamiento. Específicamente, puedes configurar Atlas Data Federation para acceder a datos en tus AWS S3 buckets, contenedor es de almacenamiento en Blob de Azure, buckets en Google Cloud Storage, clústeres de Atlas, ficheros en linea de Atlas y URL HTTP y HTTPS. Para obtener más información sobre la configuración de Atlas Data Federation para acceder a sus almacenes de datos, consulte Configurar almacenes de datos para una instancia de base de datos federada.
Plano de Cómputo
Atlas Data Federation preserva la localidad de los datos y maximiza el procesamiento local, cuando sea posible, para minimizar la transferencia de datos y optimizar el rendimiento. El plano de cómputo en el diagrama anterior muestra dónde Atlas Data Federation procesa todas las solicitudes. Atlas Data Federation utiliza un pool elástico de agentes en la región más cercana a tu almacén de datos para procesar estos datos para tus queries. Para aprender más sobre las regiones admitidas, consulta Regiones de Atlas Data Federation.
Atlas Data Federation no persiste los datos subyacentes, pero sí persiste temporalmente los datos del cursor en la región frontal de la conexión. Cualquier metadatos necesario para la ejecución de la query se almacena en el backend global. Utilizar una región de frontend que sea la misma que tu región de datos puede ayudar a cumplir con las regulaciones de soberanía de datos.
Plano de control
El Control Plane en el diagrama anterior gestiona funciones clave como la terminación de TLS, la gestión de cursores y el almacenar temporalmente datos de cursores durante la ejecución de queries. También se coordina con el plano de cómputo, que procesa consultas de query y agrega resultados finales.
Cuando ejecutas una query, primero es procesada por el Control Plane, que determina la estrategia de ejecución más eficiente. Esta consulta planificada se distribuye luego al Plano de Cómputo, que ejecuta la lógica de la query directamente contra sus almacenes de datos y devuelve los resultados al Plano de Control. Si tu única fuente de datos es un único clúster de Atlas, el Control Plane emite la query directamente al clúster, omitiendo el Compute Plane y simplificando la operación. Para obtener más información, consulta Realizar consultas en una instancia federada de base de datos.
Después, puedes configurar control de acceso basado en roles para tus instancias federadas de base de datos. Puedes controlar cómo tu cliente se conecta a tu instancia federada de base de datos, ya sea a través de una opción de conexión global o fijándola a una región específica. Para obtener más información, consulta Configurar la conexión para tu instancia federada de base de datos.