Atlas Data Federation se adhiere a los siguientes principios:
Conexiones seguras: al utilizar Atlas Data Federation, las instancias de bases de datos federadas residen en VPC.Todo el tráfico de datos a clústeres de Atlas o almacenamiento en la nube utiliza cifrado TLS, que es la principal forma de seguridad de red disponible con Atlas Data Federation. Si su instancia de base de datos federada y su origen de datos (clúster de Atlas, S,3 blob o Google Cloud Storage) comparten el mismo proveedor de nube, el tráfico de datos utiliza la infraestructura de red de dicho proveedor o la red pública de internet, según sus capacidades. Si se encuentran en diferentes proveedores de nube, el tráfico de datos utiliza la red pública de internet.
Query Routing: Atlas Data Federation y las instancias federadas de base de datos usan una interfaz unificada que abstrae las fuentes de datos subyacentes para rutar queries entre varias fuentes de datos. Las instancias federadas de base de datos permiten el acceso a fuentes de datos externas creando colecciones virtuales para representar datos externos en un formato similar a MongoDB. Las bases de datos lógicas agrupan colecciones virtuales y colecciones de clústeres conectadas en namespaces unificados para una consulta sin interrupciones entre diversas fuentes de datos.
Análisis de consultas: Al ejecutar una consulta, Atlas Data Federation la analiza y planifica rutas de ejecución eficientes en las fuentes de datos asignadas a las colecciones virtuales. Atlas transfiere operaciones, como el filtrado y la agregación, a la fuente siempre que sea posible. Para otras operaciones, como uniones o agregaciones en múltiples fuentes, la instancia de base de datos federada recupera y procesa los datos internamente y, a continuación, combina los resultados dentro de la base de datos lógica para generar un conjunto de resultados unificado. Esto permite consultar diversas fuentes de datos como si fueran una sola base de datos.
El siguiente diagrama ilustra estos principios:

Plano de datos
El plano de datos del diagrama anterior es donde residen sus datos. Puede configurar Atlas Data Federation para acceder a los datos en diversos servicios de almacenamiento. En concreto, puede configurar Atlas Data Federation para acceder a los datos en sus buckets de AWS S,3 contenedores de Azure Blob Storage, buckets de Google Cloud Storage, clústeres de Atlas, Atlas Online Archives y URL HTTPy HTTPS. Para obtener más información sobre cómo configurar Atlas Data Federation para acceder a sus almacenes de datos, consulte Configurar almacenes de datos para una instancia de base de datos federada.
Plano de cálculo
Atlas Data Federation preserva la localidad de los datos y maximiza el procesamiento local, cuando sea posible, para minimizar la transferencia de datos y optimizar el rendimiento. El plano de cómputo en el diagrama anterior muestra dónde Atlas Data Federation procesa todas las solicitudes. Atlas Data Federation utiliza un pool elástico de agentes en la región más cercana a tu almacén de datos para procesar estos datos para tus queries. Para aprender más sobre las regiones admitidas, consulta Regiones de Atlas Data Federation.
Atlas Data Federation no conserva los datos subyacentes, pero sí conserva temporalmente los datos del cursor en la región frontend de la conexión. Los metadatos necesarios para la ejecución de consultas se almacenan en el backend global. Usar una región frontend idéntica a la de datos puede contribuir al cumplimiento de las regulaciones de soberanía de datos.
Plano de control
El plano de control del diagrama anterior gestiona funciones clave como la terminación TLS, la gestión de cursores y el almacenamiento temporal de datos de cursor durante la ejecución de consultas. También se coordina con el plano de cómputo, que procesa las consultas del usuario y agrega los resultados finales.
Al ejecutar una consulta, el plano de control la procesa primero y determina la estrategia de ejecución más eficiente. Esta consulta planificada se distribuye posteriormente al plano de cómputo, que ejecuta la lógica de consulta directamente en los almacenes de datos y devuelve los resultados al plano de control. Si su única fuente de datos es un clúster de Atlas, el plano de control envía la consulta directamente al clúster, omitiendo el plano de cómputo y simplificando la operación. Para obtener más información,consulte Consultar una instancia de base de datos federada.
A continuación, puede configurar el control de acceso basado en roles para sus instancias de base de datos federada. Puede controlar cómo se conecta su cliente a su instancia de base de datos federada, ya sea mediante una opción de conexión global o vinculándola a una región específica. Para obtener más información, consulte Configurar la conexión para su instancia de base de datos federada.