/ /

Implementar una instancia federada de base de datos

Tiempo estimado de finalización: 15 minutos

Esta parte del tutorial te guía a través de la implementación de una instancia federada de base de datos utilizando los siguientes asistentes de introducción fácil en la Interfaz de Usuario de Atlas:

El asistente Feed Downstream Systems le ayuda a configurar una instancia federada de base de datos que exporta datos desde su clúster de Atlas, transforma los datos a Parquet, CSV, BSON, o MongoDB Extended JSON, y copia los datos a sus buckets de AWS S3 en intervalos especificados usando Atlas Triggers.
El asistente Explorar con datos de muestra te ayuda a configurar una instancia federada de base de datos cargada con datos de muestra para mostrar cómo conectarse a la instancia federada de base de datos y ejecutar queries.
El asistente Consulta de datos entre clústeres es útil para configurar una instancia federada de base de datos que acceda a datos desde varios clúster Atlas y así ejecutar queries federados entre colección de todos ellos.

Para obtener más información sobre las opciones de configuración de almacenamiento, consulta Configurar almacenes de datos para una instancia federada de base de datos.

Acceso requerido

Para implementar una instancia federada de base de datos, debe tener acceso a Project Owner en el proyecto.

Importante

Los usuarios con Organization Owner acceso deben agregarse como Project Owner al Proyecto antes de implementar su instancia federada de base de datos.

Requisitos previos

Para completar esta parte del tutorial, asegúrate de cumplir con los siguientes requisitos previos:

Crea una cuenta en MongoDB Atlas si aún no tienes una.
Para el asistente Feed Downstream Systems, necesita:
- La AWS CLI, configurada para acceder a tu cuenta de AWS. Alternativamente, debes tener acceso a la consola de gestión de AWS con permisos para crear roles de IAM.
- Un bucket S3 para almacenar datos extraídos.
- Por lo menos un clúster Atlas con una base de datos.
Para el asistente query Data Across clústeres, necesitas:
- Al menos un clúster de Atlas implementado en el mismo Proyecto que emplearás para tu instancia federada de base de datos.
- Al menos una colección de base de datos. Puedes cargar datos de muestra si aún no tienes colecciones.

Utilice el Asistente para los Sistemas Descendentes de Feeds

El asistente de Feed Downstream Systems te ayuda a configurar una instancia federada de base de datos que escribe datos continuamente desde tu clúster de Atlas a tu bucket de AWS S3 según un cronograma.

Inicie sesión en MongoDB Atlas.

Selecciona la opción Data Federation en la navegación de la izquierda.

Crear una instancia de base de datos federada.

Haz clic en el menú desplegable Create New Federated Database.
Seleccione Feed Downstream Systems.

Haz clic Get Starteden.

Escriba un nombre para su instancia de base de datos federada en el campo Federated Database Instance Name y haga clic en Continue.

Por defecto es FederatedDatabaseInstance[n]. Una vez que se crea tu instancia de base de datos federada, no puedes cambiar su nombre.

Especifique sus fuentes de datos.

Seleccione un clúster de Atlas para usar como fuente de datos desde el desplegable. Por defecto, Atlas Data Federation añade todas las colecciones en este clúster. Para usar un subconjunto de los datos, haz clic en Specific Collections, expande las bases de datos y luego selecciona las colecciones que deseas añadir a tu instancia federada de base de datos.
Tip
Para filtrar las bases de datos y colecciones, escribe texto en el campo Specific Collections. El cuadro de diálogo muestra únicamente bases de datos y colecciones cuyos nombres coinciden con tus criterios de búsqueda.
Haga clic en Continue.

Seleccione un rol de AWS IAM para Atlas.

Puedes seleccionar un rol IAM de AWS existente para el cual Atlas esté autorizado desde la lista desplegable de selección de roles o escoger Authorize an AWS IAM Role para autorizar un nuevo rol.

Si seleccionó un rol existente para el que Atlas está autorizado, proceda al siguiente paso para mostrar los buckets de AWS S3.

Si está autorizando Atlas para un rol existente o está creando un nuevo rol, complete los siguientes pasos antes de proceder al siguiente paso:

Desde el menú desplegable, selecciona Authorize an AWS IAM Role para autorizar un nuevo rol o selecciona un rol existente.
Utiliza el AWS ARN y el ID Externo único en la sección Role Authorization para agregar Atlas a las relaciones de confianza de un rol IAM AWS existente o nuevo.
En la interfaz de usuario de Atlas, haz clic en uno de los siguientes:
- El Create new AWS IAM role muestra cómo usar el ARN y el ID externo único para agregar Atlas a las relaciones de confianza de un nuevo rol AWS IAM. Siga los pasos en la interfaz de usuario de Atlas para crear un nuevo rol. Para obtener más información, consulte Cómo crear un nuevo rol con la CLI de AWS.
  
  Al autorizar un nuevo rol, si salís del flujo de trabajo:
  - Antes de validar el rol, Atlas no creará la instancia federada de base de datos. Puedes ir a la página Atlas Integrations para autorizar un nuevo rol, luego empieza el procedimiento para implementar una instancia federada de base de datos nuevamente cuando tengas el AWS rol IAM ARN.
  - Luego de validar el rol, Atlas no creará la instancia federada de base de datos. Sin embargo, el rol está disponible en el menú desplegable de selección de rol y puede utilizarse para crear una instancia de base de datos federada. No necesitas autorizar el rol nuevamente.
- El Use existing AWS IAM role muestra cómo usar el ARN y el ID externo único para añadir Atlas a las relaciones de confianza de un AWS IAM rol existente. Siga los pasos en la interfaz de usuario de Atlas para añadir Atlas a la relación de confianza de un rol existente. Para obtener más información, consulta Agregar relaciones de confianza a un rol existente .
Importante
Si en el futuro modifica su rol personalizado de AWS ARN, asegúrese de que la política de acceso del rol incluya el acceso apropiado a los recursos de S3 para la instancia federada de base de datos.
Para obtener más información, consulta Configurar Acceso Unificado a AWS y Crear un Rol de Acceso de Proveedor Cloud.
Haga clic en Validate AWS IAM role.

Asigne una política de acceso a su rol de AWS IAM.

Introduce el nombre de tu bucket de S3.
Sigue los pasos en la IU de Atlas para asignar una directiva de acceso a tu rol IAM AWS.
Haga clic en Validate AWS S3 bucket access.
Haga clic en Continue.

Programa tus extracciones de datos.

Programa un activador para copiar datos continuamente desde tu clúster Atlas a tu bucket S3 utilizando $out en la sección Schedule Queries.

Especifique la frecuencia con la que desea extraer datos de su clúster de Atlas utilizando los menús desplegables Repeat Once By.
opcional. Especifica si Atlas Data Federation debe volver a ejecutar la misma query si la ha pasado por alto por alguna razón. Por defecto, esto está desactivado para permitir que Atlas Data Federation vuelva a ejecutar las consultas que se hayan omitido. Como alternativa, para omitir consultas que se hayan saltado y no ponerse al día, activa Skip Catch Up Events.
Opcional. Elige el formato que deseas para tus datos cuando Atlas Data Federation los guardar en tu bucket S3. Atlas Data Federation admite Parquet, CSV , BSON y MongoDB JSON extendido.
Especifique el Max File Size para limitar el tamaño de cada archivo que Atlas Data Federation guarde en su cubo S3. Por ejemplo, si se establece Max File Size en 100 MB y una query devuelve 1 GB de datos, Atlas Data Federation guarda la query en su bucket S3 en 10 archivos, cada uno de 100 MBs.
Ingrese el prefijo de AWS para el bucket de destino S3.
Introduce el nombre del campo de fecha indexado en Date Field y especifica el formato de su valor usando el menú desplegable. Cada colección que desees copiar posteriormente debe tener un campo indexado que almacene una marca de tiempo como su valor.
Haga clic en Continue.

Haz clic Createen.

Utiliza el asistente Explorar con datos de muestra

El asistente Explorar con datos de muestra te ayuda a configurar una instancia de base de datos federada cargada con datos de muestra.

Inicie sesión en MongoDB Atlas.

Selecciona la opción Data Federation en la navegación de la izquierda.

Crear una instancia de base de datos federada.

Haz clic en el menú desplegable Create New Federated Database.
Seleccione Explore with Sample Data.

Haz clic Get Starteden.

Haz clic Createen.

Esta instancia federada de base de datos incluye los siguientes conjuntos de datos de muestra que puedes utilizar para practicar la ejecución de queries:

/airbnb/listingsAndReviews/{bedrooms int}/{review_scores.review_scores_rating int}/

Esta ruta hace referencia al conjunto de datos airbnb, que contiene los detalles del anuncio de la casa vacacional y las reseñas de los clientes. Para obtener más información sobre este conjunto de datos, consulte Conjunto de datos de muestra de listados de AirBnB.

Para esta ruta, la instancia federada de base de datos utiliza particiones optimizadas para consultas en el campo bedrooms y los campos review_scores.review_score_ratings.
/analytics/accounts/{limit int}/

Esta ruta hace referencia al conjunto de datos analytics, que contiene datos para una aplicación típica de servicios financieros. Para aprender más sobre este conjunto de datos, consulta Conjunto de datos de análisis de muestra.

Para esta ruta, la instancia federada de base de datos utiliza particiones optimizadas para consultas en el campo limit.
/analytics/customers/{birthdate isodate}/

Estos datos hacen referencia al conjunto de datos analytics, el cual contiene colecciones para una aplicación típica de servicios financieros. Para aprender más sobre este conjunto de datos, consulte Conjunto de datos de análisis de muestra.

Para esta ruta, la instancia federada de base de datos utiliza particiones optimizadas para consultas en el campo birthdate.
/analytics/transactions/{account_id int}/

Esta ruta hace referencia al analytics conjunto de datos, que contiene datos para una aplicación típica de servicios financieros. Para obtener más información sobre este conjunto de datos, consulte el Conjunto de datos de muestra de Analytics.

Para esta ruta, la instancia federada de base de datos utiliza particiones optimizadas para consultas en el campo account_id.
/mflix/movies/{type string}/{year int}/

Este camino hace referencia al conjunto de datos mflix, que contiene información sobre películas y salas de cine. Para obtener más información sobre este conjunto de datos, consulte Conjunto de datos de muestra de Mflix.

Para esta ruta, la instancia de la base de datos federada utiliza particiones optimizadas para queries en los campos type y year.
/mflix/sessions.json

Este camino hace referencia al conjunto de datos mflix, que contiene información sobre películas y salas de cine. Para obtener más información sobre este conjunto de datos, consulte Conjunto de datos de muestra de Mflix.

Esta ruta no contiene ningún atributo de partición, por lo que, para las consultas sobre datos en la colección, Data Federation busca en todos los archivos de la colección.
/mflix/theaters/{theaterId string}/{location.address.zipcode string}/

Este camino hace referencia al conjunto de datos mflix, que contiene información sobre películas y salas de cine. Para obtener más información sobre este conjunto de datos, consulte Conjunto de datos de muestra de Mflix.

Para esta ruta, la instancia de la base de datos federada utiliza particiones optimizadas para queries en los campos theaterId y location.address.zipcode.
/mflix/users.json

Esta ruta hace referencia a la colección mflix, que contiene datos sobre películas y salas de cine. Para obtener más información sobre este conjunto de datos, consulte Conjunto de datos de muestra de Mflix.

Esta ruta no contiene ningún atributo de partición y, por lo tanto, para las queries sobre los datos de la colección, la instancia federada de base de datos busca en todos los archivos de la colección.
/nyc-yellow-cab-trips/{trip_start_isodate isodate}/{passenger_count int}/{fare_type string}/

Esta ruta hace referencia al conjunto de datos nyc-yellow-cab-trips, que contiene datos sobre los viajes, incluida la fecha del viaje, la tarifa y el número de pasajeros.

Para esta ruta, la instancia federada de base de datos utiliza particiones optimizadas para consultas en los campos trip_start_isodate, passenger_count y fare_type.

Utiliza el Asistente para query datos en clústeres

El asistente Query Data Across Clusters te ayuda a configurar una instancia federada de base de datos que accede a datos de múltiples clústeres de Atlas.

Inicie sesión en MongoDB Atlas.

Selecciona la opción Data Federation en la navegación de la izquierda.

Crear una instancia de base de datos federada.

Haz clic en el menú desplegable Create New Federated Database.
Seleccione Query Data Across Clusters.

Haz clic Get Starteden.

Escriba un nombre para su instancia de base de datos federada en el campo Federated Database Instance Name y haga clic en Continue.

Por defecto es FederatedDatabaseInstance[n]. Una vez que se crea tu instancia de base de datos federada, no puedes cambiar su nombre.

Especifica los clústeres de Atlas a utilizar como fuentes de datos.

Selecciona un clúster de Atlas para usar como fuente de datos del menú desplegable. Atlas sólo muestra los clústeres del proyecto actual de Atlas en este menú desplegable.
Expande las bases de datos y selecciona las colecciones que desees agregar a tu instancia federada de base de datos.
Tip
Para filtrar las bases de datos y colecciones, escribe texto en el campo Specific collections. El cuadro de diálogo muestra únicamente bases de datos y colecciones cuyos nombres coinciden con tus criterios de búsqueda.

opcional. Expande la configuración de Cluster Read Preference para configurar los siguientes campos.

Nombre de campo	Descripción
Read Preference Mode	Especifica el miembro del conjunto de réplicas al que se desea dirigir las solicitudes de lectura. Puedes elegir uno de los siguientes en el menú desplegable: `primary` - para encaminar todas las solicitudes de lectura al set de réplicas primario `primaryPreferred` - para enrutar todas las solicitudes de lectura al set de réplicas primario y solo a los miembros secundarios si `primary` no está disponible `secondary` - para dirigir todas las solicitudes de lectura a los miembros secundarios del set de réplicas `secondaryPreferred` - para dirigir todas las solicitudes de lectura a los miembros secundarios del set de réplicas y solo al principal en clústeres particionados si los miembros `secondary` no están disponibles `nearest` - para derivar todas las solicitudes de lectura a un nodo aleatorio elegible del set de réplicas, independientemente de si ese nodo es un primario o un secundario Si añade un clúster de Atlas como almacén, el valor por defecto es `secondary`. Si no configuras nada en la configuración de almacenamiento de tu instancia de base de datos federada, el valor por defecto es `nearest`. Para obtener más información, consulte Modo de preferencia de lectura. IMPORTANTE: Impacto en la Data Federation y el nodo primario. Cuando las consultas de Data Federation se configuran con una preferencia de lectura que apunta a nodos secundarios, no se espera que generen carga en el primario del clúster de Atlas de respaldo. Las queries iniciadas en un secundario mantienen la afinidad del cursor con ese nodo durante toda su vida útil. En algunos registros, las operaciones `getMore` pueden aparecer con una preferencia de lectura de `primaryPreferred`. Este es el comportamiento esperado y no indica que el cursor haya cambiado al principal. La `primaryPreferred` moda es válida tanto en los nodos primarios como en los secundarios y permite a los drivers gestionar cambios de rol poco frecuentes (como que un nodo secundario se convierta en primario) sin volver a emitir la query. La ejecución del cursor continúa en el nodo original a menos que ese nodo cambie de rol. Data Federation aísla sus cargas de trabajo del primario sin requerir ninguna configuración adicional. El uso del modo `primaryPreferred` asegura la compatibilidad con nodos primarios y secundarios, permitiendo que los drivers gestionen cambios de rol poco comunes, como cuando un nodo secundario se convierte en primario, sin necesidad de volver a emitir la query. La ejecución del cursor continúa en el nodo original a menos que ese nodo cambie de rol.
TagSets	Especifica la lista de etiquetas o documentos de especificación de etiquetas que contienen pares de nombre y valor para el miembro del set de réplicas al que desea enrutar las solicitudes de lectura. Para obtener más información, consulta Conjuntos de etiquetas de preferencias de lectura.
Maxstaleness Seconds	Especifica el máximo atraso de la replicación, o "obsolescencia", para la lectura desde secundarias. Para obtener más información, consulte preferencia de lectura maxStalenessSeconds.

Haz clic en Add Atlas cluster and collection y repite estos pasos para todos los clústeres de Atlas que desees usar como fuentes de datos.
Una vez que hayas terminado de añadir clústeres, haz clic en Continue.

Haz clic Createen.

Próximos pasos

Ahora que su instancia de base de datos federada está implementada, continúe con Configurar la conexión para su instancia de base de datos federada.

Implementar una instancia federada de base de datos

Acceso requerido

Importante

Requisitos previos

Utilice el Asistente para los Sistemas Descendentes de Feeds

Inicie sesión en MongoDB Atlas.

Selecciona la opción Data Federation en la navegación de la izquierda.

Crear una instancia de base de datos federada.

Haz clic Get Starteden.

Escriba un nombre para su instancia de base de datos federada en el campo Federated Database Instance Name y haga clic en Continue.

Especifique sus fuentes de datos.

Tip

Seleccione un rol de AWS IAM para Atlas.

Importante

Asigne una política de acceso a su rol de AWS IAM.

Programa tus extracciones de datos.

Haz clic Createen.

Utiliza el asistente Explorar con datos de muestra

Inicie sesión en MongoDB Atlas.

Selecciona la opción Data Federation en la navegación de la izquierda.

Crear una instancia de base de datos federada.

Haz clic Get Starteden.

Haz clic Createen.

Utiliza el Asistente para query datos en clústeres

Inicie sesión en MongoDB Atlas.

Selecciona la opción Data Federation en la navegación de la izquierda.

Crear una instancia de base de datos federada.

Haz clic Get Starteden.

Escriba un nombre para su instancia de base de datos federada en el campo Federated Database Instance Name y haga clic en Continue.

Especifica los clústeres de Atlas a utilizar como fuentes de datos.

Tip

Haz clic Createen.

Próximos pasos