Importante
Característica no disponible en los clústeres Flex
Los clústeres flexibles no admiten esta función actualmente. Para obtener más información, consulte Limitaciones de Atlas Flex.
Atlas Online Archive es una función diseñada para ayudar a las organizaciones a optimizar sus costos de almacenamiento y consulta de datos mediante el archivo de datos de acceso poco frecuente desde su clúster de MongoDB Atlas a un almacenamiento de objetos en la nube. Con Online Archive, podrá gestionar el ciclo de vida de sus datos, mantener una experiencia de consulta unificada entre conjuntos de datos en vivo y archivados, y reducir la complejidad operativa, garantizando al mismo tiempo que los datos permanezcan accesibles cuando sea necesario.
Consideraciones clave para el uso del archivo en línea
Tenga en cuenta los siguientes requisitos, expectativas y limitaciones al utilizar Atlas Online Archive.
Requisitos del clúster
El archivo en línea en Atlas está disponible únicamente en M10 y grupos más grandes.
Permisos requeridos
Para crear o eliminar un archivo en línea, debe tener uno de estos roles:
Expectativas de desempeño
Tenga en cuenta las siguientes expectativas de rendimiento al trabajar con Online Archive:
Trabajos de archivado: MongoDB ejecuta trabajos de archivado periódicamente para transferir datos del clúster al almacenamiento en la nube. Estos trabajos funcionan de forma asíncrona y están diseñados para minimizar el impacto en el rendimiento del clúster.
Capacidad del clúster: Las tareas de archivado consumen recursos del clúster. Asegúrese de que su clúster Atlas tenga suficiente capacidad para soportar tanto las cargas de trabajo activas como las tareas de archivado para evitar limitaciones de recursos.
Rendimiento de consultas: los datos archivados residen en un almacenamiento de objetos en la nube optimizado para lectura, que puede tener un rendimiento de consultas más lento en comparación con la consulta de datos en vivo en su clúster Atlas.
Importante
Por defecto, MongoDB espera 5 minutos después de completar una tarea de archivado para iniciar otra ejecución.
Limitaciones
El Archivo en línea no admite lo siguiente:
Escribiendo en el Archivo Online.
Configurar o administrar la instancia de base de datos federada de Online Archive a través de la consola Atlas, la CLI de Atlas Data Federation o la API de Atlas Data Federation.
Archivar una colección con tamaño fijo.
Archivar datos cuando el volumen total supera los 2 GB por ciclo de trabajo de cinco minutos.
Archivar datos por debajo de 5 MiB después de 7 días. Para obtener más información, consulte Limitaciones.
Eliminar documentos individuales.
Importante
El Archivo en Línea hereda todas las limitaciones de la Federación de Datos de Atlas. Esto incluye las etapas de la canalización de búsqueda de MongoDB, como $search y,$searchMeta y la etapa de la canalización de búsqueda vectorial $vectorSearch de MongoDB, que no son compatibles al consultar datos archivados. Para obtener una lista completa de las funciones no compatibles, consulte Limitaciones de la Federación de Datos de Atlas.
en linea fichero & Federación de datos de Atlas
Al configurar un Archivo en Línea para una colección, Atlas utiliza la Federación de Datos de Atlas para crear una Instancia de Base de Datos Federada de solo lectura. Esto permite realizar consultas unificadas tanto en el clúster activo como en los datos archivados, utilizando los mismos nombres de colección y base de datos.
Se definen reglas de archivado basadas en campos de tiempo o filtros personalizados. Atlas evalúa estas reglas continuamente y transfiere automáticamente los documentos coincidentes a un almacenamiento de objetos en la nube administrado por Atlas (p. ej., AWS S3, Azure Blob).
Región de Data Federation | Región AWS | Región de Atlas |
|---|---|---|
Norte de Virginia, EE. UU. |
|
|
Oregón, EE. UU. |
|
|
Sao Paulo, Brasil |
|
|
Irlanda |
|
|
London, England, UK |
|
|
Fráncfort, Alemania |
|
|
Tokyo, Japan |
|
|
Seúl, Corea del Sur |
|
|
Mumbai, India |
|
|
Singapur |
|
|
Sydney, Australia |
|
|
Montreal, QC, Canadá |
|
|
Importante
Atlas cifra sus datos archivados mediante claves administradas por3SSE-S3 (SSE-S) de Amazon. Atlas no puede usar ninguna clave de cifrado en reposo que haya utilizado en los datos de su clúster.
Región de Data Federation | Región Azure | Región de Atlas |
|---|---|---|
Virginia, USA |
|
|
Sao Paulo, Brasil |
|
|
Países Bajos |
|
|
Importante
Atlas cifra los datos archivados mediante el cifrado del lado del servicio de Azure Storage. Atlas no puede usar las claves de cifrado en reposo que se usaron en los datos del clúster.
Región de Data Federation | Región de Google Cloud | Región de Atlas |
|---|---|---|
Iowa, USA |
|
|
Bélgica |
|
|
Importante
Atlas cifra tus datos archivados mediante el cifrado del lado del servicio de Google Cloud Storage. Atlas no puede usar las claves de cifrado en reposo que hayas usado en los datos de tu clúster.
Atlas archiva los datos según los criterios que especifique en una regla de archivado. Los criterios varían según el tipo de colección que desee archivar:
Para las colecciones estándar, los criterios pueden ser uno de los siguientes:
Una combinación de un campo de fecha para archivar datos y un número de días para conservarlos en el clúster de Atlas. Cuando la fecha actual supera el valor del campo de fecha especificado, Atlas resta el número de días a la hora actual y archiva los datos después de esa hora.
Una consulta personalizada. Atlas ejecuta la consulta especificada en la regla de archivado para seleccionar los documentos que se archivarán.
Para las colecciones de series temporales, el criterio es una combinación de un campo de tiempo y el número de días que se conservarán los datos en el clúster de Atlas. Cuando la hora actual supera el valor del campo de tiempo especificado, Atlas resta el número de días de la hora actual y archiva los datos transcurridos esos días, horas y minutos.
Cuando configura un archivo en línea en su clúster, Atlas crea dos instancias de base de datos federadas:
Instancia de base de datos federada para tu fichero que te permite consultar datos únicamente sobre tu fichero.
Instancia de base de datos federada para su clúster y archivo que le permite consultar tanto su clúster como los datos archivados.
Casos de uso
Puede usar Online Archive para reducir los costos de almacenamiento y administrar datos inactivos, a la vez que preserva el acceso mediante consultas. Algunos casos de uso típicos incluyen:
Large-scale historical datasetsSu clúster almacena grandes volúmenes de datos, como registros, métricas o registros de transacciones, y necesita reducir los costos operativos de almacenamiento sin eliminar datos. Online Archive ayuda a reubicar los datos inactivos en un almacenamiento de objetos en la nube más económico, manteniéndolos accesibles mediante consultas.
Time series archiving: Tu aplicación ingiere datos de series de tiempo de alta frecuencia desde fuentes como dispositivos IoT, sensores industriales o sistemas financieros. El Archivo en línea te permite conservar estos datos para el cumplimiento, auditoría o análisis, minimizando al mismo tiempo el impacto en el rendimiento de tu clúster.
Cold operational data: Usted gestiona datos de aplicaciones (por ejemplo, historiales de pedidos, solicitudes de servicio completadas, facturas antiguas) que rara vez se acceden después de cierta antigüedad, pero que deben conservarse por necesidades de referencia o regulatorias.
Long-term customer records:Su sistema conserva perfiles de clientes archivados, historial de suscripciones o registros de actividad de usuarios durante períodos de retención legales o análisis posteriores, pero estos documentos ya no requieren acceso frecuente.
Compliance and auditSu organización debe conservar datos para fines regulatorios o de auditoría (p. ej., transacciones financieras, registros médicos, registros de acceso). El archivado permite un almacenamiento a largo plazo rentable sin modificar la interfaz de consulta.
Archiving for analytics:Archiva datos que no son necesarios para las operaciones diarias, pero que ocasionalmente se analizan para tendencias, informes o pronósticos, sin agregar sobrecarga a su clúster principal.
El Archivo en Línea ayuda a aislar los datos inactivos de las cargas de trabajo activas, manteniendo una interfaz unificada para ambos. Esto permite eficiencia operativa, ahorro de costos y cumplimiento de la retención, todo sin cambios en las aplicaciones.
Próximos pasos
Para una experiencia práctica, puede crear un archivo en línea para una colección en su clúster mediante la consola y la API de Atlas. Una vez creado, podrá: