Importante
Característica no disponible en los clústeres Flex
Los clústeres flexibles no admiten esta funcionalidad en este momento. Para obtener más información, consulte Limitaciones de Atlas Flex.
Atlas Online Archive es una función diseñada para ayudar a las organizaciones a optimizar sus costos de almacenamiento y consulta de datos mediante el archivo de datos de acceso poco frecuente desde su clúster de MongoDB Atlas a un almacenamiento de objetos en la nube. Con Online Archive, podrá gestionar el ciclo de vida de sus datos, mantener una experiencia de consulta unificada entre conjuntos de datos en vivo y archivados, y reducir la complejidad operativa, garantizando al mismo tiempo que los datos permanezcan accesibles cuando sea necesario.
Consideraciones clave para el uso del archivo en línea
Tenga en cuenta los siguientes requisitos, expectativas y limitaciones al utilizar Atlas Online Archive.
Requisitos del clúster
El fichero en linea de Atlas solo está disponible en M10 y clústeres mayores.
Permisos requeridos
Para crear o borrar un archivo archivado en línea, se debe tener uno de estos roles:
Expectativas de desempeño
Ten en cuenta las siguientes expectativas de rendimiento al trabajar con el fichero en línea:
Tareas de archivo: MongoDB ejecuta tareas de archivo periódicamente para trasladar datos de tu clúster al almacenamiento en la nube. Estas tareas funcionan de manera asíncrona y están diseñadas para minimizar el impacto en el rendimiento del clúster.
Capacidad del clúster: las tareas de fichado consumen los recursos del clúster. Asegúrate de que tu clúster de Atlas tenga la capacidad suficiente para admitir tanto cargas de trabajo activas como tareas de archivo, y así evitar limitaciones de recursos.
Query Performance: Los datos archivados se ubican en un almacenamiento de objetos en la nube optimizado para lectura, lo que podría resultar en un rendimiento de query más lento en comparación con la query de datos en vivo en tu clúster de Atlas.
Importante
Por defecto, MongoDB espera 5 minutos después de completar una tarea de archivado para iniciar otra ejecución.
Limitaciones
En línea Fichero no admite lo siguiente:
Escribir en el fichero en linea.
Configurar o administrar la instancia de base de datos federada de Online Archive a través de la consola Atlas, la CLI de Atlas Data Federation o la API de Atlas Data Federation.
Archivar una colección con tamaño fijo.
Archivando datos cuando el volumen total supera los 2 GB por ciclo de tarea de cinco minutos.
Archivar datos de menos de 5 MB después de 7 días. Para más información, consulte Limitaciones.
Borrando documentos individuales.
Importante
El Archivo en Línea hereda todas las limitaciones de la Federación de Datos de Atlas. Esto incluye las etapas de la canalización de búsqueda de MongoDB, como $search y,$searchMeta y la etapa de la canalización de búsqueda vectorial $vectorSearch de MongoDB, que no son compatibles al consultar datos archivados. Para obtener una lista completa de las funciones no compatibles, consulte Limitaciones de la Federación de Datos de Atlas.
en linea fichero & Federación de datos de Atlas
Cuando configuras un fichero en linea para una colección, Atlas usa Atlas Data Federation para crear una instancia federada de base de datos de solo lectura. Esto habilita queries unificadas tanto en tu clúster activo como en tus datos archivados, usando los mismos nombres de colecciones y bases de datos.
Se definen reglas de archivado basadas en campos de tiempo o filtros personalizados. Atlas evalúa estas reglas continuamente y transfiere automáticamente los documentos coincidentes a un almacenamiento de objetos en la nube administrado por Atlas (p. ej., AWS S3, Azure Blob).
Región de Data Federation | Región AWS | Región de Atlas |
|---|---|---|
Norte de Virginia, EE. UU. |
|
|
Oregón, EE. UU. |
|
|
Sao Paulo, Brasil |
|
|
Irlanda |
|
|
London, England, UK |
|
|
Fráncfort, Alemania |
|
|
Tokyo, Japan |
|
|
Seúl, Corea del Sur |
|
|
Mumbai, India |
|
|
Singapur |
|
|
Sydney, Australia |
|
|
Montreal, QC, Canadá |
|
|
Importante
Atlas cifra los datos archivados usando claves administradas por S3de Amazon de cifrado del lado del servidor (SSE-S3) para los datos archivados. Atlas no puede usar ninguna llave de cifrado de cifrado en reposo que hayas usado en los datos de tu clúster.
Región de Data Federation | Región Azure | Región de Atlas |
|---|---|---|
Virginia, USA |
|
|
Sao Paulo, Brasil |
|
|
Países Bajos |
|
|
Importante
Atlas cifra los datos archivados mediante el cifrado del lado del servicio de Azure Storage. Atlas no puede usar las claves de cifrado en reposo que se usaron en los datos del clúster.
Región de Data Federation | Región de Google Cloud | Región de Atlas |
|---|---|---|
Iowa, USA |
|
|
Bélgica |
|
|
Importante
Atlas cifra tus datos archivados utilizando cifrado del lado del servicio de Google Cloud Storage. Atlas no puede usar ninguna llave de cifrado de cifrado en reposo que hayas usado en los datos de tu clúster.
Atlas archiva los datos en función de los criterios que especifiques en una regla de archivado. Los criterios varían según el tipo de colección que desee archivar:
Para colecciones estándar, el criterio puede ser uno de los siguientes:
Una combinación de un campo de fecha para archivar datos y un número de días para conservarlos en el clúster de Atlas. Cuando la fecha actual supera el valor del campo de fecha especificado, Atlas resta el número de días a la hora actual y archiva los datos después de esa hora.
Una consulta personalizada. Atlas ejecuta la consulta especificada en la regla de archivado para seleccionar los documentos que se archivarán.
Para las colecciones de series temporales, el criterio es una combinación de un campo de tiempo y el número de días que se conservarán los datos en el clúster de Atlas. Cuando la hora actual supera el valor del campo de tiempo especificado, Atlas resta el número de días de la hora actual y archiva los datos transcurridos esos días, horas y minutos.
Cuando configuras un fichero en linea en tu clúster, Atlas crea dos instancias federadas de base de datos:
Instancia de base de datos federada para tu fichero que te permite consultar datos únicamente sobre tu fichero.
Instancia federada de base de datos para tu clúster y fichero que te permite hacer query a tu clúster y a los datos archivados.
Casos de uso
Puedes usar Online Archive para reducir los costos de almacenamiento y administrar datos fríos mientras preservas el acceso a través de consultas. Algunos casos de uso habituales incluyen:
Large-scale historical datasets: Tu clúster almacena grandes volúmenes de datos, como registros, métricas o registros de transacciones, y necesitas reducir los costos operacionales de almacenamiento sin borrar los datos. Fichero en línea: ayuda reubicando datos fríos a un almacenamiento de objetos en la nube más económico, manteniéndolos accesibles mediante queries.
Time series archiving: Tu aplicación ingiere datos de series de tiempo de alta frecuencia desde fuentes como dispositivos IoT, sensores industriales o sistemas financieros. El Archivo en línea te permite conservar estos datos para el cumplimiento, auditoría o análisis, minimizando al mismo tiempo el impacto en el rendimiento de tu clúster.
Cold operational data: Usted gestiona datos de aplicaciones (por ejemplo, historiales de pedidos, solicitudes de servicio completadas, facturas antiguas) que rara vez se acceden después de cierta antigüedad, pero que deben conservarse por necesidades de referencia o regulatorias.
Long-term customer records:Su sistema conserva perfiles de clientes archivados, historial de suscripciones o registros de actividad de usuarios durante períodos de retención legales o análisis posteriores, pero estos documentos ya no requieren acceso frecuente.
Compliance and auditSu organización debe conservar datos para fines regulatorios o de auditoría (p. ej., transacciones financieras, registros médicos, registros de acceso). El archivado permite un almacenamiento a largo plazo rentable sin modificar la interfaz de consulta.
Archiving for analytics: Archivas datos que no son necesarios para las operaciones diarias pero que ocasionalmente se analizan para identificar tendencias, crear informes o realizar predicciones, sin añadir sobrecarga a tu clúster principal.
El Archivo en Línea ayuda a aislar los datos inactivos de las cargas de trabajo activas, manteniendo una interfaz unificada para ambos. Esto permite eficiencia operativa, ahorro de costos y cumplimiento de la retención, todo sin cambios en las aplicaciones.
Próximos pasos
Para vivir una experiencia práctica, puedes crear un fichero en linea para una colección en tu clúster a través de tu consola Atlas y la API. Una vez creado, puedes: