Importante
Característica no disponible en los clústeres Flex
Los clústeres Flex no admiten esta característica en este momento. Para obtener más información, se debe consultar Limitaciones de Atlas Flex.
Atlas Online Archive es una funcionalidad diseñada para ayudar a las organizaciones a optimizar sus costos de almacenamiento y consulta de datos archivando datos a los que se accede con poca frecuencia desde el clúster MongoDB Atlas en un almacenamiento de objetos en la nube. Con Online Archive, obtienes la capacidad de gestionar el ciclo de vida de tus datos, mantener una experiencia de query unificada entre conjuntos de datos en vivo y archivados, y reducir la complejidad operativa, asegurando que los datos permanezcan accesibles cuando sea necesario.
Consideraciones clave para el uso del fichero en línea
Ten en cuenta los siguientes requisitos, expectativas y limitaciones al utilizar Atlas Online Archive.
Requisitos del clúster
El fichero en linea de Atlas está disponible solo en clústeres M10 y superiores.
Permisos requeridos
Para crear o borrar un archivo archivado en línea, se debe tener uno de estos roles:
Project Ownerrol
Expectativas de desempeño
Ten en cuenta las siguientes expectativas de rendimiento al trabajar con el fichero en línea:
Tareas de archivo: MongoDB ejecuta tareas de archivo periódicamente para trasladar datos de tu clúster al almacenamiento en la nube. Estas tareas funcionan de manera asíncrona y están diseñadas para minimizar el impacto en el rendimiento del clúster.
Capacidad del clúster: las tareas de fichado consumen los recursos del clúster. Asegúrate de que tu clúster de Atlas tenga la capacidad suficiente para admitir tanto cargas de trabajo activas como tareas de archivo, y así evitar limitaciones de recursos.
Query Performance: Los datos archivados se ubican en un almacenamiento de objetos en la nube optimizado para lectura, lo que podría resultar en un rendimiento de query más lento en comparación con la query de datos en vivo en tu clúster de Atlas.
Importante
Por defecto, MongoDB espera 5 minutos después de completar una tarea de archivado para iniciar otra ejecución.
Limitaciones
En línea Fichero no admite lo siguiente:
Escribir en el fichero en linea.
Configurar o administrar la instancia federada de base de datos del Archivo en línea a través de la consola Atlas, Atlas Data Federation CLIo la API de Atlas Data Federation.
Archivar una colección con tamaño fijo.
Archivando datos cuando el volumen total supera los 2 GB por ciclo de tarea de cinco minutos.
Archivar datos por debajo del tamaño de 5 MiB después de 7 días. Para aprender más, se puede consultar Limitaciones.
Borrando documentos individuales.
Importante
El Archivo en línea hereda todas las limitaciones de Atlas Data Federation. Esto incluye las etapas del pipeline de MongoDB Search como $search y $searchMeta y la etapa del pipeline de búsqueda vectorial de MongoDB $vectorSearch, que no son compatibles al consultar datos archivados. Para obtener una lista completa de las características no compatibles, consulta las Limitaciones de Atlas Data Federation.
en linea fichero & Federación de datos de Atlas
Cuando configuras un fichero en linea para una colección, Atlas usa Atlas Data Federation para crear una instancia federada de base de datos de solo lectura. Esto habilita queries unificadas tanto en tu clúster activo como en tus datos archivados, usando los mismos nombres de colecciones y bases de datos.
Defina reglas de archivado basadas en campos de tiempo o filtros personalizados. Atlas evalúa estas reglas de forma continua y transfiere automáticamente los documentos coincidentes a un almacenamiento de objetos en la nube administrado por Atlas (por ejemplo, AWS S3, Azure Blob).
Región de Data Federation | Región AWS | Región de Atlas |
|---|---|---|
Norte de Virginia, EE. UU. |
|
|
Oregón, EE. UU. |
|
|
Sao Paulo, Brasil |
|
|
Irlanda |
|
|
London, England, UK |
|
|
Fráncfort, Alemania |
|
|
Tokyo, Japan |
|
|
Seúl, Corea del Sur |
|
|
Mumbai, India |
|
|
Singapur |
|
|
Sydney, Australia |
|
|
Montreal, QC, Canadá |
|
|
Importante
Atlas cifra los datos archivados usando claves administradas por S3de Amazon de cifrado del lado del servidor (SSE-S3) para los datos archivados. Atlas no puede usar ninguna llave de cifrado de cifrado en reposo que hayas usado en los datos de tu clúster.
Región de Data Federation | Azure Región | Región de Atlas |
|---|---|---|
Virginia, USA |
|
|
Sao Paulo, Brasil |
|
|
Países Bajos |
|
|
Importante
Atlas cifra tus datos archivados usando cifrado del lado del servicio de Azure almacenamiento. Atlas no puede utilizar ninguna clave de cifrado en reposo que hayas usado en los datos de tu clúster.
Región de Data Federation | Región de Google Cloud | Región de Atlas |
|---|---|---|
Iowa, USA |
|
|
Bélgica |
|
|
Importante
Atlas cifra tus datos archivados utilizando cifrado del lado del servicio de Google Cloud Storage. Atlas no puede usar ninguna llave de cifrado de cifrado en reposo que hayas usado en los datos de tu clúster.
Atlas archiva los datos en función de los criterios que especifiques en una regla de archivado. Los criterios varían según el tipo de colección que desee archivar:
Para colecciones estándar, el criterio puede ser uno de los siguientes:
Una combinación de un campo de fecha para archivar datos y el número de días para conservar los datos en el clúster Atlas. Cuando la fecha actual supera el valor del campo de fecha especificado, Atlas resta el número de días del tiempo actual y luego archiva los datos después de ese tiempo.
Una query personalizada. Atlas ejecuta la query especificada en la regla de archivado para seleccionar los documentos que se van a archivar.
Para colecciones de series temporales, el criterio es una combinación de un campo temporal y el número de días para mantener los datos en el clúster Atlas. Cuando el tiempo actual supera el valor del campo de tiempo especificado, Atlas resta la cantidad de días del tiempo actual y luego archiva datos después de esa cantidad de días, horas y minutos.
Cuando configuras un fichero en linea en tu clúster, Atlas crea dos instancias federadas de base de datos:
Instancia de base de datos federada para tu fichero que te permite consultar datos únicamente sobre tu fichero.
Instancia federada de base de datos para tu clúster y fichero que te permite hacer query a tu clúster y a los datos archivados.
Casos de uso
Puedes usar Online Archive para reducir los costos de almacenamiento y administrar datos fríos mientras preservas el acceso a través de consultas. Algunos casos de uso habituales incluyen:
Large-scale historical datasets: Tu clúster almacena grandes volúmenes de datos, como registros, métricas o registros de transacciones, y necesitas reducir los costos operacionales de almacenamiento sin borrar los datos. Fichero en línea: ayuda reubicando datos fríos a un almacenamiento de objetos en la nube más económico, manteniéndolos accesibles mediante queries.
Time series archiving: Tu aplicación ingiere datos de series de tiempo de alta frecuencia desde fuentes como dispositivos IoT, sensores industriales o sistemas financieros. El Archivo en línea te permite conservar estos datos para el cumplimiento, auditoría o análisis, minimizando al mismo tiempo el impacto en el rendimiento de tu clúster.
Cold operational data: Usted gestiona datos de aplicaciones (por ejemplo, historiales de pedidos, solicitudes de servicio completadas, facturas antiguas) que rara vez se acceden después de cierta antigüedad, pero que deben conservarse por necesidades de referencia o regulatorias.
Long-term customer records: Tu sistema conserva los perfiles de clientes archivados, el historial de suscripciones o los registros de actividad de los usuarios durante los períodos legales de retención o para análisis posteriores, pero estos documentos ya no requieren un acceso frecuente.
Compliance and auditTu organización debe conservar datos por motivos regulatorios o de auditoría (por ejemplo, transacciones financieras, registros médicos, registros de acceso). El archivado permite un almacenamiento prolongado y rentable sin modificar tu interfaz de consultas.
Archiving for analytics: Archivas datos que no son necesarios para las operaciones diarias pero que ocasionalmente se analizan para identificar tendencias, crear informes o realizar predicciones, sin añadir sobrecarga a tu clúster principal.
El Archivo en línea ayuda a aislar los datos fríos de las cargas de trabajo activas, mientras se mantiene una interfaz unificada para ambos. Esto permite lograr eficiencia operativa, ahorro de costos y cumplimiento de retención, todo eso sin requerir cambios en la aplicación.
Próximos pasos
Para una experiencia práctica, puedes crear un fichero en línea para una colección en tu clúster a través de tu consola Atlas y API. Una vez creado, puedes: