Make the MongoDB docs better! We value your opinion. Share your feedback for a chance to win $100.
Click here >
Docs Menu
Docs Home
/

Fiabilidad en el marco Atlas Well-Architected

El pilar de confiabilidad del Atlas Well-Architected Framework incluye funcionalidades y estrategias que minimizan el tiempo de inactividad y evitan la pérdida de datos. Una carga de trabajo confiable es consciente de las fallas a medida que ocurren y puede tomar medidas eficientes y, a menudo, automáticas para recuperar la disponibilidad y recuperarse de la pérdida de datos.

Hay dos bases para diseñar una implementación fiable y resistente de Atlas:

  • Diseña una arquitectura de implementación con opciones de configuración que aseguren una alta disponibilidad frente a las interrupciones previstas de la infraestructura.

  • Crea un plan de recuperación ante desastres que defina las mejores prácticas y procedimientos para recuperarse de escenarios de desastre dentro de los parámetros establecidos. RTO y RPO. Esto puede implicar la configuración de una política de copia de seguridad para complementar la estrategia de disponibilidad de tu implementación y proporcionar opciones de recuperación para eventos de pérdida o corrupción de datos.

  • Objetivo de tiempo de recuperación (RTO) es el tiempo máximo de inactividad aceptable antes de que la aplicación se recupere y comience a servir tráfico después de una interrupción.

  • El objetivo de punto de recuperación (RPO) es la cantidad máxima de datos que puedes permitirte perder en una Interrupción del servicio, medida en unidades de tiempo.

  • La disponibilidad es una medida de la fiabilidad con la que el sistema es accesible y funcional cuando es necesario. Suele expresarse como un porcentaje que representa la proporción de tiempo que el sistema está disponible en un periodo determinado. Por ejemplo, el estándar de referencia en disponibilidad se suele citar como 99.999%, o "cinco nueves", lo que equivale a aproximadamente 5 minutos y 25 segundos de tiempo de inactividad potencial por año.

  • Alta disponibilidad se refiere a la capacidad de un sistema para permanecer accesible cuando enfrenta fallas de componentes individuales. Una arquitectura de implementación diseñada para alta disponibilidad utiliza a menudo mecanismos de redundancia y conmutación por error para lograr tolerancia a fallos, lo que significa que puede cambiar automáticamente a componentes funcionales cuando se detecta un fallo.

  • La Recuperación ante Desastres se refiere a estrategias para crear y gestionar copias independientes de la carga de trabajo que puedan ser utilizadas en situaciones de desastre. Un plan integral de recuperación ante desastres define procedimientos para recuperar la operación del sistema dentro de un objetivo de tiempo de recuperación (RTO) específico y recuperar los datos hasta una marca de tiempo dentro de un objetivo de punto de recuperación (RPO) específico, tras un escenario de desastre.

Es importante combinar la arquitectura correcta de alta disponibilidad, el plan de recuperación ante desastres y la política de copias de seguridad para tu implementación con el fin de optimizar la fiabilidad mientras se equilibra el impacto de los costos.

La arquitectura de implementación por defecto de MongoDB está diseñada para una alta disponibilidad. Atlas despliega cada clúster como parte de un set de réplicas con un mínimo de tres instancias de base de datos (también llamadas nodos) distribuidas automáticamente en diferentes zonas de disponibilidad. En el evento de que se produzca una Interrupción del servicio de una sola zona, el traspaso entre instancias es completamente automático y se completa en segundos sin ninguna pérdida de datos, incluidas las operaciones que estaban en curso en el momento de la falla si escrituras reintentables está habilitado. Para mejorar la disponibilidad de las aplicaciones más críticas, se puede escalar la implementación agregando nodos, regiones o proveedores de nube para soportar Interrupciones del servicio de zona, región o proveedor.

Las copias de seguridad también son fundamentales para la fiabilidad del sistema. Si bien los sistemas diseñados para la alta disponibilidad dependen menos de las copias de seguridad para protegerse contra la pérdida de datos, las copias de seguridad siguen siendo la mejor protección contra escenarios de desastre fuera de los eventos de interrupción del servicio de la infraestructura que pueden resultar en la pérdida o corrupción de datos, como amenazas humanas como ataques cibernéticos o errores de código. Una planificación sólida de recuperación ante desastres implica decidir si es necesaria una política de copias de seguridad para satisfacer los RPO y RTO calculados.

Utiliza los siguientes recursos del Atlas Architecture Center para aprender más sobre las funcionalidades y estrategias de confiabilidad en Atlas:

Ícono de alta disponibilidad de Atlas

Alta disponibilidad

Crea configuraciones de clúster que satisfagan tus necesidades de disponibilidad y agilicen la recuperación ante desastres.

Icono de copia de seguridad de MongoDB

Copias de seguridad

Configure las opciones de copia de seguridad de la base de datos en Atlas y obtenga recomendaciones para cumplir con sus requisitos de RTO y RPO con instantáneas a nivel de clúster.

Ícono de recuperación ante desastres en la nube de MongoDB

recuperación ante desastres

Crea un plan de DR con los pasos a seguir en caso de sufrir una Interrupción del servicio, eliminación de datos de producción y más.

Volver

Registro