Nota
Esta característica no está disponible para ninguna de las siguientes implementaciones:
Clústeres gratuitos
Clústeres Flex
Para aprender más, Límites.
Puedes utilizar la interfaz de usuario de Atlas y API para simular una Interrupción del servicio en su clúster de varias regiones de Atlas y observar cómo su aplicación maneja una Interrupción del servicio en una o más regiones. También puedes ejecutar múltiples simulaciones. Al ejecutar múltiples simulaciones, recomendamos un intervalo de cinco minutos entre simulaciones.
Acceso requerido
Para iniciar una simulación de Interrupción del servicio, debes tener
Organization Ownero acceso al Project Owner proyecto.
Simula el proceso de Interrupción del servicio regional
Cuando envías una solicitud para probar una Interrupción del servicio utilizando la Interfaz de Usuario de Atlas o API, Atlas simula un evento de Interrupción del servicio. Durante una Interrupción del servicio simulada, Atlas:
Elimina la conectividad de red a los nodos en las regiones seleccionadas.
No activa una alerta de monitoreo
Replica set has no primarypara.Finaliza automáticamente la simulación después de un período de expiración configurable (1, 3 o 7 días).
Si a tu aplicación le toma más de 15 minutos darse cuenta de la pérdida de conexión con algunos nodos, recomendamos que reduzcas tus valores de tiempo de espera de retransmisión de TCP. Para aprender más, consulta modify tcp_retries2 value.
Simular Interrupción del servicio regional usando la Interfaz de Usuario de Atlas
Para simular una Interrupción del servicio regional en la IU de Atlas:
En Atlas, ve a Clusters página para tu proyecto.
Si aún no se muestra, seleccione la organización que contiene su proyecto deseado en el menú Organizations de la barra de navegación.
Si aún no aparece, selecciona el proyecto deseado en el menú Projects de la barra de navegación.
En la barra lateral, haz clic en Clusters en la sección Database.
La página de clústeres se muestra.
Go al modal de Test Resilience.
Para el clúster en el que desea realizar pruebas de interrupción, haga clic en el botón ....
Haga clic en Test Resilience.
Seleccione Regional Outage. Atlas muestra un modal Test Resilience con los pasos que Atlas sigue para simular un evento de Interrupción del servicio. Para obtener más información, consulta Simular el proceso de Interrupción del servicio regional.
Comienza la simulación.
Haga clic en Select Regions.
Selecciona la pestaña correspondiente al tipo de Interrupción del servicio que deseas simular:
Seleccione menos de la mitad de sus nodos elegibles.
Seleccione al menos uno más de la mitad de sus nodos elegibles y mantenga al menos un nodo elegible restante.
Después de seleccionar la mayoría de tus nodos elegibles, tu set de réplicas no tendrá un nodo primario. Esto significa que tu set de réplicas no puede realizar operaciones de escritura y operaciones de lectura que no estén configuradas con un readPreferenceadecuado.
(Opcional) En el menú desplegable Simulation Duration, selecciona la duración durante la cual la simulación podrá ejecutarse antes de expirar automáticamente. Este valor tiene por defecto
3días.Seleccione Simulate Regional Outage para comenzar la prueba.
Atlas le notifica cuando ocurre una interrupción.
Termina la simulación.
La simulación termina automáticamente una vez que se alcanza la duración establecida para el Simulation Duration. También puedes finalizar la simulación manualmente antes.
Nota
Atlas busca simulaciones vencidas en intervalos de 24horas, por lo que puede tomar hasta un día adicional después de la fecha de vencimiento para que la simulación se resuelva por completo.
Seleccione una pestaña correspondiente al tipo de Interrupción del servicio que está realizando:
Cuando termines de probar la Interrupción del servicio, haz clic en End Simulation.
Cuando termine de probar la interrupción regional, puede realizar una de las siguientes acciones:
Restaure su clúster multirregional agregando nodos elegibles a su conjunto de réplicas. Para obtener más información, consulte Reconfigurar un conjunto de réplicas durante una interrupción regional.
Finalice la simulación de interrupción regional haciendo clic en End Simulation.
Simular una interrupción regional mediante la API
Puedes usar el punto final de la API de prueba de Interrupción del servicio API para simular un evento de Interrupción del servicio. Para saber más sobre el proceso de Interrupción del servicio, consulte Simular el proceso de Interrupción del servicio regional.
Verificar la interrupción
Para verificar que la Interrupción del servicio sea exitosa, supervise su aplicación y asegúrese de que sus operaciones de lectura y guardado funcionen como se espera.
Resolver problema de Interrupción del servicio
La interrupción del servicio regional o la simulación de una interrupción del servicio regional que afecte a las regiones de mayor prioridad en un clúster fragmentado podría hacer que el clúster quede inoperable para las operaciones de lectura. Para restaurar los servidores de configuración, realiza lo siguiente:
Configura una preferencia de lectura adecuada para consultar nodos secundarios para lecturas.
Reconfigurar el clúster para recuperar los nodos elegibles.