Nota
Esta característica no está disponible para ninguna de las siguientes implementaciones:
M0Clústeres gratuitosClústeres Flex
Para obtener más información, consulte Límites.
Puede utilizar la interfaz de usuario Atlas y API para simular una interrupción en su clúster multirregional de Atlas y observar cómo su aplicación gestiona una interrupción en una o más regiones. También puede ejecutar varias simulaciones. Al ejecutar varias simulaciones, recomendamos un intervalo de cinco minutos entre ellas.
Acceso requerido
Para iniciar una simulación de interrupción, debe tener Organization Owner acceso o Project Owner al proyecto.
Simular el proceso de interrupción regional
Cuando envías una solicitud para probar una Interrupción del servicio utilizando la Interfaz de Usuario de Atlas o API, Atlas simula un evento de Interrupción del servicio. Durante una Interrupción del servicio simulada, Atlas:
Elimina la conectividad de red a los nodos en las regiones seleccionadas.
No activa una alerta de monitoreo
Replica set has no primarypara.Finaliza automáticamente la simulación después de un período de vencimiento configurable (1, 3 o 7 días).
Si su aplicación tarda más de 15 minutos en detectar la pérdida de conexión con algunos nodos, le recomendamos reducir los valores de tiempo de espera de retransmisión de TCP. Para obtener más información, consulte modificar el valor de tcp_retries2.
Simular una interrupción regional mediante la interfaz de usuario de Atlas
Para simular una interrupción regional en la interfaz de usuario de Atlas:
En Atlas, vaya a la Clusters Página para su proyecto.
Si aún no se muestra, seleccione la organización que contiene su proyecto deseado en el menú Organizations de la barra de navegación.
Si aún no aparece, selecciona el proyecto deseado en el menú Projects de la barra de navegación.
En la barra lateral, haz clic en Clusters en la sección Database.
La página de clústeres se muestra.
Vaya al Test Resilience modal.
Para el clúster en el que desea realizar pruebas de interrupción, haga clic en el botón ....
Haga clic en Test Resilience.
Seleccione Regional Outage. Atlas muestra un modal Test Resilience con los pasos que Atlas sigue para simular un evento de Interrupción del servicio. Para obtener más información, consulta Simular el proceso de Interrupción del servicio regional.
Comience la simulación.
Haga clic en Select Regions.
Seleccione la pestaña correspondiente al tipo de interrupción que desea simular:
Seleccione menos de la mitad de sus nodos elegibles.
Seleccione al menos uno o más de la mitad de sus nodos elegibles y conserve al menos un nodo elegible restante.
Tras seleccionar la mayoría de los nodos elegibles, el conjunto de réplicas no tendrá un nodo principal. Esto significa que no podrá realizar operaciones de escritura ni de lectura sin una readPreference adecuada.
(Opcional) En el menú desplegable Simulation Duration, seleccione la duración de la simulación antes de que caduque automáticamente. El valor predeterminado es
3días.Seleccione Simulate Regional Outage para comenzar la prueba.
Atlas le notifica cuando ocurre una interrupción.
Finalizar la simulación.
La simulación finaliza automáticamente al alcanzar la duración establecida para Simulation Duration. También puede finalizar la simulación manualmente antes.
Nota
Atlas busca simulaciones vencidas en intervalos de 24horas, por lo que puede tomar hasta un día adicional después de la fecha de vencimiento para que la simulación se resuelva por completo.
Seleccione una pestaña correspondiente al tipo de interrupción que está realizando:
Cuando termine de probar la interrupción, haga clic en End Simulation.
Cuando termine de probar la interrupción regional, puede realizar una de las siguientes acciones:
Restaure su clúster multirregional agregando nodos elegibles a su conjunto de réplicas. Para obtener más información, consulte Reconfigurar un conjunto de réplicas durante una interrupción regional.
Finalice la simulación de interrupción regional haciendo clic en End Simulation.
Simular una interrupción regional mediante la API
Puede usar el punto final de la API de prueba de interrupción para simular una interrupción. Para obtener más información sobre el proceso de interrupción, consulte Simular el proceso de interrupción regional.
Verificar la interrupción
Para verificar que la interrupción sea exitosa, monitoree su aplicación y asegúrese de que sus operaciones de lectura y escritura funcionen como se espera.
Solucionar problemas de interrupción
La interrupción del servicio regional o la simulación de una interrupción del servicio regional que afecte a las regiones de mayor prioridad en un clúster fragmentado podría hacer que el clúster quede inoperable para las operaciones de lectura. Para restaurar los servidores de configuración, realiza lo siguiente:
Configura una preferencia de lectura adecuada para consultar nodos secundarios para lecturas.
Reconfigurar el clúster para recuperar los nodos elegibles.