Docs Menu
Docs Home
/ /

Simular una Interrupción del servicio regional

Nota

Esta característica no está disponible para ninguna de las siguientes implementaciones:

  • M0 Clústeres gratuitos

  • Clústeres Flex

Para obtener más información, consulte Límites.

Puede utilizar la interfaz de usuario Atlas y API para simular una interrupción en su clúster multirregional de Atlas y observar cómo su aplicación gestiona una interrupción en una o más regiones. También puede ejecutar varias simulaciones. Al ejecutar varias simulaciones, recomendamos un intervalo de cinco minutos entre ellas.

Para iniciar una simulación de interrupción, debe tener Organization Owner acceso o Project Owner al proyecto.

Cuando envías una solicitud para probar una Interrupción del servicio utilizando la Interfaz de Usuario de Atlas o API, Atlas simula un evento de Interrupción del servicio. Durante una Interrupción del servicio simulada, Atlas:

  • Elimina la conectividad de red a los nodos en las regiones seleccionadas.

  • No activa una alerta de monitoreo Replica set has no primary para.

  • Finaliza automáticamente la simulación después de un período de vencimiento configurable (1, 3 o 7 días).

Si su aplicación tarda más de 15 minutos en detectar la pérdida de conexión con algunos nodos, le recomendamos reducir los valores de tiempo de espera de retransmisión de TCP. Para obtener más información, consulte modificar el valor de tcp_retries2.

Para simular una interrupción regional en la interfaz de usuario de Atlas:

1
  1. Si aún no se muestra, seleccione la organización que contiene su proyecto deseado en el menú Organizations de la barra de navegación.

  2. Si aún no aparece, selecciona el proyecto deseado en el menú Projects de la barra de navegación.

  3. En la barra lateral, haz clic en Clusters en la sección Database.

La página de clústeres se muestra.

2
  1. Para el clúster en el que desea realizar pruebas de interrupción, haga clic en el botón ....

  2. Haga clic en Test Resilience.

  3. Seleccione Regional Outage. Atlas muestra un modal Test Resilience con los pasos que Atlas sigue para simular un evento de Interrupción del servicio. Para obtener más información, consulta Simular el proceso de Interrupción del servicio regional.

3
  1. Haga clic en Select Regions.

  2. Seleccione la pestaña correspondiente al tipo de interrupción que desea simular:

    Seleccione menos de la mitad de sus nodos elegibles.

    Seleccione al menos uno o más de la mitad de sus nodos elegibles y conserve al menos un nodo elegible restante.

    Tras seleccionar la mayoría de los nodos elegibles, el conjunto de réplicas no tendrá un nodo principal. Esto significa que no podrá realizar operaciones de escritura ni de lectura sin una readPreference adecuada.

  3. (Opcional) En el menú desplegable Simulation Duration, seleccione la duración de la simulación antes de que caduque automáticamente. El valor predeterminado es 3 días.

  4. Seleccione Simulate Regional Outage para comenzar la prueba.

    Atlas le notifica cuando ocurre una interrupción.

4

La simulación finaliza automáticamente al alcanzar la duración establecida para Simulation Duration. También puede finalizar la simulación manualmente antes.

Nota

Atlas busca simulaciones vencidas en intervalos de 24horas, por lo que puede tomar hasta un día adicional después de la fecha de vencimiento para que la simulación se resuelva por completo.

Seleccione una pestaña correspondiente al tipo de interrupción que está realizando:

Cuando termine de probar la interrupción, haga clic en End Simulation.

Cuando termine de probar la interrupción regional, puede realizar una de las siguientes acciones:

Puede usar el punto final de la API de prueba de interrupción para simular una interrupción. Para obtener más información sobre el proceso de interrupción, consulte Simular el proceso de interrupción regional.

Para verificar que la interrupción sea exitosa, monitoree su aplicación y asegúrese de que sus operaciones de lectura y escritura funcionen como se espera.

La interrupción del servicio regional o la simulación de una interrupción del servicio regional que afecte a las regiones de mayor prioridad en un clúster fragmentado podría hacer que el clúster quede inoperable para las operaciones de lectura. Para restaurar los servidores de configuración, realiza lo siguiente:

Volver

Prueba de conmutación por error primaria

En esta página