Nota
Esta característica no está disponible para ninguna de las siguientes implementaciones:
Clústeres gratuitos
Clústeres Flex
Para obtener más información, consulta Límites.
Puedes utilizar la Interfaz de Usuario de Atlas y la API para simular una interrupciones del servicio en tu clúster multiregional de Atlas y observar cómo tu aplicación gestiona una interrupciones del servicio en una o más regiones. También puedes ejecutar múltiples simulaciones. Al ejecutar múltiples simulaciones, recomendamos un intervalo de cinco minutos entre simulaciones.
Acceso requerido
Para iniciar una simulación de interrupción del servicio, debes tener acceso de Organization Owner o Project Owner al proyecto.
Simula el proceso de Interrupción del servicio regional
Cuando envías una solicitud para probar una Interrupción del servicio utilizando la interfaz de usuario de Atlas o API, Atlas simula un evento de Interrupción del servicio. Durante una Interrupción del servicio simulada, Atlas:
Elimina la conectividad de red a los nodos en las regiones seleccionadas.
No se activa una alerta de supervisión para
Replica set has no primary.Finaliza automáticamente la simulación después de un período de expiración configurable (1, 3 o 7 días).
Si su aplicación tarda más de 15 minutos en notar la pérdida de conexión con algunos nodos, le recomendamos que reduzca los valores de tiempo de espera de retransmisión de TCP. Para obtener más información, consulta el valor de modificar tcp_retries2.
Simular Interrupción del servicio regional usando la Interfaz de Usuario de Atlas
Para simular una Interrupción del servicio regional en la IU de Atlas:
En Atlas, ve a la página Clusters de tu proyecto.
Si aún no se muestra, seleccione la organización que contiene su proyecto deseado en el menú Organizations de la barra de navegación.
Si aún no aparece, selecciona el proyecto deseado en el menú Projects de la barra de navegación.
En la barra lateral, haz clic en Clusters en la sección Database.
La página de clústeres se muestra.
Go al modal de Test Resilience.
Para el clúster en el que desea realizar la prueba de interrupción del servicio, haga clic en el botón ....
Haga clic en Test Resilience.
Regional OutageSeleccione. Atlas muestra un Test Resilience modal con los pasos que sigue para simular una interrupción. Para obtener más información, consulte Simular el proceso de interrupción regional.
Comienza la simulación.
Haga clic en Select Regions.
Selecciona la pestaña correspondiente al tipo de Interrupción del servicio que deseas simular:
Selecciona menos de la mitad de tus nodos elegibles.
Seleccione al menos uno más de la mitad de sus nodos elegibles y mantenga al menos un nodo elegible restante.
Después de seleccionar la mayoría de tus nodos elegibles, tu set de réplicas no tendrá un nodo primario. Esto significa que tu set de réplicas no puede realizar operaciones de escritura y operaciones de lectura que no estén configuradas con un readPreferenceadecuado.
(Opcional) En el menú desplegable Simulation Duration, selecciona la duración durante la cual la simulación podrá ejecutarse antes de expirar automáticamente. Este valor tiene por defecto
3días.Selecciona Simulate Regional Outage para comenzar la prueba.
Atlas te notifica cuando ocurre la Interrupción del servicio.
Termina la simulación.
La simulación termina automáticamente una vez que se alcanza la duración establecida para el Simulation Duration. También puedes finalizar la simulación manualmente antes.
Nota
Atlas verifica la presencia de simulaciones caducadas en intervalos de 24horas, por lo que la simulación podría tardar hasta un día adicional después de la fecha de caducidad en resolverse por completo.
Seleccione una pestaña correspondiente al tipo de Interrupción del servicio que está realizando:
Cuando termines de probar la Interrupción del servicio, haz clic en End Simulation.
Cuando completes la prueba de la Interrupción del servicio regional, puedes realizar una de las siguientes acciones:
Restaura tu clúster multiregional agregando nodos elegibles a tu set de réplicas. Para obtener más información, consulta Reconfigurar un set de réplicas Durante una Interrupción Regional.
Termina la simulación de Interrupción del servicio regional haciendo clic en End Simulation.
Simular una interrupción regional mediante la API
Puedes usar el endpoint Prueba de Interrupción del servicio API para simular un evento de Interrupción del servicio. Para obtener más información sobre el proceso de Interrupción del servicio, consulta Simular proceso de Interrupción del servicio regional.
Verifica la Interrupción del servicio
Para verificar que la Interrupción del servicio sea exitosa, supervise su aplicación y asegúrese de que sus operaciones de lectura y guardado funcionen como se espera.
Resolver problema de Interrupción del servicio
La interrupción del servicio regional o la simulación de una interrupción del servicio regional que afecte a las regiones de mayor prioridad en un clúster fragmentado podría hacer que el clúster quede inoperable para las operaciones de lectura. Para restaurar los servidores de configuración, realiza lo siguiente:
Configura una preferencia de lectura adecuada para consultar nodos secundarios para lecturas.
Reconfigurar el clúster para recuperar los nodos elegibles.