Recupere el clúster particionado si el clúster de operadores está operativo

Si uno de tus Kubernetes clústeres falla, pero tu clúster operador está disponible, y cada uno de los sets de réplicas de particiones de MongoDB y sets de réplicas de servidores de configuración mantienen una mayoría de votos, puedes utilizar el Operador de Kubernetes para reconfigurar las implementaciones del clúster fragmentado.

Procedimiento

Remueve el clúster fallido de la `mongodb-kubernetes-operator-member-list`.

Cuando un clúster nodo deje de estar operativo, debe removerlo del configmap mongodb-kubernetes-operator-member-list que contiene la lista de clústeres nodo gestionados por el Operador de Kubernetes.
Cuando actualizas el mapa de configuración, el Operador de Kubernetes se reinicia.
Después de que el Operador de Kubernetes se reinicie, sin el clúster de nodos fallido en su configuración, el recurso personalizado de implementación de MongoDB en un clúster múltiple de Kubernetes que hace referencia a este clúster fallido en su clusterSpecList se reconcilia correctamente.
Aunque el clúster de nodos fallido aún se menciona en el clusterSpecList, se ignora durante la reconciliación (los otros clústeres se reconcilian normalmente). Sin embargo, los procesos del memeber fallidos no se eliminan de Ops Manager. En su lugar, se ignoran y se muestran en la Interfaz de Usuario de Ops Manager como si estuvieran en estado caído/obsoleto.

Escala manualmente hacia abajo los miembros del set de réplicas en el clúster fallido.

Para volver a configurar la implementación, primero debes reducir manualmente el número de miembros de set de réplicas desplegados en los clústeres de miembros fallidos a 0. Para hacerlo, puede remover todo el elemento clúster del elemento clusterSpecList o especificar su recuento de members a 0.

Nota

A veces no es posible reconfigurar correctamente la implementación cuando hay nodos no operativos en los sets de réplicas. En tal caso, primero se deben remover los procesos fallidos tanto del set de réplicas de la partición como del servidor de configuración.

Reconfigura la implementación a su estado original.

Después de que hayas ajustado las cuentas fallidas de members a 0, puedes reconfigurar la implementación a su tamaño original añadiendo nodos en clústeres de Kubernetes saludables o añadiendo clústeres completamente nuevos.

Volver

Recuperación ante desastres de clúster sharded

Recuperar clúster fallido