Recupere el clúster particionado si el clúster de operadores está operativo

Si uno de sus clústeres de Kubernetes falla, pero su clúster de operador está disponible y cada uno de los conjuntos de réplicas y conjuntos de réplicas del servidor de configuración de su fragmento de MongoDB mantienen una mayoría de votos, puede usar el operador de Kubernetes para reconfigurar las implementaciones del clúster fragmentado.

Procedimiento

Eliminar el clúster fallido del `mongodb-kubernetes-operator-member-list`.

Cuando un clúster nodo deje de estar operativo, debe removerlo del configmap mongodb-kubernetes-operator-member-list que contiene la lista de clústeres nodo gestionados por el Operador de Kubernetes.
Cuando actualizas el mapa de configuración, el Operador de Kubernetes se reinicia.
Una vez que se reinicia el operador de Kubernetes, sin el clúster miembro fallido en su configuración, el recurso personalizado de implementación de MongoDB del clúster multi-Kubernetes que hace referencia a este clúster fallido en su clusterSpecList se reconcilia correctamente.
Aunque el clúster de nodos fallido aún se menciona en el clusterSpecList, se ignora durante la reconciliación (los otros clústeres se reconcilian normalmente). Sin embargo, los procesos del memeber fallidos no se eliminan de Ops Manager. En su lugar, se ignoran y se muestran en la Interfaz de Usuario de Ops Manager como si estuvieran en estado caído/obsoleto.

Escala manualmente hacia abajo los miembros del set de réplicas en el clúster fallido.

Para volver a configurar la implementación, primero debes reducir manualmente el número de miembros de set de réplicas desplegados en los clústeres de miembros fallidos a 0. Para hacerlo, puede remover todo el elemento clúster del elemento clusterSpecList o especificar su recuento de members a 0.

Nota

A veces no es posible reconfigurar correctamente la implementación cuando hay nodos no operativos en los sets de réplicas. En tal caso, primero se deben remover los procesos fallidos tanto del set de réplicas de la partición como del servidor de configuración.

Reconfigura la implementación a su estado original.

Una vez que haya escalado los recuentos fallidos members a 0, puede reconfigurar la implementación a su tamaño original agregando miembros en clústeres de Kubernetes en buen estado o agregando clústeres completamente nuevos también.

Volver

Recuperación ante desastres de clúster sharded

Recuperar clúster fallido