Si uno de sus clústeres de Kubernetes falla, pero su clúster de operador está disponible y cada uno de los conjuntos de réplicas y conjuntos de réplicas del servidor de configuración de su fragmento de MongoDB mantienen una mayoría de votos, puede usar el operador de Kubernetes para reconfigurar las implementaciones del clúster fragmentado.
Procedimiento
Eliminar el clúster fallido del mongodb-kubernetes-operator-member-list.
Cuando un clúster nodo deje de estar operativo, debe removerlo del configmap
mongodb-kubernetes-operator-member-listque contiene la lista de clústeres nodo gestionados por el Operador de Kubernetes.Cuando actualizas el mapa de configuración, el Operador de Kubernetes se reinicia.
Una vez que se reinicia el operador de Kubernetes, sin el clúster miembro fallido en su configuración, el recurso personalizado de implementación de MongoDB del clúster multi-Kubernetes que hace referencia a este clúster fallido en su
clusterSpecListse reconcilia correctamente.Aunque el clúster de nodos fallido aún se menciona en el
clusterSpecList, se ignora durante la reconciliación (los otros clústeres se reconcilian normalmente). Sin embargo, los procesos del memeber fallidos no se eliminan de Ops Manager. En su lugar, se ignoran y se muestran en la Interfaz de Usuario de Ops Manager como si estuvieran en estado caído/obsoleto.
Escala manualmente hacia abajo los miembros del set de réplicas en el clúster fallido.
Para volver a configurar la implementación, primero debes reducir manualmente el número de miembros de set de réplicas desplegados en los clústeres de miembros fallidos a 0. Para hacerlo, puede remover todo el elemento clúster del elemento clusterSpecList o especificar su recuento de members a 0.
Nota
A veces no es posible reconfigurar correctamente la implementación cuando hay nodos no operativos en los sets de réplicas. En tal caso, primero se deben remover los procesos fallidos tanto del set de réplicas de la partición como del servidor de configuración.