Si uno de tus Kubernetes clústeres falla, pero tu clúster operador está disponible, y cada uno de los sets de réplicas de particiones de MongoDB y sets de réplicas de servidores de configuración mantienen una mayoría de votos, puedes utilizar el Operador de Kubernetes para reconfigurar las implementaciones del clúster fragmentado.
Procedimiento
Remueve el clúster fallido de la mongodb-kubernetes-operator-member-list.
Cuando un clúster nodo deje de estar operativo, debe removerlo del configmap
mongodb-kubernetes-operator-member-listque contiene la lista de clústeres nodo gestionados por el Operador de Kubernetes.Cuando actualizas el mapa de configuración, el Operador de Kubernetes se reinicia.
Después de que el Operador de Kubernetes se reinicie, sin el clúster de nodos fallido en su configuración, el recurso personalizado de implementación de MongoDB en un clúster múltiple de Kubernetes que hace referencia a este clúster fallido en su
clusterSpecListse reconcilia correctamente.Aunque el clúster de nodos fallido aún se menciona en el
clusterSpecList, se ignora durante la reconciliación (los otros clústeres se reconcilian normalmente). Sin embargo, los procesos del memeber fallidos no se eliminan de Ops Manager. En su lugar, se ignoran y se muestran en la Interfaz de Usuario de Ops Manager como si estuvieran en estado caído/obsoleto.
Escala manualmente hacia abajo los miembros del set de réplicas en el clúster fallido.
Para volver a configurar la implementación, primero debes reducir manualmente el número de miembros de set de réplicas desplegados en los clústeres de miembros fallidos a 0. Para hacerlo, puede remover todo el elemento clúster del elemento clusterSpecList o especificar su recuento de members a 0.
Nota
A veces no es posible reconfigurar correctamente la implementación cuando hay nodos no operativos en los sets de réplicas. En tal caso, primero se deben remover los procesos fallidos tanto del set de réplicas de la partición como del servidor de configuración.