Se um dos clusters Kubernetes falhar, mas o cluster do operador estiver disponível, e cada um dos conjuntos de réplicas do shard do MongoDB e dos conjuntos de réplicas do servidor de configuração manter uma maioria votante, você poderá usar o Operador Kubernetes para reconfigurar os sistemas do cluster fragmentado.
Procedimento
Remova o cluster com falha mongodb-enterprise-operator-member-list
do.
Quando um cluster de membros não está mais operacional, você deve removê-lo do configmap do
mongodb-enterprise-operator-member-list
que contém a lista de clusters de membros que o Operador Kubernetes está gerenciando.Quando você atualiza o mapa de configuração, o Operador Kubernetes é reiniciado.
Depois que o Kubernetes Operator for reiniciado, sem o cluster de membros com falha em sua configuração, o recurso personalizado de sistema do MongoDB do cluster multi-Kubernetes que faz referência a esse cluster com falha em seu
clusterSpecList
se reconcilia corretamente.Embora o cluster de membros com falha ainda seja referenciado no
clusterSpecList
, ele é ignorado durante a reconciliação (outros clusters são reconciliados normalmente). No entanto, os processos do membro com falha não são removidos do Ops Manager. Em vez disso, eles são ignorados e mostrados na interface do usuário do Ops Manager como em um estado inativo/obsoleto.
Reduza manualmente os membros do conjunto de réplicas no cluster com falha.
Para reconfigurar a implantação, você deve primeiro reduzir manualmente os membros do conjunto de réplicas implantados nos clusters de membros com falha para 0
. Para fazer isso, você pode remover todo o elemento de cluster do elemento clusterSpecList
ou especificar sua contagem de members
para 0
.
Observação
Às vezes, não é possível reconfigurar corretamente o sistema quando há membros não operacionais de conjuntos de réplicas. Nesse caso, você deve remover primeiro os processos com falha dos conjuntos de réplicas do shard e do servidor de configuração .