Join us Sept 17 at .local NYC! Use code WEB50 to save 50% on tickets. Learn more >
MongoDB Event
Docs 菜单
Docs 主页
/
Enterprise Kubernetes Operator
/ /

在 Operator 集群可操作的情况下恢复分片集群

如果您的一个Kubernetes集群出现故障,但操作符集群可用,并且每个MongoDB分片的副本集和配置服务器副本集都保持投票多数,则可以使用Kubernetes Operator 重新配置分片集群的部署。

1
  1. 当成员集群无法再运行时,您必须将其从包含Kubernetes Operator 管理的成员集群列表的 mongodb-enterprise-operator-member-list 配置映射中删除。

  2. 更新配置映射时, Kubernetes Operator 会重新启动。

  3. Kubernetes Operator 重新启动后,如果其配置中没有出现故障的成员集群,在其 clusterSpecList 中引用此故障集群的多 Kubernetes集群MongoDB 部署自定义资源将正确进行协调。

    即使 clusterSpecList 中仍引用出现故障的成员集群,但在协调过程中将其忽略(其他集群可正常协调)。但是,失败成员的进程不会从MongoDB Ops Manager中删除。 相反,它们会被忽略,并在MongoDB Ops Manager用户界面中显示为处于关闭/过时状态。

2

为了重新配置部署,您必须首先手动将部署在故障节点集群中的副本集扩展到 0。为此,您可以从 clusterSpecList 元素中删除整个集群元素,或将其 members 计数指定为 0

注意

有时,当副本集存在非操作成员时,无法正确重新部署。在这种情况下,您必须先从分片和配置服务器副本集中删除失败的进程。

3

将失败的 members 计数扩展到 0 后,您可以通过在正常运行的Kubernetes集群上添加成员或添加全新的集群,将部署重新配置为其原始大小。

后退

分片集群灾难恢复

在此页面上