/ /

在多个Kubernetes集群上部署

Docs 主页

管理

Kubernetes Operator（已弃用）

在多个Kubernetes集群上部署

Docs 主页

管理

Kubernetes Operator（已弃用）

在多个Kubernetes集群上部署

灾难恢复

MongoDB Enterprise Kubernetes Operator 已弃用。新的MongoDB Controllers for Kubernetes Operator 取代了MongoDB Enterprise Kubernetes Operator。第一个版本的 Controllers for Kubernetes Operator 在功能上等同于 v1.33 的Enterprise Kubernetes Operator。有关此更改的更多信息以及迁移到新 Operator 的指导，请参阅第一个新版本的发布说明。MongoDB Enterprise Kubernetes Operator 的未来版本将不会再发布。根据现有的一年支持政策，每个版本都将结束生命周期。请迁移到Kubernetes Operator 的控制器以获得持续支持。

当 Kubernetes 操作符识别出原始 Kubernetes 集群已关闭时，Kubernetes 操作符可以协调将 MongoDB 副本集成员恢复到健康的 Kubernetes 集群。

灾难恢复模式

Kubernetes Operator 可以在灾难恢复场景中使用以下模式之一协调 MongoDBMultiCluster 资源的自动或手动修复：

自动故障转移模式允许 Kubernetes Operator 将受影响的 MongoDB 副本集成员从不健康的 Kubernetes 集群转移到健康的 Kubernetes 集群。当 Kubernetes 操作符执行此自动修复时，它会在健康的 Kubernetes 集群之间平均分配副本集成员。

要启用此模式，请使用适用于Kubernetes的MongoDB Helm Charts中的 --set multiCluster.performFailover=true。在MongoDB Helm Charts for Kubernetes目录中的 values.yaml文件中，环境变量默认值为 true。

或者，您可以将多 Kubernetes 集群 MongoDB 部署环境变量PERFORM_FAILOVER设置为true ，如以下简短示例所示：
spec: template: ... spec: containers: - name: mongodb-enterprise-operator ... env: ... - name: PERFORM_FAILOVER value: "true" ...
手动（基于插件）故障转移模式允许您使用MongoDB kubectl 插件重新配置Kubernetes Operator，以使用新的健康Kubernetes集群。在此模式下，您可以根据自己的配置配置 MongoDBMultiCluster资源，从而在新的运行状况良好的集群中分配副本集成员。

要启用此模式，请使用适用于Kubernetes的MongoDB Helm Charts中的 --set multiCluster.performFailover=true，或将多 Kubernetes集群MongoDB 部署环境变量 PERFORM_FAILOVER设立为 false，如以下简短示例所示：
spec: template: ... spec: containers: - name: mongodb-enterprise-operator ... env: ... - name: PERFORM_FAILOVER value: "false" ...

注意

当托管一个或多个 Kubernetes Operator 实例的 Kubernetes 集群出现故障，或者副本集成员与管理它的 Kubernetes 驻留在同一故障 Kubernetes 集群时，您不能依赖自动或手动故障转移模式。

在这种情况下，要将副本集成员从丢失的Kubernetes集群恢复到剩余的健康Kubernetes集群，您必须首先恢复管理多 Kubernetes集群MongoDB部署的Kubernetes Operator实例，或者将Kubernetes Operator 重新部署到剩余的Kubernetes集群之一，然后重新运行 kubectl mongodb 插件。要学习；了解更多信息，请参阅使用MongoDB插件从故障中手动恢复。

使用 MongoDB 插件从故障中手动恢复

当托管一个或多个 Kubernetes Operator 实例的 Kubernetes 集群出现故障，或者副本集成员与管理它的 Kubernetes 驻留在同一故障 Kubernetes 集群上时，您不能依赖自动或手动故障转移模式，而必须使用以下从失败的 Kubernetes 集群中手动恢复的过程。

以下过程使用MongoDB kubectl 插件执行以下操作：

配置新的运行状况良好的 Kubernetes 集群。
将这些 Kubernetes 集群作为新成员集群添加到多 Kubernetes 集群 MongoDB 部署的mongodb-enterprise-operator-member-list ConfigMap 中。
在运行状况良好的Kubernetes集群中的节点上重新平衡托管 MongoDBMultiCluster 资源的节点。

以下手动灾难恢复教程假设您：

按照多 Kubernetes 集群快速入门，部署了一个操作符集群和三个成员集群。在这种情况下，安装Kubernetes Operator 时会使用 --set multiCluster.performFailover=false 禁用自动故障转移。

按如下方式部署 MongoDBMultiCluster资源：

kubectl apply -n mongodb -f - <<EOF
apiVersion: mongodb.com/v1
kind: MongoDBMultiCluster
metadata:
 name: multi-replica-set
spec:
 version: 8.0.0
 type: ReplicaSet
 persistent: false
 duplicateServiceObjects: true
 credentials: my-credentials
 opsManager:
   configMapRef:
     name: my-project
 security:
   tls:
     ca: custom-ca
 clusterSpecList:
   - clusterName: ${MDB_CLUSTER_1_FULL_NAME}
     members: 3
   - clusterName: ${MDB_CLUSTER_2_FULL_NAME}
     members: 2
   - clusterName: ${MDB_CLUSTER_3_FULL_NAME}
     members: 3
EOF

Kubernetes Operator 通过对相应服务器的 /readyz 端点执行 ping 操作来定期检查与多 Kubernetes集群MongoDB 部署中集群的连接。要学习；了解有关 /readyz 的详情，请参阅Kubernetes API运行状况端点。

如果示例中的 CLUSTER_3 不可用， Kubernetes Operator 会检测到与集群的失败连接，并使用 failedClusters 注解标记 MongoDBMultiCluster 资源，以便后续协调。

在您按照以下过程运行手动恢复步骤之前，此集群上部署有数据节点的资源无法协调。

要重新平衡 MongoDB 数据节点，以便所有工作负载都在CLUSTER_1和CLUSTER_2上运行：

使用MongoDB kubectl 插件恢复多 Kubernetes集群MongoDB 部署。

kubectl mongodb multicluster recover \
  --central-cluster="MDB_CENTRAL_CLUSTER_FULL_NAME" \
  --member-clusters="${MDB_CLUSTER_1_FULL_NAME},${MDB_CLUSTER_2_FULL_NAME}" \
  --member-cluster-namespace="mongodb" \
  --central-cluster-namespace="mongodb" \
  --operator-name=mongodb-enterprise-operator-multi-cluster \
  --source-cluster="${MDB_CLUSTER_1_FULL_NAME}"

此命令：

重新配置 Kubernetes 操作符，以托管两个正常运行的 Kubernetes 集群上的工作负载。（此列表还可能包括新的 Kubernetes 集群）。
将CLUSTER_1标记为新 Kubernetes 集群的成员节点配置的配置源。复制角色和服务帐户配置以匹配CLUSTER_1中的配置。

重新平衡运行状况良好的 Kubernetes 集群上的数据节点。

通过编辑受更改影响的资源，重新配置MongoDBMultiCluster资源以重新平衡运行状况良好的 Kubernetes 集群上的数据节点：

kubectl apply -n mongodb -f - <<EOF
apiVersion: mongodb.com/v1
kind: MongoDBMultiCluster
metadata:
  name: multi-replica-set
spec:
  version: 8.0.0
  type: ReplicaSet
  persistent: false
  duplicateServiceObjects: true
  credentials: my-credentials
  opsManager:
    configMapRef:
      name: my-project
 security:
   tls:
     ca: custom-ca
 clusterSpecList:
   - clusterName: ${MDB_CLUSTER_1_FULL_NAME}
     members: 4
   - clusterName: ${MDB_CLUSTER_2_FULL_NAME}
     members: 3
 EOF

使用 GitOps 工作流从故障中手动恢复

有关在具有 Argo CD 的 GitOps 工作流程中使用 MongoDB kubectl 插件的示例，请参阅 GitOps 的多集群插件示例。

GitOps 恢复需要使用 .yaml 资源文件手动重新配置基于角色的访问控制。要学习；了解更多信息，请参阅了解Kubernetes角色和角色绑定。

后退

没有服务网格的分片集群

来年

分片集群灾难恢复