您可以部署第二个Ops Manager实例(称为从节点(secondary node from replica set)Ops Manager)来备份主节点 (primary node in the replica set)Ops Manager及其 后端数据库。如果您丢失主节点 (primary node in the replica set)Ops Manager ,从节点(secondary node from replica set)Ops Manager还可作为恢复路径。
此模式可保护Ops Manager存储在其应用程序数据库和元数据存储中的操作数据。使用本指南为Ops Manager本身设计、配置和操作灾难恢复。
本指南适用于管理备份和灾难恢复的Ops Manager管理员,以及为Ops Manager设计高可用性和灾难恢复拓扑的团队。
从节点Ops Manager备份的工作原理
在此模式中,两个Ops Manager实例具有不同的职责:
主节点 (primary node in the replica set)Ops Manager像往常一样管理MongoDB部署及其备份。
从节点(secondary node from replica set)Ops Manager仅管理和备份主节点 (primary node in the replica set)Ops Manager 的后端数据库。从节点(secondary node from replica set)Ops Manager不管理应用程序集群。
MongoDB 助手在主节点 (primary node in the replica set)Ops Manager应用程序数据库的每个托管上运行,并向从节点(secondary node from replica set)Ops Manager注册。从从节点(secondary node from replica set)Ops Manager对这些后端数据库进行连续备份和时点备份。
如果主节点 (primary node in the replica set)Ops Manager丢失,则可从从节点(secondary node from replica set)Ops Manager恢复其后端数据库,然后启动新的主节点 (primary node in the replica set)Ops Manager。主节点 (primary node in the replica set)Ops Manager重新连接到已恢复的后端数据库,并恢复对MongoDB部署的管理。
当MongoDB助手在重启后重新连接时,它们会报告比恢复的数据库更新的配置版本。主节点 (primary node in the replica set)Ops Manager检测到不匹配情况,自动进入受影响项目的恢复模式,将所有代理收敛到恢复的配置上,并阻止部署更改,直到协调完成。
架构
下表描述了此模式中的组件及其职责:
组件 | 责任 |
|---|---|
Primary Ops Manager | 管理您的MongoDB部署及其备份。将自己的操作数据存储在其应用程序数据库、快照元数据存储和oplog元数据存储中。 |
从节点Ops Manager | 运行备份守护程序,写入应用程序数据库快照和oplog切片的 S 兼容存储块存储。持续备份主节点 (primary node in the replica set)Ops Manager 的后端数据库。不管理应用程序集群。3 |
应用程序数据库 | 存储主节点 (primary node in the replica set)Ops Manager 的操作数据,包括项目配置、自动化状态和备份元数据。您必须备份应用程序数据库。 |
快照和oplog元数据存储 | 存储主节点 (primary node in the replica set)Ops Manager备份的部署的区块和oplog索引。同时备份这些存储。 |
MongoDB 助手 | 在每个后端数据库托管上运行并向从节点(secondary node from replica set)Ops Manager注册以执行备份和恢复。 |
从节点(secondary node from replica set)Ops Manager将主节点 (primary node in the replica set)Ops Manager 的后端数据库的备份存储在自己的 S3 兼容存储块存储中,与主节点 (primary node in the replica set)Ops Manager 的备份存储分开。
部署变体
将从节点(secondary node from replica set)Ops Manager部署在与主节点 (primary node in the replica set)Ops Manager不同的故障域中,以防止单个故障影响两个实例。常见变体包括:
不同地区
将从节点(secondary node from replica set)Ops Manager部署在与主节点 (primary node in the replica set)Ops Manager不同的云地区中。此变体可防止丢失地区。
不同的数据中心
将从节点(secondary node from replica set)Ops Manager部署在与主节点 (primary node in the replica set)Ops Manager不同的数据中心。此变体可防止数据中心丢失。
独立的备份网络
将从节点(secondary node from replica set)Ops Manager放置在专用于备份流量的单独网络上。此变体将备份流量与应用程序网络隔离。
重要
将从节点(secondary node from replica set)Ops Manager部署在与主节点 (primary node in the replica set)Ops Manager不同的故障域中,例如不同的机架、可用区、地区或网段。如果两个实例股票一个故障域,则单个故障可能会扰乱主节点 (primary node in the replica set)Ops Manager及其恢复路径。
支持的版本和限制
在使用此模式之前,查看以下要求和限制。
支持的版本
主节点 (primary node in the replica set)Ops Manager实例和从节点(secondary node from replica set)Ops Manager 实例都必须运行Ops Manager 8.0.24 或更高版本。
从节点(secondary node from replica set)Ops Manager必须运行与主节点 (primary node in the replica set)Ops Manager相同或更高的版本。请勿运行版本早于主节点 (primary node in the replica set)Ops Manager Manager 的从从节点(secondary node from replica set)Ops Ops Manager。
警告
将应用程序数据库恢复到与创建快照的主节点 (primary node in the replica set)Ops Manager运行的版本相同或更高的主节点 (primary node in the replica set)Ops Manager 。如果替换二进制文件早于应用程序数据库记录的版本,Ops Manager将拒绝启动,并显示“不允许降级”错误。
限制
此模式会备份主节点 (primary node in the replica set)Ops Manager 的后端数据库。它不会备份任意MongoDB集群。主节点 (primary node in the replica set)Ops Manager会继续管理MongoDB部署的备份。
备份和协调快照元数据存储和oplog元数据存储是一个手动过程。 Ops Manager不会自动为这些存储选择恢复点。因此,恢复后备份元数据可能会不一致,并且某些备份可能无法恢复。 Ops Manager在恢复和因错误而失败之前验证快照,而不是执行不安全的恢复。
恢复模式应用用于外部托管的部署,例如Kubernetes Operator 管理的部署。恢复应用程序数据库后,这些项目中的代理会在下一次轮询时直接接收恢复的配置并收敛,而无需进入恢复模式。无需对这些项目执行任何动作。
如果快照的数据块不再位于快照存储中,则快照可能无法恢复。在恢复之前,主节点 (primary node in the replica set)Ops Manager会验证快照的区块是否存在。如果块丢失,则恢复会失败并显示错误,并使副本集保持不变,而不是擦除副本集并中途失败。
未经测试的恢复存在操作风险。定期验证备份和恢复路径。请参阅从辅助Ops Manager恢复Ops Manager中的验证操作手册。
后续步骤
要设立和操作此模式,请参阅以下页面: