Docs 主页 → 启动和管理 MongoDB → MongoDB Atlas
模拟区域中断
注意
此功能不适用于
M0
免费集群、M2
和M5
集群。如需了解更多信息,请参阅 Atlas M0(免费集群)、M2 和 M5 限制。无服务器实例目前不支持此功能。要了解更多信息,请参阅无服务器实例限制。
您可以使用 Atlas 用户界面和API模拟 Atlas 多区域集群上的中断,并观察应用程序如何处理一个或多个区域中的中断。您还可以运行多个模拟。运行多个模拟时,我们建议模拟之间的间隔时间为五分钟。
必需的访问权限
要开始服务中断模拟,您必须拥有Organization Owner
或Project Owner
访问权限的项目。
模拟区域服务中断过程
当您使用 Atlas 用户界面或API提交测试服务中断的请求时,Atlas 会模拟服务中断事件。在模拟服务中断期间,Atlas:
删除所选地区中节点的网络连接。
不trigger
Replica set has no primary
的监控警报。
如果您的应用程序需要超过15分钟才能注意到与某些节点的连接丢失,我们建议您减少TCP重新传输超时值。要了解详情,请参阅 修改 tcp_retries 2值。
使用 Atlas 用户界面模拟区域中断
要在 Atlas 用户界面中模拟服务中断,请执行以下操作:
登录 Atlas 用户界面。
单击 Database。
对于要执行服务中断测试的集群,请单击...按钮。
单击 Test Resilience(连接)。
选择Regional Outage 。 Atlas 显示一个Test Resilience模态,其中包含 Atlas 为模拟中断事件而采取的步骤。要了解更多信息,请参阅模拟区域中断过程。
单击 Select Regions(连接)。
选择与要模拟的服务中断类型相对应的标签页:
选择Simulate Regional Outage开始测试。 Atlas 会在服务中断发生时通知您。
选择与您要执行的停电类型相对应的标签页:
使用API模拟区域中断
验证服务中断
要验证服务中断是否成功,请监控应用程序并确保读写操作按预期运行。
故障排除服务中断
影响分片集群中最高优先级区域的区域中断或区域中断模拟可能会导致集群无法进行读取操作。要恢复配置服务器,请执行以下操作: