解析警报
Atlas 会根据警报设置中配置的数据库和服务器条件发出警报。当某个条件触发警报时,Atlas 会在集群上显示警告符号并发送警报通知。警报设置决定了通知方法。 Atlas 会继续定期发送通知,直到问题解决或您删除或禁用警报。您应该解决眼前的问题,实施长期解决方案,并查看指标以监控进度。
注意
如果与 VictorOps、OpsGenie 或 DataDog 集成,则可以在 Atlas 中接收来自这些第三方监控服务的信息警报。但是,您必须在每个外部服务中解决这些警报。
查看警报
要使用 Atlas CLI 列出指定 Atlas 项目的所有警报,请运行以下命令:
atlas alerts list [options]
要返回使用 Atlas CLI 指定的项目中一个警报的详细信息,请运行以下命令:
atlas alerts describe <alertId> [options]
要了解有关上述命令的语法和参数的更多信息,请参阅 Atlas警报列表和Atlas 警报描述的 Atlas CLI 文档。
您可以在 Project Alerts 页面中查看打开的警报、关闭的警报和警报设置。Atlas 会为出现在 Open 标签页上的所有警报发送通知。要了解更多信息,请参阅警报工作流程。
要使用 Atlas 用户界面查看所有打开的警报,请执行以下操作:
在 Atlas 中,转到Project Alerts 页面。
如果尚未显示,请选择包含所需项目的组织导航栏中的Organizations菜单。
如果尚未显示,请从导航栏的Projects菜单中选择所需的项目。
执行以下步骤之一:
单击导航栏中的Project Alerts图标。
在Projects菜单旁边,展开Options菜单,单击Project Settings ,然后单击侧边栏中的Alerts 。
显示“项目警报”页面。
确认警报
要使用 Atlas CLI 确认指定项目的一个警报,请运行以下命令:
atlas alerts acknowledge <alertId> [options]
要了解有关命令语法和参数的更多信息,请参阅 Atlas CLI 文档以了解Atlas 警报确认。
要使用 Atlas 用户界面确认警报,请执行以下操作:
在 Atlas 中,转到Project Alerts 页面。
如果尚未显示,请选择包含所需项目的组织导航栏中的Organizations菜单。
如果尚未显示,请从导航栏的Projects菜单中选择所需的项目。
执行以下步骤之一:
单击导航栏中的Project Alerts图标。
在Projects菜单旁边,展开Options菜单,单击Project Settings ,然后单击侧边栏中的Alerts 。
显示“项目警报”页面。
当你确认警报时,Atlas 不会再发送通知,直到确认期结束、你解决警报状况或取消确认警报为止。如果警报条件在确认期间结束,Atlas 会发送通知。
取消确认警报
你可以取消确认之前确认的警报。取消确认活动警报后,Atlas 会恢复定期发送通知,直到问题解决或你删除、禁用或重新确认该警报。
要使用 Atlas CLI 取消确认指定项目的一个警报,请运行以下命令:
atlas alerts unacknowledge <alertId> [options]
要了解有关命令语法和参数的更多信息,请参阅 Atlas CLI 文档以了解Atlas 警报取消确认。
要使用 Atlas 用户界面取消确认警报,请执行以下操作:
在 Atlas 中,转到Project Alerts 页面。
如果尚未显示,请选择包含所需项目的组织导航栏中的Organizations菜单。
如果尚未显示,请从导航栏的Projects菜单中选择所需的项目。
执行以下步骤之一:
单击导航栏中的Project Alerts图标。
在Projects菜单旁边,展开Options菜单,单击Project Settings ,然后单击侧边栏中的Alerts 。
显示“项目警报”页面。
增加集群容量
要通过增加集群容量来解决警报,请参阅修改集群。
查看所有活动
要查看和过滤组织或项目的操作日志,请参阅查看操作日志。
检索操作日志
特定警报的解决方案
以下部分描述了 Atlas警报条件并建议了解决这些条件的步骤。
警报类型 | 说明 |
---|---|
自动伸缩事件,例如集群层变更。您可以配置 Atlas 以通知您这些事件。 | |
Atlas Search 进程使用的 CPU 和内存量达到指定阈值。 | |
MongoDB 进程的连接数超出允许的最大值。 | |
分区上已用磁盘空间的百分比达到指定阈值。 | |
副本集中未检测到主节点。 | |
主 节点集群成员上生成的 oplog 数据量大于集群配置的 oplog 大小。 | |
MongoDB 进程的 CPU 使用率达到指定阈值。 |