Docs 菜单

Docs 主页启动和管理 MongoDBMongoDB Atlas

修复 IOPS 问题

在此页面上

  • 警报条件
  • 常见触发器
  • 解决眼前的问题
  • 实施长期解决方案
  • 监控您的进度

系统和磁盘警报条件可指示 IOPS 问题。

注意

所有硬件指标都具有具有不同可配置警报的等效突发报告。要了解更多信息,请参阅突发报告。

您可以在项目级警报设置页面中配置以下警报条件,以触发警报。

如果每秒磁盘写入操作的平均次数超过指定阈值,则会引发 Disk read IOPS on Data Partition is(数据分区的磁盘读取 IOPS 为)警报条件。

如果每秒磁盘写入操作的平均次数超过指定阈值,则会引发Disk write IOPS on Data Partition is警报条件。

System: CPU (User) % is 测量节点上进程的 CPU 使用率,以 CPU 数量为标准。该值的范围为 0-100%。

一些常见事件可能会触发这些警报:

  • 未优化的查询。

  • 一次性事件,例如索引构建。

考虑一些可能的操作,帮助解决这些警报:

  • 优化查询。

  • 使用 Atlas Performance Advisor查看慢查询和建议索引。

  • 查看索引策略,了解可能的进一步索引改进。

    注意

    您可能需要临时增加集群 IOPS 才能创建新索引。要更改集群的 IOPS,请转到 Cluster Configuration 页面并:

    云服务提供商
    层级

    可能的动作

    AWS

    M10M20

    AWS

    M30 或更大

    Google Cloud

    M10 或更大
    AZURE
    M10 或更大
  • 分析查询性能以查看查询如何使用索引。

  • 集群配置页面增加硬件资源,例如实例大小和 IOPS

部署到 Azure 的 Atlas 集群可能会使用基于信用的突发,但磁盘只有在其信用存储桶中积累了突发信用时才会发生突发。Azure 还提供按需突发模型,只要其需求超过当前容量,磁盘就会发生突发。

请参阅 Azure 磁盘突发文档 有关 Azure 磁盘突发的工作原理的更多信息。

如果你经常超过已配置的 IOPS 阈值,则可以通过以下任一动作提高已配置的 IOPS 来避免消耗突发信用:

  • 增加集群 IOPS,提高集群的 IOPS 阈值。

  • 增加存储容量IOPS 阈值随着存储容量的增加而增加。 配置为使用至少 1 TB 存储的集群具有等于或大于最大突发性能的基线 IOPS 性能。这些数据量不会耗尽突发的信用余额。

  • 升级集群层。更大的集群层拥有更高的 IOPS 阈值。

    注意

    默认情况下,部署的集群层 M140 及更大的集群层至少具有 1 TB 的存储容量。存储容量为 1 TB 或以上的集群不会耗尽突发信用余额。

观察高磁盘 I/O 的几种可行方法如下:

  • 集群指标Disk IOPS 图表中的磁盘 IOPS 使用量超过了 Atlas 集群配置页面中预配的 IOPS

  • Normalized System CPU指标具有较高的IOWait曲线。IOWait 测量 CPU 处于空闲状态并等待 I/O 操作完成的时间百分比。Normalized System CPU图表位于Metrics 标签页的Hardware Metrics部分下。

← 修复连接问题