Docs 菜单
Docs 主页
/ /

MongoDB Atlas 运行准备检查表

此清单旨在帮助您为环境和团队做好准备,以便成功部署和运行 MongoDB Atlas。使用此清单来追踪您的进度。例如,您可以将其打印出来,并在完成任务时逐项勾选。

有关这些方面的详细指导,请参阅 MongoDB Atlas 官方文档。

检查
操作

创建一个 MongoDB Atlas 帐户,根据您的内部结构设置 Atlas 组织,并配置具有适当访问权限的根用户。要获取建议并了解更多关于此主题的信息,请参阅 Atlas 组织、项目和集群指导

根据您的环境和应用程序需求创建项目。至少应通过设置生产项目和非生产项目来实现环境隔离。要获取建议并了解更多关于此主题的信息,请参阅 Atlas 组织、项目和集群建议

如果适用,请考虑跨组织计费。要获取建议并了解有关此主题的更多信息,请参阅Atlas 计费数据功能

检查
操作

为您的 Atlas 集群选择云提供商和区域。请考虑数据主权要求和延迟。要获取建议并了解有关此主题的更多信息,请参阅 Atlas 部署范式

根据贵组织的需求配置网络安全。要获取建议并了解更多关于此主题的信息,请参阅 Atlas 授权和身份验证指导。

选择一种网络连接方法。作为一般性建议,我们建议您设置和使用私有端点:

  • AWS 专用链接

  • Azure Private Link 或

  • Google Cloud Private Service Connect

私有端点允许从您的 VPC 到 Atlas 的单向私有连接。对于多区域集群,您需要在每个区域启用私有端点。要了解更多信息,请参阅多区域部署建议。此外,您可以选择以下网络连接方法之一:

TLS 是强制性的,默认情况下启用。您无法禁用它。TLS 1.2+ 是默认设置,这确保了在 Atlas 支持下一个版本时能够支持该版本。请查看您的 TLS 配置,确保其设置方式符合您的内部标准。若要了解更多信息,请参阅TLS

配置身份验证和授权。要获取有关此主题的建议并学习;了解更多信息,请参阅Atlas授权和身份验证指南。

  • 对于云环境中的数据库访问,请考虑使用 Workforce 和 Workforce and Workload Identity Federation,例如 OIDC、OAuth 2.0、AWS IAM 角色或 Azure 托管身份,以实现无密码访问。

实现强大的加密。要了解更多信息,请参阅 Atlas 数据加密指导。

  • 默认情况下,Atlas 通过云提供商的透明磁盘加密(AES-256)启用静态数据加密。

  • 我们强烈建议您使用 Key Management Service (KMS) 提供商(AWS KMS、Azure Key Vault 或 GCP KMS)启用“自带密钥 (BYOK)”加密。Atlas 无法轮换客户托管的加密密钥。

  • 请考虑使用客户端字段级加密 (CSFLE) 在将数据传输到 Atlas 之前对应用程序中的数据进行加密。

  • 探索 Queryable Encryption,以支持应用程序在加密数据上运行查询。

配置数据库 Atlas 审核以追踪数据库访问和操作。如有需要,请创建自定义过滤器。要获取建议并了解有关此主题的更多信息,请参阅 Atlas 审核和日志记录指导。

Atlas 定期更换证书,以确保符合安全标准和各类权威机构的要求。

  • 确保您没有绑定低级别证书。

  • 请注意硬编码的证书颁发机构证书。

  • 确保应用程序的设置方式能够应对潜在的 CA 证书更新。

Atlas 集群使用由广泛信任的证书颁发机构 (CA) 签署的 TLS 证书。虽然使用最新 MongoDB 驱动的应用程序会自动处理证书验证,但如果 MongoDB 更新了证书提供商,较旧的应用程序或具有自定义 TLS 配置的应用程序可能需要更新以信任新的 CA 证书。要了解详情,请参阅硬编码证书颁发机构。

了解并规划遵循相关标准和法规的合规要求,例如 ISO/IEC 27001、HIPAA、GDPR、PCI DSS、FedRAMP 等。要了解更多信息,请参阅 MongoDB Atlas for 政府。

检查

操作

启用 Atlas 云备份,它利用云提供商的原生快照功能提供本地化的备份存储。要获取建议并了解有关此主题的更多信息,请参阅 Atlas 备份指导。

启用持续云备份,并确保恢复窗口符合您的恢复点目标 (RPO)。我们建议将恢复窗口设为 7 天,以便使用 oplog 实现时点 (PIT) 恢复。

定义符合您业务连续性和合规要求的备份计划和保留策略。请考虑每小时、每天、每周和每月的快照,并设置适当的保留期。

请考虑多区域快照分发,通过将快照复制到其他地理区域来提高韧性。

启用备份合规策略以防止对备份进行未经授权的修改或删除,并符合严格的数据保护要求。

了解从计划快照或按需快照进行恢复的过程。如需了解更多信息,请参阅 Atlas 备份建议。

了解从持续云备份恢复到特定时间点的过程。如需了解更多信息,请参阅Atlas 备份建议。

规划和测试您的灾难恢复 (DR) 策略。了解恢复时间目标 (RTO) 和恢复点目标 (RPO)。考虑在 Atlas 中测试应用程序的韧性。要了解更多信息,请参阅 Atlas 灾难恢复指导。

如有需要,请考虑使用 Atlas 用户界面、Atlas 管理 API 或 Atlas CLI 下载和存档快照的选项。要了解更多信息,请参阅 Atlas 备份指导。

检查

操作

请注意,Atlas 会以滚动方式部署主要版本升级,以最大限度地减少停机时间。这意味着 Atlas 会升级从节点集群节点,并将主节点集群故障转移到较新的版本。

为 Atlas 自动化系统定义维护窗口,以便应用自动次要版本更新。使用 mongodbatlas_maintenance_window 资源配置允许的维护日期和时间。要了解更多信息,请参阅 Atlas 高可用性指导。

请注意,Atlas 对于关键安全补丁或必需操作有不可推迟的维护时间。为您的项目配置保护时间,并定义一个无法开始标准更新的每日窗口。Atlas 在这些时间之外执行标准更新,不涉及集群重启或重新同步。

检查

操作

通过“指标”标签页使用 Atlas 中的内置监控功能来追踪集群运行状况和性能。

为各种集群指标和事件配置警报,以主动识别并响应潜在问题。首先,请查看并配置推荐的警报。请考虑为不同的严重性级别设置多个警报。

如果需要,将 Atlas 监控与您现有的企业监控和可观测性工具集成起来。

熟悉 Performance Advisor、Real-Time Performance Panel (RTPP) 和 Query Profiler,以进行性能调优和优化。

要获取建议并了解有关监控性能和警报的更多信息,请参阅 Atlas 监控和警报指导。

检查

操作

为管理和操作 MongoDB Atlas 定义角色和职责。

建立变更控制和审计流程。如需了解更多信息,请参阅 Atlas 审核和日志记录指导。

针对您的应用程序和 Atlas 设置制定清晰的灾难恢复流程文档。要了解更多信息,请参阅 Atlas 灾难恢复指导。

确保您的团队接受 MongoDB Atlas 基础知识、安全最佳实践和操作程序的培训。请考虑使用 MongoDB University 和 MongoDB Professional Services 进行培训和支持。

建立一个与 MongoDB 支持互动的流程,以处理生产问题或在需要 MongoDB 的访问级别时使用。

使用 Query Profiler 和 Performance Advisor 等工具规划性能改进。如需了解更多信息,请参阅 Atlas 监控和警报指导。

定义您将如何处理数据生命周期管理。配置存档策略,例如 TTL 索引在线存档。确保应用程序开发团队(而不是操作团队)处理存档决策。

考虑开发人员如何连接到 Atlas 集群并使用Atlas集群进行开发。有用的工具包括:

确保开发人员可以轻松安装、访问权限工具并将其集成到工具链中。设置适当的访问权限。

制定与其他工具和服务(如 Datadog、Prometheus、PagerDuty 等工具)的集成策略。如需了解更多信息,请参阅 Atlas 监控和警报指导。

考虑在您的组织内建立 MongoDB 卓越中心 (CoE),以促进最佳实践和知识共享。

通过完成这些检查清单操作,您将增强部署和管理 MongoDB Atlas 的操作准备。这将确保您建立一个可靠、安全且高效的数据库环境。

使用左侧导航查找每个 Well-Architected Framework 支柱的功能和最佳实践。

后退

迁移

在此页面上