此清单旨在帮助您为环境和团队做好准备,以便成功部署和运行 MongoDB Atlas。使用此清单来追踪您的进度。例如,您可以将其打印出来,并在完成任务时逐项勾选。
有关这些方面的详细指导,请参阅 MongoDB Atlas 官方文档。
账户和组织设置
检查 | 操作 |
|---|---|
创建一个 MongoDB Atlas 帐户,根据您的内部结构设置 Atlas 组织,并配置具有适当访问权限的根用户。要获取建议并了解更多关于此主题的信息,请参阅 Atlas 组织、项目和集群指导。 | |
根据您的环境和应用程序需求创建项目。至少应通过设置生产项目和非生产项目来实现环境隔离。要获取建议并了解更多关于此主题的信息,请参阅 Atlas 组织、项目和集群建议。 | |
如果适用,请考虑跨组织计费。要获取建议并了解有关此主题的更多信息,请参阅Atlas 计费数据功能。 |
网络与安全配置
检查 | 操作 |
|---|---|
为您的 Atlas 集群选择云提供商和区域。请考虑数据主权要求和延迟。要获取建议并了解有关此主题的更多信息,请参阅 Atlas 部署范式。 | |
根据贵组织的需求配置网络安全。要获取建议并了解更多关于此主题的信息,请参阅 Atlas 授权和身份验证指导。 | |
选择一种网络连接方法。作为一般性建议,我们建议您设置和使用私有端点:
私有端点允许从您的 VPC 到 Atlas 的单向私有连接。对于多区域集群,您需要在每个区域启用私有端点。要了解更多信息,请参阅多区域部署建议。此外,您可以选择以下网络连接方法之一:
| |
TLS 是强制性的,默认情况下启用。您无法禁用它。TLS 1.2+ 是默认设置,这确保了在 Atlas 支持下一个版本时能够支持该版本。请查看您的 TLS 配置,确保其设置方式符合您的内部标准。若要了解更多信息,请参阅TLS。 | |
配置身份验证和授权。要获取有关此主题的建议并学习;了解更多信息,请参阅Atlas授权和身份验证指南。
| |
实现强大的加密。要了解更多信息,请参阅 Atlas 数据加密指导。
| |
配置数据库 Atlas 审核以追踪数据库访问和操作。如有需要,请创建自定义过滤器。要获取建议并了解有关此主题的更多信息,请参阅 Atlas 审核和日志记录指导。 | |
Atlas 定期更换证书,以确保符合安全标准和各类权威机构的要求。
Atlas 集群使用由广泛信任的证书颁发机构 (CA) 签署的 TLS 证书。虽然使用最新 MongoDB 驱动的应用程序会自动处理证书验证,但如果 MongoDB 更新了证书提供商,较旧的应用程序或具有自定义 TLS 配置的应用程序可能需要更新以信任新的 CA 证书。要了解详情,请参阅硬编码证书颁发机构。 | |
了解并规划遵循相关标准和法规的合规要求,例如 ISO/IEC 27001、HIPAA、GDPR、PCI DSS、FedRAMP 等。要了解更多信息,请参阅 MongoDB Atlas for 政府。 |
备份和恢复策略
检查 | 操作 |
启用 Atlas 云备份,它利用云提供商的原生快照功能提供本地化的备份存储。要获取建议并了解有关此主题的更多信息,请参阅 Atlas 备份指导。 | |
启用持续云备份,并确保恢复窗口符合您的恢复点目标 (RPO)。我们建议将恢复窗口设为 7 天,以便使用 oplog 实现时点 (PIT) 恢复。 | |
定义符合您业务连续性和合规要求的备份计划和保留策略。请考虑每小时、每天、每周和每月的快照,并设置适当的保留期。 | |
请考虑多区域快照分发,通过将快照复制到其他地理区域来提高韧性。 | |
启用备份合规策略以防止对备份进行未经授权的修改或删除,并符合严格的数据保护要求。 | |
了解从计划快照或按需快照进行恢复的过程。如需了解更多信息,请参阅 Atlas 备份建议。 | |
了解从持续云备份恢复到特定时间点的过程。如需了解更多信息,请参阅Atlas 备份建议。 | |
规划和测试您的灾难恢复 (DR) 策略。了解恢复时间目标 (RTO) 和恢复点目标 (RPO)。考虑在 Atlas 中测试应用程序的韧性。要了解更多信息,请参阅 Atlas 灾难恢复指导。 | |
如有需要,请考虑使用 Atlas 用户界面、Atlas 管理 API 或 Atlas CLI 下载和存档快照的选项。要了解更多信息,请参阅 Atlas 备份指导。 |
维护和修补
检查 | 操作 |
请注意,Atlas 会以滚动方式部署主要版本升级,以最大限度地减少停机时间。这意味着 Atlas 会升级从节点集群节点,并将主节点集群故障转移到较新的版本。 | |
为 Atlas 自动化系统定义维护窗口,以便应用自动次要版本更新。使用 | |
请注意,Atlas 对于关键安全补丁或必需操作有不可推迟的维护时间。为您的项目配置保护时间,并定义一个无法开始标准更新的每日窗口。Atlas 在这些时间之外执行标准更新,不涉及集群重启或重新同步。 |
监控和警报
检查 | 操作 |
通过“指标”标签页使用 Atlas 中的内置监控功能来追踪集群运行状况和性能。 | |
为各种集群指标和事件配置警报,以主动识别并响应潜在问题。首先,请查看并配置推荐的警报。请考虑为不同的严重性级别设置多个警报。 | |
如果需要,将 Atlas 监控与您现有的企业监控和可观测性工具集成起来。 | |
熟悉 Performance Advisor、Real-Time Performance Panel (RTPP) 和 Query Profiler,以进行性能调优和优化。 |
要获取建议并了解有关监控性能和警报的更多信息,请参阅 Atlas 监控和警报指导。
操作程序和团队准备情况
检查 | 操作 |
为管理和操作 MongoDB Atlas 定义角色和职责。 | |
建立变更控制和审计流程。如需了解更多信息,请参阅 Atlas 审核和日志记录指导。 | |
针对您的应用程序和 Atlas 设置制定清晰的灾难恢复流程文档。要了解更多信息,请参阅 Atlas 灾难恢复指导。 | |
确保您的团队接受 MongoDB Atlas 基础知识、安全最佳实践和操作程序的培训。请考虑使用 MongoDB University 和 MongoDB Professional Services 进行培训和支持。 | |
建立一个与 MongoDB 支持互动的流程,以处理生产问题或在需要 MongoDB 的访问级别时使用。 | |
使用 Query Profiler 和 Performance Advisor 等工具规划性能改进。如需了解更多信息,请参阅 Atlas 监控和警报指导。 | |
考虑开发人员如何连接到 Atlas 集群并使用Atlas集群进行开发。有用的工具包括: 确保开发人员可以轻松安装、访问权限工具并将其集成到工具链中。设置适当的访问权限。 | |
制定与其他工具和服务(如 Datadog、Prometheus、PagerDuty 等工具)的集成策略。如需了解更多信息,请参阅 Atlas 监控和警报指导。 | |
考虑在您的组织内建立 MongoDB 卓越中心 (CoE),以促进最佳实践和知识共享。 |
通过完成这些检查清单操作,您将增强部署和管理 MongoDB Atlas 的操作准备。这将确保您建立一个可靠、安全且高效的数据库环境。
后续步骤
使用左侧导航查找每个 Well-Architected Framework 支柱的功能和最佳实践。