Atlas 웰 아키텍처 프레임워크의 안정성 핵심에는 다운타임을 최소화하고 데이터 손실을 방지하는 기능과 전략이 포함되어 있습니다. 안정적인 워크로드 오류가 발생하면 이를 인식하고 가용성을 회복하고 데이터 손실을 복구하기 위해 효율적이고 종종 자동으로 조치 취할 수 있습니다.
안정성을 위한 기반
안정적이고 복원력이 뛰어난 Atlas 배포서버 설계하는 데에는 두 가지 기초가 있습니다.
예상되는 인프라 중단에도 불구하고 고가용성 보장하는 구성 옵션을 사용하여 배포서버 아키텍처를 설계합니다.
설정된RTO 및 RPO 내에서 재해 시나리오에서 복구하기 위한 권장사항 과 절차를 정의하는 재해 복구 계획을 세웁니다. 여기에는 배포의 가용성 전략을 보완하고 데이터 손실 또는 손상 이벤트에 대한 복구 옵션을 제공하기 위해 백업 정책을 구성하는 것이 포함될 수 있습니다.
정의
RTO( 복구 시간 목표 )는 애플리케이션 복원되어 중단 후 트래픽 서비스를 시작하기 전에 허용되는 최대 다운타임입니다.
RPO( 복구 시점 목표 )는 운영 중단 시 손실할 수 있는 최대 데이터 양으로, 시간 단위로 측정합니다.
가용성은 필요할 때 시스템에 얼마나 안정적으로 액세스하고 작동할 수 있는지를 측정한 것입니다. 지정된 기간 동안 시스템을 사용할 수 있는 시간의 비율을 나타내는 백분율로 표시되는 경우가 많습니다. 예시 를 들어, 가용성의 표준은 종종 99.999% 5 또는 'five 9'는 연간 약 분 25 초의 잠재적 다운타임을 의미합니다.
고가용성은 개별 구성 요소에 장애가 발생할 때 시스템이 액세스할 수 있는 상태를 유지하는 기능 을 말합니다. 고가용성 위해 설계된 배포서버 아키텍처는 종종 중복성 및 페일오버 메커니즘을 사용하여 내결함성을 달성하므로 오류가 감지되면 작동하는 구성 요소로 자동으로 전환할 수 있습니다.
재해 복구는 재해 상황에서 활용할 수 있는 워크로드 의 개별 복사본을 생성하고 관리하기 위한 전략을 의미합니다. 포괄적인 재해 복구 계획은 재해 시나리오에 따라 지정된 RTO 내에서 시스템 작동을 회복하고 지정된 RPO 내의 타임스탬프로 데이터를 복구하는 절차를 정의합니다.
안정성을 위한 Atlas 기능 개요
비용 영향 균형을 맞추면서 안정성을 최적화하려면 배포서버 에 적합한 고가용성 아키텍처, 재해 복구 계획 및 백업 정책을 결합하는 것이 중요합니다.
MongoDB의 기본값 배포서버 아키텍처는 고가용성 위해 설계되었습니다. Atlas 각 클러스터 서로 다른 가용영역에 자동으로 분산된 최소 3개의 데이터베이스 인스턴스(노드라고도 함)로 구성된 복제본 세트 의 일부로 배포합니다. 단일 구역 중단이 발생하는 이벤트 , 인스턴스 간 페일오버 완전 자동으로 이루어지며 재시도 가능 쓰기가 활성화된 경우 장애 시점에 진행 중이던 작업을 포함하여 데이터 손실 없이 몇 초 내에 완료됩니다. 가장 중요한 애플리케이션의 가용성을 향상시키기 위해 구역 , 리전 또는 제공자 중단을 견딜 수 있도록 노드, 리전 또는 cloud 제공자를 추가하여 배포서버 확장하다 할 수 있습니다.
백업은 시스템 안정성에도 매우 중요합니다. 고가용성 위해 설계된 시스템은 데이터 손실로부터 보호하기 위해 백업에 덜 의존하지만, 백업은 여전히 데이터 손실 또는 손상을 초래할 수 있는 인프라 중단 이벤트 (예: 사이버 공격이나 코드 오류와 같은 인간의 위협)를 초래할 수 있는 재해 시나리오를 방지하는 가장 좋은 방법입니다. . 강력한 재해 복구 계획에는 계산된 RPO 및 RTO를 충족하기 위해 백업 정책이 필요한지 여부를 결정하는 작업이 포함됩니다.
다음 Atlas 아키텍처 센터 리소스를 사용하여 Atlas 의 안정성을 위한 기능 및 전략에 대해 자세히 학습 .
고가용성
가용성 요구 사항을 충족하는 클러스터 구성을 생성하고 재해로부터 빠르게 복구할 수 있습니다.
백업
Atlas에서 데이터베이스 백업 옵션을 구성하고 클러스터 전체 Atlas 스냅샷을 통해 RTO 및 RPO 요구 사항을 충족하는 권장사항을 받아보세요.
재해 복구
운영 중단, 프로덕션 데이터 삭제 등이 발생한 경우 취해야 할 조치가 포함된 DR 계획을 세웁니다.