문서 메뉴

문서 홈보기 & 데이터 분석MongoDB Atlas Data Lake

Atlas Data Lake

이 페이지의 내용

  • Atlas Data Lake 정보
  • 샘플 사용
  • Atlas Data Lake 리전
  • 청구

MongoDB Atlas Data Lake는 추출한 데이터 분석에 최적화된 객체 저정 서비스로 거듭났습니다. Atlas Data Lake는 지연 시간이 짧은 쿼리 성능으로 플랫 또는 중첩 데이터에 최적화된 분석 저장 서비스를 제공합니다.

Atlas Data Lake에는 지정된 주기에서 실행되는 클라우드 백업 작업이 있는 M10 이상의 백업 지원 Atlas cluster가 필요합니다. 클라우드 백업에 대해 자세히 알아보려면 데이터베이스 배포 백업을 참조하세요.

Atlas Data Lake는 추출된 데이터의 데이터 소스로 Atlas cluster의 collection 스냅샷을 지원합니다. Atlas Data Lake는 스냅샷에서 데이터를 자동으로 수집하고, 분석에 최적화된 형식으로 데이터를 분할 및 저장합니다. 보기(Views)에 대한 파이프라인 생성은 지원하지 않습니다.

Atlas Data Lake는 다형성 데이터를 지원하는 오픈 소스 표준을 기반으로 하는 분석 지향 형식으로 데이터를 저장합니다. 데이터는 완전 관리되고 파티션 수준에서 인덱싱되며 데이터 증가에 따라 밸런싱됩니다. Atlas Data Lake는 분석 유형 쿼리에 맞게 데이터 추출을 최적화합니다. Atlas Data Lake는 새 데이터를 추출할 때 기존 파일을 리밸런싱해 일관된 성능을 보장하며 데이터 검색을 최소화합니다.

Atlas Data Lake는 빠른 포인트 쿼리 및 집계 쿼리가 가능하도록 구조에 가장 적합한 형식으로 데이터를 저장합니다. 점 쿼리의 경우 Atlas Data Lake의 저장 형식을 사용하면 파티션 찾는 속도가 빨라지므로 성능이 향상됩니다. 집계 유형의 쿼리는 결과를 제공하는 데 필요한 열만 검색합니다. 또한 Atlas Data Lake 파티션 인덱스는 기본 파일을 스캔할 필요 없이 파티션 인덱스에서 직접 결과를 반환하므로 집계 쿼리의 성능이 향상됩니다.

Atlas Data Lake를 사용하여 다음을 수행할 수 있습니다.

  • 운영 cluster에서 분석 워크로드를 격리합니다.

  • $out를 사용해 장기 실행 애그리게이션에 대한 스냅샷의 cluster 데이터에 대한 일관된 보기를 제공합니다.

  • 다양한 시점의 cluster 데이터 버전을 쿼리하고 비교합니다.

Atlas Data Lake는 다음 AWS 리전에서 최적화된 저장 공간을 제공합니다.

데이터 레이크 리전
AWS 리전
미국 버지니아주
미국 동부 1(us-east-1)
미국 오리건주
us-west-2
브라질 상파울루
남아메리카 동부 1(SA-EAST-1)SA-EAST-1)
아일랜드
유럽 서부 1(EU-WEST-1)
영국 런던
유럽 서부 2(EU-WEST-2)
독일 프랑크푸르트
유럽 중부 1(eu-central-1)
인도 뭄바이
ap-south-1
싱가포르
아시아 태평양 남동부 1(AP-SOUTH-EAST-1)
호주 시드니
아시아 태평양 남동부 2(AP-SOUTH-EAST-2)

Atlas Data Lake는 수집한 데이터를 저장할 때 Atlas cluster와 가장 가까운 리전을 자동으로 선택합니다.

수집한 데이터가 저장된 AWS 리전을 기준으로 매월 GB당 Atlas Data Lake 요금이 발생합니다. Atlas Data Lake 비용이 발생하는 항목은 다음과 같습니다.

  • 데이터 소스에서 수집하는 데이터

  • 클라우드 객체 스토리지에 저장

Atlas Data Lake는 데이터 추출과 업로드 및 전송에 사용된 리소스에 대해 요금을 부과합니다. 스냅샷 내보내기 작업에 대한 Atlas Data Lake 요금 청구 기준은 다음과 같습니다.

  • 스냅샷 추출에 대한 GB당 비용

  • 스냅샷 내보내기 다운로드를 위한 AWS 서버의 시간당 비용

  • 스냅샷 내보내기 복원 저장 공간에 대한 시간당 GB당 비용

  • 스냅샷 내보내기 저장 IOPS의 시간당 IOPS당 비용

저장된 데이터 저장 및 액세스에 대한 Atlas Data Lake 요금은 다음을 기준으로 합니다.

  • 일일 GB당 비용

  • Atlas Data Federation을 사용해 Data Lake 데이터 세트를 쿼리할 때 저장 액세스 요청 1,000건당 비용 각 액세스 요청은 Atlas Data Federation이 쿼리를 처리하기 위해 가져오는 Data Lake 데이터 세트의 데이터 파티션에 해당합니다.

    참고

    이제 Atlas Data Federation이 쿼리를 처리하는 데 드는 데이터 양에 한도를 설정해 비용을 관리할 수 있습니다. 자세한 내용은 Atlas Data Federation 쿼리 한도 관리를 참조하세요.

자세한 내용은 Atlas 요금 페이지를 참조하세요.

시작하기 →