Para agentes de IA: um índice de documentação está disponível em https://www.mongodb.com/pt-br/docs/llms.txt — as versões de marcação de todas as páginas estão disponíveis anexando .md a qualquer caminho de URL .
Make the MongoDB docs better! We value your opinion. Share your feedback for a chance to win $100.
MongoDB Branding Shape
Click here >
Menu Docs

Configurar o Online Archive para Coleções Padrão

Importante

Recurso indisponível nos clusters Flex

Os clusters Flex não aceitam esse recurso no momento. Para saber mais, consulte Limitações do Atlas Flex.

Você pode configurar o arquivamento dos dados em uma coleção definindo uma regra para isso. A regra de arquivamento para uma coleção padrão pode ser uma das seguintes:

  • Um campo de data emparelhado com um período de retenção em dias, que determina quando o Atlas move dados do cluster para o arquivo (Date Match).

  • Uma query JSON personalizada que seleciona os documentos para arquivar (Custom Criteria).

Para configurar seu Atlas cluster para arquivamento online:

  1. Crie uma regra de arquivamento fornecendo o namespace da coleção e os critérios para selecionar dados para arquivar.

  2. (Opcional) Especifique campos normalmente com queries para dados arquivados de partição.

Quando você configura um Arquivo Morto Online no cluster, o Atlas cria 2 instâncias de banco de dados federadas no cluster somente para o arquivo morto e para o cluster e o arquivamento.

Para limitações que se aplicam a todos os arquivos online, consulte Limitações.

Antes de configurar um online arquivo, certifique-se de que seu Atlas cluster esteja íntegro. Se um nó estiver inativo, o arquivo permanecerá no status PENDING até que o cluster esteja totalmente operacional.

Para criar um Arquivo Online, você deve ter acesso Project Data Access Admin ou superior ao projeto.

Para ver se um arquivo está disponível, você deve ter acesso ao Project Read Only ou superior ao projeto.

Para criar um arquivo online para um cluster utilizando o Atlas CLI, execute o seguinte comando:

atlas clusters onlineArchives create [options]

Para observar se um arquivo online específico está disponível usando o Atlas CLI, execute o seguinte comando:

atlas clusters onlineArchives watch <archiveId> [options]

Para saber mais sobre a sintaxe e parâmetros para os comandos anteriores, consulte a documentação do Atlas CLI para clusters do Atlas onlineArchives create e clusters do Atlas onlineArchives watch.

Dica

Veja: links relacionados

Para configurar um arquivamento online a partir da API, envie uma solicitação POST para o ponto de extremidade OnlineArchives.

Observação

Se você utilizar os critérios do DATE , deverá especificar o campo date como parte das chaves de partição.

Se o cluster já tiver um arquivo online Active com a mesma regra de arquivamento para o mesmo banco de dados e coleção, a operação falhará. No entanto, se o arquivo online existente estiver em Paused ou Deleted estado, o novo arquivo online será criado e seu status será definido como Active. Para saber mais sobre a sintaxe e as opções, consulte API.

Para configurar um arquivo online para uma coleção padrão, em sua IU do Atlas:

1
  1. Se ainda não tiver sido exibido, selecione a organização que contém seu projeto no menu Organizations na barra de navegação.

  2. Se ainda não estiver exibido, selecione o projeto desejado no menu Projects na barra de navegação.

  3. Na barra lateral, clique em Clusters sob o título Database.

A página Clusters é exibida.

2

Na barra lateral, clique em Online Archive.

A página Online Archive é exibida.

3

Para configurar um arquivo online para sua coleção, clique em:

  • Configure Online Archive botão na primeira vez.

  • Add Archive botão posteriormente.

4
5
  1. Especifique o namespace da coleção, que inclui o nome do banco de dados, o separador de ponto (.) e o nome da coleção (isto é, <database>.<collection>), no campo Namespace.

    Não é possível modificar o namespace depois que o arquivo online é criado.

  2. Crie um índice no campo Date da sua coleção para garantir o desempenho ideal.

  3. Selecione a região do provedor de nuvem onde você deseja armazenar seus dados arquivados.

    IMPORTANTE: recomendamos que você selecione a mesma região do seu cluster, se possível, pois o custo de transferência de dados poderá ser maior se você escolher uma região diferente.

    O Atlas mostra as regiões do provedor de nuvem correspondentes ao local onde seu cluster está hospedado. No Atlas, para clusters espalhados por várias nuvens, são exibidas as regiões do provedor de nuvem com a prioridade mais alta. O Atlas mostra um ao lado da região que corresponde à região exata ou aproximada onde seu cluster está hospedado.

    Para clusters do Atlas implantados no AWS, você pode selecionar uma das seguintes regiões:

    Região Data Federation
    Região Amazon Web Services
    Região do Atlas

    Northern Virginia, EUA

    us-east-1

    US_EAST_1

    Oregon, EUA

    us-west-2

    US_WEST_2

    São Paulo, Brasil

    sa-east-1

    SA_EAST_1

    Irlanda

    eu-west-1

    EU_WEST_1

    Londres, Inglaterra, Reino Unido

    eu-west-2

    EU_WEST_2

    Frankfurt, Alemanha

    eu-central-1

    EU_CENTRAL_1

    Tokyo, Japan

    ap-northeast-1

    AP_NORTHEAST_1

    Seul, Coreia do Sul

    ap-northeast-2

    AP_NORTHEAST_2

    Mumbai, Índia

    ap-south-1

    AP_SOUTH_1

    Cingapura

    ap-southeast-1

    AP_SOUTHEAST_1

    Sydney, Austrália

    ap-southeast-2

    AP_SOUTHEAST_2

    Montreal, QC, Canadá

    ca-central-1

    CA_CENTRAL_1

    Para os Atlas clusters distribuídos no Azure, você pode selecionar uma região do Azure somente se não houver outros Online Archives no cluster que estejam usando um provedor de nuvem diferente. Se um Online Archive existente no cluster usar a Amazon Web Services ou Google Cloud Platform para armazenar dados arquivados, você só poderá selecionar regiões da Amazon Web Services ou do Google Cloud Platform para novos Online Archives nesse cluster.

    IMPORTANTE: para um cluster distribuído no Azure, se você tiver Arquivos Online existentes que usam Amazon Web Services ou Google Cloud Platform e excluí-los, deverá aguardar cinco dias antes de criar um novo Arquivo Online que use o Azure. Nesse período de cinco dias, qualquer tentativa de criar um novo Online Archive continuará sendo padrão para o provedor de nuvem que você selecionou originalmente.

    Para clusters do Atlas implantados no Azure, você pode selecionar uma das seguintes regiões:

    Região Data Federation
    Regiãodo Azure
    Região do Atlas

    Virginia, USA

    eastus2

    US_EAST_2

    São Paulo, Brasil

    brazilsouth

    BRAZIL_SOUTH

    Países Baixos

    westeurope

    EUROPE_WEST

    Para clusters do Atlas implementados na Google Cloud Platform, você pode selecionar uma região da Google Cloud Platform somente se não houver outros Online Archives no cluster que estejam usando um provedor de nuvem diferente. Se um Online Archive existente no cluster usar a Amazon Web Services ou o Azure para armazenar dados arquivados, você só poderá selecionar regiões da Amazon Web Services ou Azure para novos Online Archives nesse cluster.

    IMPORTANTE: para um cluster implementado na Google Cloud Platform, se você tiver Arquivos Online existentes que usam Amazon Web Services ou Azure e excluí-los, deverá aguardar cinco dias antes de criar um novo Arquivo Online que use o Google Cloud Platform. Nesse período de cinco dias, qualquer tentativa de criar um novo Online Archive continuará sendo padrão para o provedor de nuvem que você selecionou originalmente.

    Para clusters do Atlas implementados na Google Cloud Platform, você pode selecionar uma das seguintes regiões:

    Região Data Federation
    Região do Google Cloud
    Região do Atlas

    Iowa, USA

    us-central1

    IOWA_USA

    Bélgica

    europe-west1

    BELGIUM_EU

    IMPORTANTE: Após o Atlas criar o arquivo on-line, você não poderá modificar a região de armazenamento.

  4. Especifique os critérios para selecionar documentos para arquivar na aba Date Match ou Custom Criteria.

    Para selecionar documentos da coleção usando uma combinação de campo de data e número de dias:

    • Especifique um campo de data já indexado dos documentos na coleção. Para especificar um campo aninhado, use a notação de ponto.

    • Especifique o número de dias para manter os dados no cluster do Atlas.

    • Escolha o formato de data do campo de data especificado . A data pode ser expressa como uma data formatada em ISO8601, um timestamp no formato UNIX epoch ou um ObjectId. O carimbo de data/hora UNIX pode ser expresso em nanossegundos, milésimos de segundo ou segundos.

      Se você escolher qualquer um dos seguintes formatos, o valor do campo de data especificado deverá ser o TipoBSON long:

      • EPOCH_SECONDS

      • EPOCH_MILLIS

      • EPOCH_NANOSECONDS

      IMPORTANTE: você não pode modificar o campo de data depois que o arquivo online for criado.

    Para selecionar documentos da coleção usando um filtro personalizado, especifique um filtro JSON válido para executar. O Atlas utiliza o filtro personalizado especificado com o db.collection.find(filter) comando. Você não pode usar o argumento de documento vazio ({}) para retornar todos os documentos. Você pode usar operadores do MongoDB Atlas , como $expr , para aproveitar todos os operadores de agregação , conforme mostrado nos exemplos a seguir.

    IMPORTANTE: os exemplos a seguir pressupõem que todos os documentos incluam campos bucket_end_date com valores de data e hora. Nos exemplos seguintes, o Atlas arquiva todos os documentos que não incluem um campo bucket_end_date e todos os documentos onde o bucket_end_date não é um valor de data/hora.

    Exemplo

    Neste exemplo de filtro personalizado, quando a data atual excede a data no campo bucket_end_date nos documentos, o Atlas subtrai trinta dias (especificados em milissegundos) da data atual e, em seguida, arquiva os dados após esses muitos dias, horas e minutos.

    {
    "$expr": { "$lte": [
    "$bucket_end_date",
    { "$subtract": [ "$$NOW", 2592000000 ] }
    ] }
    }

    Neste exemplo de filtro personalizado , quando a data atual excede a data dentro de um objectId, o Atlas subtrai trinta dias (especificados em milissegundos) da data atual e, em seguida, arquiva os dados após esses muitos dias, horas e minutos.

    {
    "$expr": {
    "$lte": [
    {"$toDate": "$_id"},
    { "$subtract": [ "$$NOW", 2592000000 ] }
    ]
    }
    }

    Se você usar $expr no filtro personalizado, às vezes o Atlas cluster pode não conseguir usar um índice para arquivamento de dados.

    O exemplo de filtro personalizado a seguir apresenta uma condição complexa com mais de um campo.

    {{{
    "$and":[
    {"$expr":{"$lte":["$createdAt",{"$subtract":["$$NOW",43200000]}]}},
    {"status":{"$ne":"active"}}
    ]
    }}}

    Importante

    O Atlas executa uma consulta de suficiência de índice durante a primeira execução do arquivo para determinar a eficiência do processo de arquivamento. Se o número de documentos digitalizados para o número de documentos devolvidos for 10 ou mais, o resultado da query acionará um Index Sufficiency Warning. Esse aviso indica que você tem índices insuficientes para um processo de arquivamento eficiente. Para arquivos baseados em dados, você deve indexar o campo de data . Para critérios personalizados que usam uma expressão, o Atlas pode primeiro converter um valor antes de avaliá-lo em relação à query.

    A execução da query de suficiência de índice é interrompida após a detecção de índices suficientes. Se um índice na coleção for descartado posteriormente e atrasar o processo de arquivamento, o Atlas não emitirá um Index Sufficiency Warning.

6
  1. (Opcional) Especifique um Data Retention Period.

    Por padrão, o Atlas não exclui dados arquivados. No entanto, se você especificar o Data Retention Period, você poderá especificar entre 7 a 9125 dias (25 anos) para manter os dados arquivados. O Atlas exclui os dados arquivados após o número de dias especificados aqui. Essa regra de expiração de dados entra em vigor 24 horas depois de você definir Data Retention Period.

    AVISO: Depois que o Atlas excluir os dados, você não poderá recuperar os dados.

  2. (Opcional) Especifique um Schedule Archiving Window.

    Por padrão, o Atlas executa periodicamente uma query para arquivar dados. No entanto, você pode ativar o Schedule Archiving Window para programar explicitamente a janela de tempo durante a qual você deseja que o Atlas arquive dados. Você pode especificar o seguinte:

    • Frequência. Você pode optar por executar a tarefa todos os dias, em um dia específico da semana ou em uma data específica a cada mês. Se você quiser agendar a tarefa de arquivamento de dados no dia 29, 30 ou 31 de cada mês, o Atlas não executará a tarefa de arquivamento nos meses que não têm essas datas (por exemplo, fevereiro).

    • Janela de tempo, em horas. Selecione o período de tempo durante o qual você deseja que o Atlas execute o trabalho de arquivamento de dados. Você deve especificar um mínimo de duas horas. Se um trabalho em execução não é concluído durante a janela de tempo especificada, o Atlas continua executando o trabalho até que ele seja concluído.

7
8

IMPORTANTE: o arquivo deve ter pelo menos um campo de partição.

Insira até dois campos de consulta mais comuns da coleção nos campos Second most commonly queried field e Third most commonly queried field , respectivamente. Para especificar campos aninhados, utilize a notação de ponto. Não inclua aspas ("") em torno de campos aninhados que você especifica usando a notação de pontos.

Aviso

Não é possível especificar os nomes de campo que contêm pontos (.) para particionamento.

Os campos especificados são usados para dividir seus dados arquivados. As partições são semelhantes às pastas. O campo de data está na primeira posição da partição por padrão para os critérios do Date Match. Você pode mover outro campo para a primeira posição da partição se você consultar frequentemente por esse campo.

A ordem dos campos listados no caminho é importante da mesma forma que nos índices compostos. Os dados no caminho especificado são particionados primeiro pelo valor do primeiro campo e, em seguida, pelo valor do próximo campo e assim por diante. O Atlas suporta consultas nos campos especificados utilizando as partições.

Por exemplo, suponha que você esteja configurando o arquivo online para a coleção do movies no banco de dados do sample_mflix. Se o campo arquivado for o campo de data released, que você moveu para a terceira posição, o primeiro campo consultado for title e o segundo campo consultado for plot, sua partição terá a seguinte aparência:

/title/plot/released

O Atlas cria partições primeiro para o campo title, seguido pelo campo plot e então o campo released. O Atlas utiliza as partições para consultas nos seguintes campos:

  • o campo title,

  • o campo title e o campo plot,

  • o campo title e o campo plot e o campo released.

O Atlas também pode utilizar as partições para suportar uma consulta nos campos title e released. No entanto, nesse caso, o Atlas não seria tão eficiente no suporte à consulta quanto seria se a consulta estivesse apenas nos campos title e plot . As partições são analisadas em ordem; se uma consulta omite uma partição específica, o Atlas é menos eficiente em fazer uso de quaisquer partições que se seguem a isso. Como uma consulta no title e no released omite plot, o Atlas usa a partição title de forma mais eficiente do que a partição released para oferecer suporte a essa consulta.

O Atlas não pode usar a estratégia de particionamento para suportar eficientemente consultas em campos não especificados aqui. Além disso, o Atlas não pode utilizar as partições para suportar consultas que incluem os seguintes campos sem o campo title:

  • o campo plot,

  • o campo released, ou

  • os campos plot e released.

Insira até dois campos de consulta mais comuns nos documentos nos campos Most commonly queried field e Second most commonly queried field , respectivamente. Para especificar campos aninhados, utilize a notação de ponto de ponto. Não inclua aspas ("") em torno de campos aninhados que você especifica usando a notação de ponto.

Os campos especificados são usados para dividir seus dados arquivados. As partições são semelhantes às pastas. A ordem dos campos listados no caminho é importante da mesma forma que nos índices compostos. Os dados no caminho especificado são particionados primeiro pelo valor do primeiro campo e, em seguida, pelo valor do próximo campo. O Atlas suporta consultas nos campos especificados utilizando as partições.

Por exemplo, suponha que você esteja configurando o arquivo online para a coleção do movies no banco de dados de dados do sample_mflix . Se genres o seu campo e seu segundo campo consultado for title, sua partição terá a seguinte aparência:

/genres/title

O Atlas cria partições primeiro para o campo genres , seguido pelo campo title . O Atlas utiliza as partições para consultas nos seguintes campos:

  • o campo genres,

  • o campo genres e o campo title .

O Atlas também pode utilizar as partições para suportar uma consulta no campo title somente. No entanto, nesse caso, o Atlas não seria tão eficiente no suporte à consulta quanto seria se a consulta estivesse apenas no campo genres ou nos campos genres e title . As partições são analisadas em ordem; se uma query omitir uma partição específica, o Atlas será menos eficiente ao usar quaisquer partições que se seguem a isso. Como uma consulta no title omite genres, o Atlas não usa a partição genres para oferecer suporte a essa consulta. Além disso, o Atlas é menos eficiente no uso das partições para suportar uma consulta no campo title seguido pelo campo genres .

O Atlas não pode usar as partições para suportar consultas em campos não especificados aqui.

  • Escolha campos que contenham apenas caracteres suportados no AWS. Para saber mais sobre os caracteres a serem evitados, consulte Criando nomes de chaves de objeto. O Atlas ignora e não arquiva documentos que contenham caracteres não suportados.

  • Escolha campos que não contêm dados polimórficos. O Atlas determina o tipo de dados de um campo de partição amostrando 10 documentos da coleção. O Atlas não arquivará um documento se o valor de campo especificado em um documento não corresponder aos valores em outros documentos na mesma coleção.

  • Escolha os campos que você consulta com frequência e ordene-os do campo mais consultado na primeira posição para o campo menos consultado na última posição. Por exemplo, se você frequentemente consultar o campo de data, deixe o campo de data na primeira posição. Mas se você consulta com frequência em outro campo, esse campo deve estar na primeira posição.

IMPORTANTE: para o Online Archives criados antes de 2023 de junho, o MongoDB não recomenda string campos de tipo com alta cardinalidade como um campo de query para o Online Archives. Para campos do tipo string com alta cardinalidade, o Atlas cria um grande número de partições. Isso não se aplica aos Online Archives criados após 2023 de junho. Para saber mais, leia a publicação no blog do MongoDB.

O Atlas suporta os seguintes tipos de atributo de partição:

  • date

  • double

  • int

  • long

  • objectId

  • string

  • boolean

Para saber mais sobre os tipos de atributo de partição suportados, consulte Tipos de Atributo de Partição.

IMPORTANTE: você pode usar o comando explain para retornar informações sobre as partições de dados usadas para atender a uma query. Para saber mais, consulte explain.

Embora as partições melhorem o desempenho da query, as queries que não contêm esses campos exigem uma digitalização completa da collection de todos os documentos arquivados, o que levará mais tempo e aumentará seus custos. Para saber mais sobre como as partições aprimoram as queries no Atlas Data Federation, veja Estrutura de dados no S3.

9

Você pode revisar as seguintes configurações de regras de arquivamento:

  • O nome do banco de dados e da coleção

  • O nome do provedor de nuvem e a região do provedor de nuvem

  • O nome do campo de data (somente para Date Match)

  • O número de dias para manter os dados no Atlas cluster (somente para Date Match)

  • O número de dias após os quais excluir os dados arquivados

  • A frequência e a janela de tempo para arquivamento de dados

  • A query personalizada a ser usada para identificar dados a serem arquivados (somente para Custom Criteria)

  • Os campos de partição

Clique em Back para editar estas configurações, se necessário.

10

Você pode executar explain na query para verificar se ela utiliza um índice. Avance para a próxima etapa para criar o índice se os campos não forem indexados. Se os campos já estiverem indexados, pule para a etapa final.

11
12
  1. Clique em Begin Archiving na aba Confirm an online archive.

  2. Clique em Confirm na janela Begin Archiving.

AVISO: depois que seu documento estiver em fila para arquivo, você não poderá mais editar o documento. Consulte Restaurar Documentos Específicos do arquivo online para mover os dados arquivados de volta para o cluster Atlas ativo.