Menu Docs
Página inicial do Docs
/ /

Arquitetura do Atlas Data Federation

O Atlas Data Federation segue os seguintes princípios:

  • Conexões seguras: ao usar o Atlas Data Federation, as instâncias do banco de dados federado residem em regionais VPC. Todo o tráfego de dados para clusters Atlas ou armazenamento em nuvem usa criptografia TLS, que é a forma primária de segurança de rede disponível com o Atlas Data Federation. Se a instância do banco de dados federado e a fonte de dados (cluster Atlas, S3, Blob ou Google Cloud Storage) compartilharem o mesmo provedor de nuvem, o tráfego de dados usará a infraestrutura de rede do provedor de nuvem ou a Internet pública, dependendo das funcionalidades do provedor de nuvem. Se estiverem em provedores de nuvem diferentes, o tráfego de dados usará a Internet pública.

  • Roteamento de Query: Atlas Data Federation e as instâncias do banco de dados federado usam uma interface unificada que abstrai as fontes de dados subjacentes para rotear queries em várias fontes de dados. As instâncias do banco de dados federado permitem o acesso a fontes de dados externas por meio da criação de coleções virtuais para representar dados externos em um formato semelhante ao MongoDB. Os bancos de dados lógicos agrupam coleções virtuais e coleções de clusters conectadas em namespaces unificados para consulta perfeita em diversas fontes de dados.

  • Query Parsing: Quando você executa uma query, o Atlas Data Federation a analisa e planeja caminhos de execução eficientes nas fontes de dados mapeadas nas coleções virtuais. O Atlas empurra operações, como filtros e agregação, para a origem quando possível. Para outras operações, como junções ou agregações em várias fontes, a instância do banco de dados federado recupera e processa os dados internamente e, em seguida, combina os resultados no banco de dados lógico para fornecer um conjunto de resultados nificado. Isso permite query diversas fontes de dados como se fossem um único banco de dados.

O diagrama a seguir ilustra esses princípios:

Arquitetura do Atlas Data Federation
clique para ampliar

O Plano de Dados no diagrama anterior é onde seus dados residem. Você pode configurar o Atlas Data Federation para acessar dados em uma variedade de serviços de armazenamento. Especificamente, você pode configurar o Atlas Data Federation para acessar dados em seus buckets do AWS S3, contêineres do Azure Blob Armazenamento, buckets do Google Cloud Armazenamento, clusters do Atlas, Arquivos Online do Atlas e HTTP e HTTPSURLs. Para saber mais sobre como configurar o Atlas Data Federation para acessar seus armazenamentos de dados, consulte Configurar armazenamentos de dados para uma instância do banco de dados federado.

O Atlas Data Federation preserva a localidade dos dados e maximiza a computação local, sempre que possível, para minimizar a transferência de dados e otimizar o desempenho. O Plano de Computação no diagrama anterior mostra onde o Atlas Data Federation processa todas as solicitações. O Atlas Data Federation utiliza um pool elástico de agentes na região mais próxima do seu armazenamento de dados para processar os dados para suas queries. Para saber mais sobre regiões suportadas, consulte Regiões do Atlas Data Federation.

O Atlas Data Federation não persiste dados subjacentes, mas persiste temporariamente dados de cursor na região frontend da conexão. Quaisquer metadados necessários para a execução da query são armazenados no backend global. Usar uma região de frontend igual à sua região de dados pode ajudar a cumprir as normas de soberania de dados.

O Plano de Controle no diagrama anterior lida com funções-chave, como encerramento do TLS, gerenciamento de cursores e armazenar temporariamente dados do cursor durante a execução da query. Ele também se coordena com o plano de computação, que processa as queries dos usuários e agrega os resultados finais.

Quando você executa uma query, ela é processada primeiro pelo Plano de controle, que determina a estratégia de execução mais eficiente. Essa query planejada é então distribuída para o Plano de Computação, que executa a lógica de query diretamente em seus armazenamentos de dados e retorna os resultados ao Plano de Controle. Se sua única fonte de dados for um único cluster Atlas, o Plano de Controle emitirá a query diretamente para o cluster, ignorando o Plano de Computação e simplificando a operação. Para aprender mais, consulte a seção query uma instância do banco de dados federado.

Você pode então configurar o controle de acesso baseado em função para suas instâncias do banco de dados federado. Você pode controlar como seu cliente se conecta à instância do banco de dados federado, por meio de uma opção de conexão global ou fixando-a em uma região específica. Para saber mais, consulte Configurar conexão para sua instância do banco de dados federado.

Voltar

Conceitos chave

Nesta página