início rápido do dimensionamento do mongot

O MongoDB Search e a Vector Search com o MongoDB Community estão em versão prévia. O recurso e a documentação correspondente podem mudar a qualquer momento durante o período de Pré-visualização. Para saber mais, consulte Recursos de visualização.

Para fornecer rapidamente seu sistema do mongot um equilíbrio saudável de recursos para a maioria dos casos de uso gerais, um nó pequeno ou médio de alta CPU geralmente é um ponto de partida eficaz. Essa configuração fornece uma base sólida para cargas de trabalho de pesquisa comuns.

Para obter um provisionamento de recursos mais preciso, personalizado para uma carga de trabalho específica, consulte as seguintes páginas:

Essas páginas oferecem orientação sobre aplicativos de função crítica ou quando a otimização de alta fidelidade é necessária.

Observação

O dimensionamento de recursos para volumes de trabalho de pesquisa e pesquisa vetorial é um processo iterativo. Esses exemplos representam um ponto de partida, mas considerações e medições avançadas podem ser necessárias para dimensionar uma carga de trabalho específica.

Classes de volume de trabalho

mongot os sistemas se enquadram em duas classes:

Baixa CPU (ideal para volumes de dados e pesquisa vetorial mais baixos)
Alta CPU (ideal para maiores volumes de dados e pesquisa de texto completo)

Use a orientação a seguir para selecionar uma configuração inicial que corresponda às necessidades do seu aplicativo.

Volumes de trabalho de baixa CPU

O arquetipo de baixa CPU é ideal para aplicativos de pesquisa vetorial ou baixos volumes de dados em que a memória é priorizada em relação à potência bruta da CPU. Estes nós normalmente têm uma proporção de RAM para CPU8:1 . Um fator-chave para determinar a categoria de tamanho apropriada é uma estimativa do tamanho total esperado do vetor. Para ver as faixas de tamanho do vetor de referência, consulte a tabela na etapa Selecionar um tamanho inicial da Introdução.

A tabela a seguir mostra recomendações para memória, armazenamento e núcleos de CPU com base em sua carga de trabalho esperada em sistemas de baixa CPU:

Categoria de tamanho do volume de trabalho	Memória padrão (GB)	Armazenamento padrão (GB)	Núcleos de CPU
Pequena	8 - 16	50 - 100	1 - 2
Médio	32 - 64	200 - 400	4 - 8
grande	128 - 256	800 - 1600	16 - 32

Considerações adicionais:

Pequena: adequado para testes iniciais ou aplicações de pesquisa vetorial muito pequenas.
Médio: adequado para casos de uso de pesquisa vetorial crescentes ou volumes de dados médios.
Grande: adequado para aplicativos de pesquisa vetorial volumosos ou volumes de trabalho maiores com baixo uso de CPU.

Volumes de trabalho de alta CPU

O arquetipo de alta CPU foi projetado para cargas de trabalho de pesquisa de texto completo de uso geral, em que as queries fazem mais uso intensivo da CPU. Estes nós normalmente têm uma proporção de RAM para CPU2:1 . Os principais fatores para determinar a categoria de tamanho apropriada incluem a taxa de transferência necessária (QPS) e a carga de indexação esperada. O volume de inserções pode servir como proxy para a carga de indexação. Mais inserções geralmente indicam um nível mais alto de atividade de indexação. Para ver os intervalos de QPS de referência, consulte a tabela na etapa Selecionar um tamanho inicial da Introdução.

A tabela a seguir mostra recomendações para memória, armazenamento e núcleos de CPU com base na carga de trabalho esperada em sistemas de alta CPU:

Categoria de tamanho do volume de trabalho	Memória padrão (GB)	Armazenamento padrão (GB)	Núcleos de CPU
Pequena	4 - 8	100 - 200	2 - 4
Médio	16 - 32	400 - 800	8 - 16
grande	64 - 96	1600 - 2400	32 - 48

Considerações adicionais:

Pequena: um ponto de partida para a pesquisa de texto completo com taxas de query moderadas. Uma configuração mínima de dois nós pequenos (total de 4 CPUs) suporta aproximadamente 40 QPS.
Médio: adequado para aplicativos de pesquisa de texto completo mais ativos com maior taxa de transferência de query.
Grande: adequado para quem exige pesquisa de texto completo, indexação pesada ou volumes de trabalho de query rolantes.

Considerações para volumes de trabalho de Vector Search grandes

A pesquisa vetorial é uma área de foco principal para aplicativos de IA. Técnicas modernas, como a quantização binária automática, estão mudando a restrição de recursos primários da RAM para o armazenamento. A quantização binária torna os índices mais restritos de armazenamento.

Nesses casos, considere um nó de classe baixa CPU com uma grande quantidade de armazenamento disponível. O armazenamento grande suporta incorporações de vetor de fidelidade total e a versão quantizada das incorporações de vetor de origem. Esse alinhamento de recursos ao volume de trabalho garante que você possa criar e dimensionar aplicativos modernos de IA de forma eficiente e econômicas.

Voltar

Introdução

Padrões de arquitetura