Esta página fornece recomendações adicionais para melhorar o desempenho das suas queries do Atlas Vector Search.
Tenha memória suficiente.
O hierárquico de mundos pequenos navegáveis funciona eficientemente quando dados vetoriais são mantidos na memória. Você deve garantir que os nós de dados tenham RAM suficiente para manter os dados e índices vetoriais. Recomendamos a implantação de nós de pesquisa separados para isolamento do volume de trabalho sem isolamento de dados, o que permite um uso mais eficiente da memória para casos de uso de pesquisa vetorial.
Modelo de incorporação | Dimensão vetorial | Requisitos de espaço |
---|---|---|
OpenAI | 1536 | 6kb |
Google | 768 | 3kb |
Cohere | 1024 | 1.07kb (for int8 )0.167kb (for int1 ) |
Vetores quantizados BinData. Para saber mais,consulte Ingestão de vetores quantizados.
Aqueça o cache do sistema de arquivos
Ao realizar uma pesquisa vetorial sem usar nós de pesquisa dedicados, suas queries inicialmente realizam buscas aleatórias no disco enquanto você percorre o grafo Hierarchical Navigable Small Worlds, e os valores vetoriais são lidos na memória. Ao usar nós de pesquisa, esse aquecimento de cache normalmente ocorre apenas no caso de uma reconstrução de índice, geralmente durante períodos de manutenção programada.
Evite indexar vetores ao executar queries
A incorporação de vetores consome recursos computacionais durante a indexação. Como resultado, a indexação e a consulta simultânea podem causar gargalos de recursos. Ao realizar uma sincronização inicial, confirme se o uso da CPU do nó de pesquisa retorna a ~0%, indicando que os segmentos foram mesclados e gravados no disco, antes de realizar queries de teste.