Join us at MongoDB.local London on 7 May to unlock new possibilities for your data. Use WEB50 to save 50%.
Register now >
Docs Menu
Docs Home
/ /

Recomendaciones de rendimiento adicionales

Esta página proporciona recomendaciones adicionales para mejorar el rendimiento de tus consultas de MongoDB Vector Search.

Mundos pequeños navegables jerárquicosFunciona de manera eficiente cuando los datos vectoriales se almacenan en memoria. Debe asegurarse de que los nodos de datos tengan suficiente RAM para almacenar los datos vectoriales y los índices. Recomendamos implementar nodos de búsqueda independientes para aislar la carga de trabajo sin aislar los datos, lo que permite un uso más eficiente de la memoria para casos de uso de búsqueda vectorial.

Modelo de incrustación
Dimensión vectorial
Requisitos de espacio

Voyage AI voyage_3_large

2048

8kb (for float)
2.14kb (for int8)
0.334kb (for int1)

OpenAI text-embedding-ada-002

1536

6kb

Google text-embedding-gecko

768

3kb

Cohere embed-english-v3.0

1024

4kb (for float)
1.07kb (for int8)
0.167kb (for int1)

Vectores cuantificados de BinData. Para obtener más información, consulte Ingerir vectores cuantificados.

La cantidad de recursos de CPU, memoria y disco que consume MongoDB Vector Search depende de varios factores, incluido el tamaño del índice y los criterios de query. Es importante supervisar el entorno para entender el estado y el rendimiento de la búsqueda vectorial y para confirmar la capacidad adecuada de la infraestructura e identificar cualquier anomalía.

Utiliza las siguientes métricas para observar y mejorar el rendimiento de tus índices y consultas de MongoDB Vector Search:

Supervisa la cantidad total de RAM utilizada por los índices de MongoDB Vector Search. La RAM adecuada es fundamental para el rendimiento de MongoDB Vector Search, porque las queries en el disco son mucho menos eficientes. Asegurarse de que todo el índice pueda caber en la memoria.

Asegúrese de que disponible System Memory siempre es mayor que System Memory usado. Si el índice no se consulta con frecuencia, es posible que no todo el índice esté en memoria. Por lo tanto, utilice la System Memory métrica junto con la Index Size métrica para optimizar el aprovisionamiento.

Si el tamaño del índice de vectores supera 3 GB, recomendamos la cuantificación de vectores, que almacena solo el 4% del índice en memoria en lugar de todo el índice.

Supervisa el tamaño total de todos los índices en disco en bytes. Esto es necesario para asegurarse de haber dimensionado correctamente los requisitos de RAM.

Verifique la búsqueda en Index Size la métrica de disco para ver cuál sería el tamaño total 100del índice si el % del vector se almacena en la memoria, y asegúrese de que sea menor que la memoria del sistema disponible.

Monitoree la tasa promedio de fallas de página en un proceso por segundo durante un período de muestra seleccionado. La métrica Page Faults indica con qué frecuencia la consulta de búsqueda va al disco, lo que indica que el índice completo no cabe en la memoria.

Esta métrica debe permanecer lo más cerca de cero posible. Si ves fallos de página constantemente, considera escalar el nivel de clúster hacia arriba para provisionar la RAM adecuada.

Cuando se realiza una búsqueda vectorial sin utilizar nodos de búsqueda dedicados, las consultas realizan inicialmente búsquedas aleatorias en el disco a medida que se recorre el grafo de mundos pequeños navegables jerárquicos y los valores vectoriales se cargan en la memoria. Al utilizar nodos de búsqueda, este calentamiento de la caché suele producirse únicamente en caso de reconstrucción del índice, normalmente durante las ventanas de mantenimiento programadas.

Las incrustaciones vectoriales consumen recursos computacionales durante la indexación. Las consultas de ENN en grandes conjuntos de datos consumen recursos de CPU. Como resultado, la indexación y la consulta al mismo tiempo pueden causar cuellos de botella en los recursos. Para evitar cuellos de botella en la CPU, evite la indexación de vectores cuando se estén ejecutando queries. Al realizar una sincronización inicial, asegúrate de que el uso de CPU del Search Node se acerque a 0%, lo que indica que los segmentos se han fusionado y guardado en el disco, antes de emitir consultas de prueba.

Supervise la Search Normalized Process CPU métrica durante las operaciones de indexación, ya que una indexación intensiva mostrará un uso elevado de la CPU. Esta métrica muestra el uso de la CPU como un porcentaje normalizado con respecto al número de núcleos de CPU disponibles, lo que permite evaluar la saturación de recursos en relación con la capacidad del clúster. Una vez indexadas las incrustaciones vectoriales, espere a que el uso de la CPU se acerque al 0% cuando finalicen la fusión y el vaciado de segmentos.

Volver

Resultados de benchmark

En esta página