/ /

Referencia del índice

Asignaciones de campos

Referencia del índice

Asignaciones de campos

Cómo indexar campos vectoriales

Interfaz

Puedes usar el tipo vector para indexar incrustaciones vectoriales. El campo vectorial debe contener un arreglo de números de los siguientes tipos:

BSON int32, int64, o double tipos de datos
BSON double Tipo de dato

Puedes utilizar el operador vectorSearch, similar a la etapa $vectorSearch, en tu pipeline de agregación $search para consultar campos indexados como el tipo vector.

`vector` Limitaciones de tipo

Se aplican las siguientes limitaciones:

No se puede indexar campos con arreglos de objetos (tipo MongoDB Search embeddedDocuments) como tipo vector.
No puedes establecer storedSource como true en definiciones de índices que contengan tipo vector. En su lugar, usa include para especificar los campos a almacenar en mongot o usa exclude para excluir el campo de tipo vector del almacenamiento.
No puedes usar la etapa de $vectorSearch para query campos indexados como el tipo vector.
Puedes indexar campos como el tipo vector en MongoDB Search Playground.

Define the Index for the `vector` Type

Configure `vector` Field Properties

El tipo vector de búsqueda de MongoDB toma los siguientes parámetros:

Opción	Tipo	Necesidad	Descripción
`type`	`vector`	Requerido	Etiqueta legible por humanos que identifica este tipo de campo. El valor debe ser `vector`.
`numDimensions`	Int	Requerido	Cantidad de dimensiones vectoriales que MongoDB Search aplica en el momento de la indexación y de la consulta. Solo puedes establecer este campo para campos de tipo `vector`. Debes especificar un valor menor o igual a `8192`. Para la indexación de vectores cuantizados o BinData, puede especificar uno de los siguientes valores: `1` a `8192` para vectores `int8` para la ingesta. Múltiplo de `8` para los vectores `int1` para la ingesta. `1` a `8192` para vectores `binData(float32)` y `array(float32)` para la cuantificación escalar automática. Múltiplo de `8` para los vectores `binData(float32)` y `array(float32)` para la cuantificación binaria automática. El modelo de incrustación que elijas determina el número de dimensiones en tus incrustaciones vectoriales, y algunos modelos ofrecen varias opciones para la cantidad de dimensiones que se generan. Para obtener más información, consulte Elegir un método para crear incrustaciones.
`similarity`	String	Requerido	Función de similitud vectorial para usar en la búsqueda de los K vecinos más cercanos. Puede configurar este campo solo para campos de tipo `vector`. Puede especificar uno de los siguientes valores: `euclidean` - mide la distancia entre los extremos de los vectores. `cosine` - mide la similitud basándose en el ángulo entre vectores. `dotProduct` - mide la similitud como `cosine`, pero tiene en cuenta la magnitud del vector. Para obtener más información, consulte Acerca de las funciones de similitud.
`quantization`	String	Opcional	Tipo de cuantización automática de vectores para tus vectores. Utiliza esta configuración solo si tus incrustaciones son vectores `float` o `double`. Puede especificar uno de los siguientes valores: `none` : indica que no hay cuantización automática para las incrustaciones vectoriales. Utilice esta configuración si dispone de vectores precuantizados para la ingesta. Si se omite, este es el valor por defecto. `scalar` : indica la cuantificación escalar, que transforma los valores en enteros de 1 byte. `binary` - Indica cuantización binaria, que transforma los valores a un solo bit. Para utilizar este valor, `numDimensions` debe ser un múltiplo de 8. Si la precisión es crítica, seleccione `none` o `scalar` en lugar de `binary`. Para aprender más, consulte Acerca de la Quantization.
`indexingMethod`	String	Opcional	Estructura de índice para el campo vectorial. El valor puede ser: `hnsw` - para índices basados en grafos donde los vectores similares están conectados `flat` - para índices planos, no de grafo Si se omite, el valor por defecto es `hnsw`. Si se especifica `hnsw`, MongoDB Vector Search realiza una búsqueda ANN sobre el Hierarchical Navigable Small Worlds grafo y una búsqueda ENN sobre vectores de fidelidad completa. También puedes especificar `hnswOptions`. Si especificas `flat`, MongoDB Vector Search realiza un escaneo completo sobre vectores de fidelidad completa o cuantificados. Durante una búsqueda ANN, MongoDB Vector Search ignora la configuración de `numCandidates`. Para la búsqueda ENN, MongoDB Vector Search realiza un escaneo completo de vectores de máxima fidelidad.
`hnswOptions`	Objeto	Opcional	Parámetros para usar en la construcción de grafos de Hierarchical Navigable Small Worlds. Si se omite, usa los valores por defecto para los parámetros `maxEdges` y `numEdgeCandidates`. IMPORTANTE: Esta funcionalidad está disponible como vista previa. La modificación de los valores por defecto podría impactar negativamente a tu índice y queries de MongoDB Search.
`hnswOptions.` `maxEdges`	Int	Opcional	Número máximo de aristas (o conexiones) que un nodo puede tener en el grafo de Hierarchical Navigable Small Worlds. El valor puede estar entre `16` y `64`, inclusive ambos. Si se omite, es por defecto `16`. Por ejemplo, para un valor de `16`, cada nodo puede tener un máximo de dieciséis aristas de salida en cada capa del grafo de Hierarchical Navigable Small Worlds. A higher number improves :recall (accuracy of search results) because the graph is better connected. However, this also increases query and indexing time by increasing the number of neighbors to evaluate per graph node, and requires more memory to store the additional nodes for each connection in the Hierarchical Navigable Small Worlds graph.
`hnswOptions.` `numEdgeCandidates`	Int	Opcional	De forma análoga a `numCandidates` durante el query, este parámetro controla el número máximo de nodos que se deben evaluar a fin de encontrar los vecinos más cercanos para conectarse a un nuevo nodo. El valor puede estar entre `100` y `3200`, ambos inclusive. Si se omite, el valor es por defecto `100`. Un número mayor proporciona un grafo con conexiones de alta calidad, lo que puede mejorar la calidad de la búsqueda (recall), pero también puede aumentar la latencia de la query.

Try an Example for the `vector` Type

El siguiente ejemplo de definición de índice utiliza la colección sample_mflix.embedded_movies en el datos de muestra. Después de cargar la colección, puedes utilizar el siguiente ejemplo para indexar el campo plot_embedding_voyage_3_large como el tipo vector para ejecutar consultas utilizando el vectorSearch (Operador de búsqueda de MongoDB). Para obtener una query de muestra que se ejecutar en este índice, consulta Ejemplo.

Esta definición de índice indexa automáticamente todos los campos indexables dinámicamente utilizando el por defecto typeSet y también indexa el campo plot_embedding_voyage_3_large como tipo vector con la siguiente configuración:

2048 número de dimensiones
dotProduct función de similitud
scalar cuantización
hnsw método de indexación (por defecto)

Volver

uuid

Sorted Index

Cómo indexar campos vectoriales

vector Limitaciones de tipo

Define the Index for the vector Type

Configure vector Field Properties

Configure vector Field Properties

Try an Example for the vector Type

`vector` Limitaciones de tipo

Define the Index for the `vector` Type

Configure `vector` Field Properties

Configure `vector` Field Properties

Try an Example for the `vector` Type