/ /

Cómo funciona la generación automática de incrustaciones

Puedes configurar la Búsqueda Vectorial de MongoDB para que genere y gestione automáticamente las vector embeddings para los datos de texts en tu clúster. Puedes crear un índice de búsqueda semántica de IA con un solo clic en tu clúster y usar modelos de incrustación de Voyage AI, simplificando la indexación, actualización y consulta con vectores.

Cuando habilitas la Incrustación automatizada, MongoDB búsqueda vectorial genera automáticamente incrustaciones usando el especificado embedding model en el momento de la indexación para el campo de texto especificado en tu colección y en el momento de la query para tu string en tu query contra el campo indexado para incrustaciones automatizadas.

Sincronización inicial

Cuando creas un índice de MongoDB Vector Search para Incrustación Automática, MongoDB realiza una sincronización inicial para generar incrustaciones para todos los documentos existentes en tu colección:

Escanea documentos.

MongoDB búsqueda vectorial analiza todos los documents en la colección que contienen el campo de texto indexado.
Genera incrustaciones.

Para cada document, MongoDB Vector Search envía el texto del campo indexado al embedding model de Voyage AI para generar vector embeddings.
Almacena incrustaciones.

MongoDB búsqueda vectorial almacena las incrustaciones generadas en una colección interna separada del sistema (__mdb_internal_search) en el mismo clúster para mantener las incrustaciones aisladas de los datos de la aplicación y al mismo tiempo mantener la localidad de los datos.
crear un índice.

Después de que se generan las incrustaciones, MongoDB Vector Search construye el índice utilizando las incrustaciones generadas para habilitar la búsqueda vectorial.

Durante la sincronización inicial, MongoDB procesa los documents en lotes y utiliza un nivel de procesamiento especial de inferencia Flex para optimizar el rendimiento.

Nota

La duración de la sincronización inicial depende de la cantidad de document, de la extensión del texts en el campo indexado y de la cuota del límite de la tasa disponible. La sincronización inicial de colecciones grandes puede tardar varias horas en completarse.

Actualizaciones continuas

Tras la sincronización inicial, MongoDB búsqueda vectorial mantiene las incrustaciones sincronizadas automáticamente con tus datos a medida que estos cambian.

Document Inserts

Cuando insertas un nuevo document con el campo de text indexado, MongoDB Vector Search automáticamente:

Detecta el nuevo document a través de flujos de cambios.
Genera incrustaciones para el campo de texto utilizando el model configurado.
Almacena las incrustaciones en la colección del sistema.
Actualiza el índice de búsqueda vectorial de MongoDB para incluir las nuevas incrustaciones.

Document Updates

Cuando actualices un document y el campo de texto indexado cambie, MongoDB Vector Search automáticamente:

Detecta el cambio del campo mediante flujos de cambio.
Genera nuevas incrustaciones para el texto actualizado.
Reemplaza las antiguas incrustaciones en la colección del sistema.
Actualiza el índice de búsqueda vectorial de MongoDB con las nuevas incrustaciones.

Nota

La búsqueda vectorial de MongoDB no desencadena la regeneración de incrustación para actualizaciones en campos que no están indexados para incrustaciones automatizadas.

document Eliminaciones

Cuando eliminas un document, MongoDB Vector Search elimina automáticamente los embeddings correspondientes de la colección del sistema y actualiza el índice.

Model Hosting y multiinquilinato

La incrustación automatizada utiliza los embedding model de Voyage AI, que son alojados y gestionados por MongoDB en un entorno multiinquilino:

Infraestructura de model

Servicio alojado: Todos los embedding model son alojados y mantenidos por MongoDB. La plataforma de inferencia del model funciona en la infraestructura de MongoDB en Google Cloud en una región de EE. UU. No necesitas implementar, configurar o gestionar ninguna infraestructura de model.
Acceso basado en API: para implementaciones autogestionadas que están configuradas para usar la clave de API de Voyage AI, MongoDB envía texto a los endpoints de la API de Voyage AI para generar incrustaciones. Las incrustaciones se devuelven a MongoDB y se almacenan en tu clúster.
Arquitectura multi-inquilino: El servicio de incrustación se comparte entre varios usuarios. Este model multi-inquilino proporciona:
- Eficiencia de costos mediante infraestructura compartida
- Actualizaciones y mejoras automáticas del model
- Alta disponibilidad y escalabilidad

Privacidad de los datos

El texto enviado al servicio de Embedding automático se utiliza únicamente para generar incrustaciones y no se almacena ni se usa para el entrenamiento del model.
Las incrustaciones se devuelven a tu clúster de MongoDB y se almacenan en tu propia base de datos.
Toda la comunicación con el servicio Automatizado de incrustación se realiza a través de conexiones cifradas.

Límites de velocidad

El servicio de incrustación es multiusuario. Por este motivo, MongoDB aplica límites de velocidad para garantizar un uso equitativo entre todos los clientes. Para obtener más información sobre los límites de tasa y cómo afectan las operaciones de incrustación automatizada, véase Límites de tasa.

Procesamiento de queries

Cuando ejecutas una query de búsqueda vectorial utilizando la incrustación automatizada, MongoDB gestiona automáticamente la generación de incrustaciones para el text de tu query:

Presentación del texto de la consulta: Usted proporciona una string en el campo query de la etapa $vectorSearch en lugar de un vector pre-generado.
Generación de incrustaciones: MongoDB envía el texto de tu query al servicio de incrustaciones automatizadas para generar incrustaciones utilizando el mismo modelo especificado en el índice (o un modelo compatible si se reemplaza con la opción model).
Búsqueda vectorial: Las incrustaciones de query generadas se utilizan para buscar las incrustaciones indexadas mediante la función de similitud configurada (coseno, dotProduct o euclidiana).
Resultados Devueltos: MongoDB retorna document categorizados por similitud con tu query.

Query Límites de velocidad

Cada query que utiliza la Incrustación Automatizada cuenta para tus límites de tasa de Incrustación Automatizada porque requiere una llamada a la API para generar incrustaciones. Para obtener más información sobre cómo gestionar el rendimiento y los costes de las consultas, consulta Límites de tasa.

Impacto en las operaciones

Sincronización inicial

Las colecciones grandes pueden tardar un tiempo considerable en completar la sincronización inicial si te topas con límites de velocidad.
MongoDB reintenta automáticamente las solicitudes de incrustación fallidas e implementa un retroceso exponencial.
Puede supervisar el progreso de la sincronización a través de Supervisión de búsqueda.

Actualizaciones continuas

Las actualizaciones de documentos se procesan a medida que ocurren, sujetas a límites de tasa.
Si las actualizaciones superan los límites de velocidad, se ponen en cola y se procesan cuando haya capacidad disponible.
Tu aplicación sigue funcionando con normalidad; solo la generación de incrustaciones podría retrasarse.

Queries

Los límites de frecuencia de consulta afectan la cantidad de búsquedas concurrentes que puedes realizar.
Si excedes los límites de la tasa de queries, las queries devolverán un error que indica que se ha superado el límite de tasa de query.
Considera almacenar en caché los resultados de las consultas que se usan con frecuencia o actualizar a un nivel de pago para un mayor rendimiento.

Colección de incrustaciones generadas

La Incrustación automatizada utiliza una base de datos de reserva separada para almacenar las vector embeddings. Puedes encontrar la colección generada de incrustaciones para un índice y recuperar las incrustaciones de la colección generada de incrustaciones.

Almacenamiento de incrustación

MongoDB almacena las incrustaciones generadas de forma asíncrona y las mantiene en una colección interna de incrustaciones generadas. Esta colección generada de incrustaciones existe en una base de datos interna dedicada llamada __mdb_internal_search en el mismo clúster. Cada índice de inserción automática en el clúster tiene exactamente una colección correspondiente de incrustaciones generadas dentro de esta base de datos. Para obtener más información, consulta Colección de incrustaciones generadas.

Advertencia

La base de datos __mdb_internal_search es un namespace interno reservado creado y gestionado por MongoDB. No manipules esta base de datos ni sus colecciones. Si modificas este namespace reservado, puede provocar fallos en el índice y resultados de búsqueda inconsistentes.

Estructura de la Colección de incrustación Generados

La colección de embeddings generados contiene un document por cada document de la colección original. Cada document de la colección de las incrustaciones generadas tiene el mismo _id que la fuente, copias de los campos de filtro de la fuente y el vector de incrustaciones generado para cada campo de incrustaciones automatizadas.

Puedes ver los siguientes campos:

Campo	Tipo	Descripción
`_id`	ObjectId	Mismo `_id` que el document fuente.
`<filter-field>`	Any	Copia del campo de filtro del document.
`_autoEmbed`	Objeto	Contiene el vector de incrustación para cada campo de incrustación automatizada.
`_autoEmbed`. `<fieldPath>`	Arreglo de float o vector cuantificado	Contiene el vector de incrustación generado para el campo de incrustación automatizada.

Encuentra la colección de incrustaciones generadas

Advertencia

Encontrar la colección de incrustaciones generadas para un índice de incrustaciones automatizado

Usa mongosh para encontrar la colección de incrustaciones generadas para un índice de incrustación automático.

Conéctese a su implementación de MongoDB `mongosh` usando.

Obtener el ID del índice.

Ejecute la siguiente consulta después de reemplazar los siguientes marcadores de posición:

<database_name> - Nombre de la base de datos que contiene el índice de incrustación automatizada.
<collection_name> - Nombre de la colección que contiene el índice de incrustación automatizada.
<index_name> - Nombre del índice de incrustación automatizado.

Ejemplo: Obtén la ID del índice de incrustación Automatizada

1 use <database_name>
2 db.<collection_name>.aggregate( [ { $listSearchIndexes: { name: "<index_name>" } } ] )

Ejemplo: Obtén la ID del índice de incrustación Automatizada

1 [
2    {
3       id: '69f382ecd6fa583100184fe7',
4       name: 'auto-embed-index',
5       type: 'vectorSearch',
6       status: 'READY',
7       numDocs: 0,
8       latestDefinition: { ... },
9       statusDetail: [ ... ]
10    }
11 ]

Obtén la colección de incrustaciones generadas:

Ejecuta la siguiente consulta después de sustituir <index_id> por el ID del índice de incrustación automatizado que devolvió el comando en el paso anterior.

Ejemplo: GET la colección de incrustaciones generadas

1 use __mdb_internal_search
2 db.getCollectionNames().filter(n => n.startsWith("<index_id>"))

Ejemplo: GET la colección de incrustaciones generadas

[ '69f382ecd6fa583100184fe7-96dad03b0a735a19fd9f1a22f9694efc-1-0' ]

La salida es el nombre de la colección de incrustaciones generadas.

Verifica cuántos document se han creado en la colección de incrustaciones generadas

Utiliza mongosh para encontrar el número de document en la colección de incrustaciones generados para un índice de Incrustación Automatizado.

Conéctese a su implementación de MongoDB `mongosh` usando.

Comprueba cuántos documents se han creado en la colección de incrustaciones generadas.

Ejecute la siguiente consulta después de reemplazar los siguientes marcadores de posición:

<generated_embeddings_collection_name> - Nombre de la colección de incrustaciones generadas.

Ejemplo: Comprueba cuántos document se han creado

1 use __mdb_internal_search
2 const mvColl = "<generated_embeddings_collection_name>"
3 db.getCollection(mvColl).countDocuments()

Ejemplo: Comprueba cuántos document se han creado

1 100

Comprueba el tamaño de almacenamiento de la colección de incrustaciones generadas

Puedes verificar el tamaño de almacenamiento de las colecciones de incrustaciones generadas para comprender el consumo de espacio en disco e índice a partir de las incrustaciones generadas. Esto es útil para la planificación de la capacidad, la depuración de crecimientos inesperados y la validación de la limpieza después de eliminar o redefinir un índice.

Importante

Antes de comprobar el tamaño del almacenamiento, encuentra el nombre de tu colección de incrustaciones generadas. Para más información, consulte Encuentra la colección de incrustaciones generadas.

Comprueba el tamaño de almacenamiento de la colección de incrustaciones generadas

Usa ``mongosh`` para encontrar el tamaño de almacenamiento de la colección de incrustaciones generadas.

Conéctese a su implementación de MongoDB `mongosh` usando.

Verifica el tamaño de almacenamiento de la colección de incrustaciones generadas.

Ejecuta la siguiente query después de sustituir <generated_embeddings_collection_name> por el nombre de la colección de incrustaciones generada:

Ejemplo: Verifica el tamaño de almacenamiento de la colección de incrustaciones generadas

1 use __mdb_internal_search
2 const mvColl = "<generated_embeddings_collection_name>"
3 db.getCollection(mvColl).stats()

El comando collStats proporciona métricas de almacenamiento detalladas para las colecciones de incrustaciones generadas. Usa este enfoque cuando necesites acceso programado, agregación en clústeres fragmentados o supervisión programada.

Los siguientes campos de collStats proporcionan información de almacenamiento:

Campo	Descripción
`count`	Number of document en la colección de incrustaciones generadas. Existe un document por cada document de origen con incrustaciones generadas.
`size`	Tamaño lógico sin comprimir de todos los documentos, en bytes.
`storageSize`	Tamaño en disco de los archivos de datos de la colección después de la compresión WiredTiger, en bytes.
`totalIndexSize`	Tamaño en disco de todos los índices de MongoDB en la colección de incrustaciones generada, en bytes.
`totalSize`	Suma de `storageSize` y `totalIndexSize`. Representa el uso total del disco.
`avgObjSize`	Tamaño promedio de document sin comprimir. Útil para validar el tamaño de incrustación por document.

Nota

storageSize y totalIndexSize reflejan el uso real del disco.
size es la vista lógica sin comprimir y normalmente es más grande.
Estas métricas muestran el almacenamiento solo en el clúster de MongoDB. No incluyen el disco utilizado por el índice vectorial Lucene en el host mongot.

Verificar el almacenamiento en un set de réplicas

Utiliza mongosh o PyMongo para comprobar el tamaño de almacenamiento de la colección de embeddings generada en un set de réplicas.

Ejecuta los siguientes comandos en la base de datos __mdb_internal_search:

1 use __mdb_internal_search
2 
3 const mvColl = "<generated_embeddings_collection_name>";
4 
5 db.runCommand({ collStats: mvColl }).count
6 db.runCommand({ collStats: mvColl, scale: 1024 * 1024 })

1 {
2    ns: '__mdb_internal_search.69f382ecd6fa583100184fe7-96dad03b0a735a19fd9f1a22f9694efc-1-0',
3    size: 5142,
4    count: 1250000,
5    avgObjSize: 4312,
6    numOrphanDocs: 0,
7    storageSize: 1830,
8    freeStorageSize: 7,
9    capped: false,
10    wiredTiger: { ... },
11    nindexes: 1,
12    indexDetails: { ... },
13    indexBuilds: [],
14    totalIndexSize: 42,
15    indexSizes: { _id_: 0 },
16    totalSize: 1872,
17    scaleFactor: 1048576,
18    ok: 1,
19    '$clusterTime': {
20       clusterTime: Timestamp({ t: 1777646199, i: 1 }),
21       signature: {
22          hash: Binary.createFromBase64('pomqluUIpiZzLro3VWhO4dt2LKE=', 0),
23          keyId: Long('7634583163557117960')
24       }
25    },
26    operationTime: Timestamp({ t: 1777646199, i: 1 })
27 }

Para obtener un resumen formateado, ejecute:

1 const s = db.runCommand({ collStats: mvColl, scale: 1024 * 1024 });
2 ({
3   count:          s.count,
4   avgObjSizeKB:   (s.avgObjSize / 1024).toFixed(2),
5   dataMB:         s.size,
6   storageMB:      s.storageSize,
7   indexesMB:      s.totalIndexSize,
8   totalMB:        s.totalSize,
9 })

1 {
2   "count": 1250000,
3   "avgObjSizeKB": "4.21",
4   "dataMB": 5142,
5   "storageMB": 1830,
6   "indexesMB": 42,
7   "totalMB": 1872
8 }

1 from pymongo import MongoClient
2 
3 MV_DATABASE = "__mdb_internal_search"
4 MB = 1024 * 1024
5 
6 def get_mv_storage_stats(client, mv_collection_name):
7     """Return storage metrics for a generated embeddings collection."""
8     db = client[MV_DATABASE]
9     stats = db.command("collStats", mv_collection_name, scale=MB)
10     return {
11         "count":         stats["count"],
12         "avg_obj_kb":    round(stats["avgObjSize"] / 1024, 2),
13         "data_mb":       stats["size"],
14         "storage_mb":    stats["storageSize"],
15         "indexes_mb":    stats["totalIndexSize"],
16         "total_mb":      stats["totalSize"],
17     }
18 
19 client = MongoClient("mongodb+srv://<user>:<pwd>@<cluster>/")
20 print(get_mv_storage_stats(client, "<generated_embeddings_collection_name>"))

Salida de muestra:

{'count': 1250000, 'avg_obj_kb': 4.21, 'data_mb': 5142, 'storage_mb': 1830, 'indexes_mb': 42, 'total_mb': 1872}

Verificar almacenamiento en un clúster particionado

Query cada partición para obtener métricas de almacenamiento a nivel de clúster.

En las colecciones de origen particionadas, cada partición tiene su propia colección de incrustaciones generadas en la base de datos __mdb_internal_search. mongos no ve estas colecciones, por lo que se debe consultar cada mongod de la partición directamente y sumar los resultados.

Obtenga la lista de particiones.

Ejecute el siguiente comando para listar todas las particiones:

db.adminCommand({ listShards: 1 })

Conéctese a cada partición.

Para cada partición, conecte directamente a su set de réplicas.

Ejecuta el comando en cada fragmento.`collStats`

Ejecute el comando collStats contra la colección de incrustaciones generada en esa partición.

Suma los resultados.

Agregar count, storageSize, totalIndexSize y totalSize en todas las particiones para obtener los totales en todo el clúster.

El siguiente script se conecta a cada partición, consulta la colección de incrustaciones generadas y devuelve métricas por partición y totales:

Ejemplo: comprobación del almacenamiento en un clúster particionado

1 from pymongo import MongoClient
2 
3 MV_DATABASE = "__mdb_internal_search"
4 MB = 1024 * 1024
5 
6 def _resolve_mv_name(client, source_db, source_collection, index_name):
7    """Find the generated embeddings collection name for an index."""
8    src = client[source_db][source_collection]
9    indexes = list(src.aggregate([{"$listSearchIndexes": {"name": index_name}}]))
10    if not indexes:
11       raise LookupError(f"No search index named {index_name!r}")
12    index_id = indexes[0]["id"]
13    matches = [n for n in client[MV_DATABASE].list_collection_names()
14                if n.startswith(index_id)]
15    if not matches:
16       return None
17    matches.sort(reverse=True)
18    return matches[0]
19 
20 def get_mv_storage_per_shard(shard_uris, source_db, source_collection, index_name):
21    """Get per-shard and total storage for a sharded cluster."""
22    per_shard = {}
23    totals = {"count": 0, "data_mb": 0, "storage_mb": 0,
24             "indexes_mb": 0, "total_mb": 0}
25 
26    for shard_name, uri in shard_uris.items():
27       client = MongoClient(uri)
28       mv_name = _resolve_mv_name(client, source_db, source_collection, index_name)
29 
30       if mv_name is None:
31             per_shard[shard_name] = {"note": "no MV found (still building?)"}
32             continue
33 
34       s = client[MV_DATABASE].command("collStats", mv_name, scale=MB)
35       row = {
36             "mv":           mv_name,
37             "count":        s["count"],
38             "data_mb":      s["size"],
39             "storage_mb":   s["storageSize"],
40             "indexes_mb":   s["totalIndexSize"],
41             "total_mb":     s["totalSize"],
42       }
43       per_shard[shard_name] = row
44 
45       for k in totals:
46             totals[k] += row[k]
47 
48    return {"per_shard": per_shard, "totals": totals}
49 
50 # Usage
51 shard_uris = {
52    "shard-00": "mongodb://<user>:<pwd>@shard-00.example.net:27017/?replicaSet=shard-00",
53    "shard-01": "mongodb://<user>:<pwd>@shard-01.example.net:27017/?replicaSet=shard-01",
54    "shard-02": "mongodb://<user>:<pwd>@shard-02.example.net:27017/?replicaSet=shard-02",
55 }
56 
57 result = get_mv_storage_per_shard(
58    shard_uris,
59    source_db="<source_db>",
60    source_collection="<source_collection>",
61    index_name="<index_name>",
62 )
63 
64 for shard, row in result["per_shard"].items():
65    print(shard, row)
66 print("TOTAL:", result["totals"])

Ejemplo: comprobación del almacenamiento en un clúster particionado

shard-00 {'mv': '69e183...-1-3', 'count': 416000, 'data_mb': 1714, 'storage_mb': 612, 'indexes_mb': 14, 'total_mb': 626}
shard-01 {'mv': '69e183...-1-3', 'count': 418200, 'data_mb': 1721, 'storage_mb': 615, 'indexes_mb': 14, 'total_mb': 629}
shard-02 {'mv': '69e183...-1-3', 'count': 415800, 'data_mb': 1707, 'storage_mb': 603, 'indexes_mb': 14, 'total_mb': 617}
TOTAL: {'count': 1250000, 'data_mb': 5142, 'storage_mb': 1830, 'indexes_mb': 42, 'total_mb': 1872}

Verificar el almacenamiento para todas las colecciones generadas de incrustaciones

Obtenga la huella total de la incrustación automatizada en todos los índices.

Para comprobar el almacenamiento de todos los índices de incrustación automatizada en un clúster, sumar collStats para cada colección en __mdb_internal_search. Esto es útil para revisiones de capacidad e identificar colecciones huérfanas de incrustaciones generadas.

Ejecute lo siguiente en mongosh en un único set de réplicas o en cada partición para clústeres particionados:

1 use __mdb_internal_search
2 
3 const MB = 1024 * 1024;
4 const rows = db.getCollectionNames().map(name => {
5 const s = db.runCommand({ collStats: name, scale: MB });
6 return {
7    collection: name,
8    count:      s.count,
9    storageMB:  s.storageSize,
10    indexesMB:  s.totalIndexSize,
11    totalMB:    s.totalSize,
12 };
13 });
14 
15 const total = rows.reduce((a, r) => ({
16 storageMB: a.storageMB + r.storageMB,
17 indexesMB: a.indexesMB + r.indexesMB,
18 totalMB:   a.totalMB   + r.totalMB,
19 }), { storageMB: 0, indexesMB: 0, totalMB: 0 });
20 
21 print("Per-collection:");
22 printjson(rows);
23 print("Cluster total:");
24 printjson(total);

1 Per-collection:
2 [
3    { "collection": "69e183...-1-3", "count": 1250000, "storageMB": 1830, "indexesMB": 42, "totalMB": 1872 },
4    { "collection": "71fa42...-1-1", "count":   84000, "storageMB":  121, "indexesMB":  3,  "totalMB":  124 }
5 ]
6 Cluster total:
7   { "storageMB": 1951, "indexesMB": 45, "totalMB": 1996 }
8 }

Nota

En los clústeres particionados, ejecuta este comando en cada partición y suma los resultados.

Recuperar incrustaciones de la colección de incrustaciones generadas

Recuperar incrustaciones para un document

Utiliza mongosh para recuperar incrustaciones de la colección de incrustaciones generada.

Conéctese a su implementación de MongoDB `mongosh` usando.

Recuperar incrustaciones para un document.

Ejecute la siguiente consulta después de reemplazar los siguientes marcadores de posición:

<generated_embeddings_collection_name> - Nombre de la colección de incrustaciones generadas.
<document_id> - _id del document en la colección de origen.
<auto_embed_field> - Nombre del campo indexado para la incrustación automatizada.

Ejemplo: Recuperar incrustaciones de la colección de incrustaciones generadas

1 use __mdb_internal_search
2 const mvColl = "<generated_embeddings_collection_name>"
3 db.getCollection(mvColl).findOne(
4    { _id: "<document_id>" },
5    { _id: 1, "_autoEmbed.<auto_embed_field>": 1 }
6 )

Ejemplo: Recuperar incrustaciones de la colección de incrustaciones generadas

1 [
2    { _autoEmbed: {}, _id: "ObjectId('573a1390f29313caabcd5c0f')" },
3    { _autoEmbed: {}, _id: "ObjectId('573a1390f29313caabcd5c0f')" },
4    {
5       _autoEmbed: {
6          fullplot: Binary.fromInt8Array(new Int8Array([
7             5, -30,  16,   4, -57,  -8, -17, -13,  16,  11, -22,  15,
8             -7,  13,   8,  -2,  -1, -14,  27,  10,  -9,  20,  14,  -2,
9             3, -56, -21,  10, -24,  12,  10,   9,  12,   7,   4,  14,
10             -7, -24, -15,  16,  13,  21,  -4, -16, -12, -15,   3, -33,
11             5, -21,   2,  -1,   0,  16,   7,  13,  19,   4,   5, -14,
12          -34,   7, -16,  38,   4,   4,   7, -22,   8,  14,  15, -14,
13             -4,   6,  22, -17,   8,  27,   8,  13,  46, -12,  -7,  -9,
14          -20,  13,  10,   4, -14, -11,  31,  -7,   0,  -3,   1,  16,
15             9,   5,   6,  -2,
16          ... 924 more items
17          ]))
18       },
19       _id: "ObjectId('573a1390f29313caabcd5c0f')"
20    },
21    {
22       _autoEmbed: {
23          fullplot: Binary.fromInt8Array(new Int8Array([
24             -5, -22,  22,  -6, -43, -13,  -5,   4,  5,   2,   4,  13,
25             0,  -3,  -3, -50,  -5,  -2,  -2,  27, -5,  36,  27,  12,
26          -12,  -6,  -1,   9,  -7,  25,   4, -28,  3,   9,   3,  23,
27             8,  11,  11,  25, -19,  27,  17,  18, -1,   0,   5, -12,
28             13,  -5,  -3,   3, -17,  16, -15,  43, -1,   1,   1,  -6,
29          -26,  16, -11,  13,  14,   0,  -9, -23, 25, -16,  11, -25,
30             7,   9,  -1,   0,  33,  -8,  -3, -18,  3,   4, -20, -14,
31             17,  -2,  -2, -10,  17, -25, -11,   9,  1,   2,  -8,   7,
32             20,  18,  17,  -2,
33          ... 924 more items
34          ]))
35       },
36       _id: "ObjectId('573a1390f29313caabcd5c0f')"
37    },
38    {
39       _autoEmbed: {
40          fullplot: Binary.fromInt8Array(new Int8Array([
41             0,  -1,  47,   6, -20, -14,  29,  -2,  13,  -1,  20,  11,
42          -18,  -7,  12, -10, -25,  10,   7, -15,  11,   9, -14,  12,
43             -9, -22,  16,   0,  18,   5,   9, -26,  14, -27,   6,  20,
44          -19,  -8,   1,  -5,  21,  13, -37,  -7,   0, -21, -51,   1,
45          -38, -14,   4,   6, -23,  15,  19,  33,   8,   0,  -7,  -3,
46          -25,   8, -29,  25,  -1,  12,   4, -21,  -1,   0, -14,  -3,
47             -6,  -3,   7,  30,   8,  -8,  34, -19, -12, -29, -15, -14,
48             1,  -4,   6,  -2, -36, -18,  -2,   4,  23,  17, -13,   1,
49             0,   7,  25, -19,
50          ... 924 more items
51          ]))
52       },
53       _id: "ObjectId('573a1390f29313caabcd5c0f')"
54    }
55 ]

Recuperar incrustaciones para múltiples documentos

Utiliza mongosh para recuperar incrustaciones de la colección de incrustaciones generada.

Conéctese a su implementación de MongoDB `mongosh` usando.

Recuperar incrustaciones para múltiples documents.

Ejecute la siguiente consulta después de reemplazar los siguientes marcadores de posición:

<generated_embeddings_collection_name> - Nombre de la colección de incrustaciones generadas.
<document_id> - _id del document en la colección de origen.
<auto_embed_field> - Nombre del campo indexado para la incrustación automatizada.
<number_of_documents> - El número de document a retornar.

Ejemplo: Recuperar incrustaciones de la colección de incrustaciones generadas

1 use __mdb_internal_search
2 const mvColl = "<generated_embeddings_collection_name>"
3 db.getCollection(mvColl).find(
4    {},
5    { _id: "<document_id>", "_autoEmbed.<auto_embed_field>": { $slice: 5 } }
6 ).limit(<number_of_documents>)

Ejemplo: Recuperar incrustaciones de la colección de incrustaciones generadas

1 [
2    { _autoEmbed: {}, _id: "ObjectId('573a1390f29313caabcd5c0f')" },
3    { _autoEmbed: {}, _id: "ObjectId('573a1390f29313caabcd5c0f')" },
4    {
5       _autoEmbed: {
6          fullplot: Binary.fromInt8Array(new Int8Array([
7             5, -30,  16,   4, -57,  -8, -17, -13,  16,  11, -22,  15,
8             -7,  13,   8,  -2,  -1, -14,  27,  10,  -9,  20,  14,  -2,
9             3, -56, -21,  10, -24,  12,  10,   9,  12,   7,   4,  14,
10             -7, -24, -15,  16,  13,  21,  -4, -16, -12, -15,   3, -33,
11             5, -21,   2,  -1,   0,  16,   7,  13,  19,   4,   5, -14,
12          -34,   7, -16,  38,   4,   4,   7, -22,   8,  14,  15, -14,
13             -4,   6,  22, -17,   8,  27,   8,  13,  46, -12,  -7,  -9,
14          -20,  13,  10,   4, -14, -11,  31,  -7,   0,  -3,   1,  16,
15             9,   5,   6,  -2,
16          ... 924 more items
17          ]))
18       },
19       _id: "ObjectId('573a1390f29313caabcd5c0f')"
20    },
21    {
22       _autoEmbed: {
23          fullplot: Binary.fromInt8Array(new Int8Array([
24             -5, -22,  22,  -6, -43, -13,  -5,   4,  5,   2,   4,  13,
25             0,  -3,  -3, -50,  -5,  -2,  -2,  27, -5,  36,  27,  12,
26          -12,  -6,  -1,   9,  -7,  25,   4, -28,  3,   9,   3,  23,
27             8,  11,  11,  25, -19,  27,  17,  18, -1,   0,   5, -12,
28             13,  -5,  -3,   3, -17,  16, -15,  43, -1,   1,   1,  -6,
29          -26,  16, -11,  13,  14,   0,  -9, -23, 25, -16,  11, -25,
30             7,   9,  -1,   0,  33,  -8,  -3, -18,  3,   4, -20, -14,
31             17,  -2,  -2, -10,  17, -25, -11,   9,  1,   2,  -8,   7,
32             20,  18,  17,  -2,
33          ... 924 more items
34          ]))
35       },
36       _id: "ObjectId('573a1390f29313caabcd5c0f')"
37    },
38    {
39       _autoEmbed: {
40          fullplot: Binary.fromInt8Array(new Int8Array([
41             0,  -1,  47,   6, -20, -14,  29,  -2,  13,  -1,  20,  11,
42          -18,  -7,  12, -10, -25,  10,   7, -15,  11,   9, -14,  12,
43             -9, -22,  16,   0,  18,   5,   9, -26,  14, -27,   6,  20,
44          -19,  -8,   1,  -5,  21,  13, -37,  -7,   0, -21, -51,   1,
45          -38, -14,   4,   6, -23,  15,  19,  33,   8,   0,  -7,  -3,
46          -25,   8, -29,  25,  -1,  12,   4, -21,  -1,   0, -14,  -3,
47             -6,  -3,   7,  30,   8,  -8,  34, -19, -12, -29, -15, -14,
48             1,  -4,   6,  -2, -36, -18,  -2,   4,  23,  17, -13,   1,
49             0,   7,  25, -19,
50          ... 924 more items
51          ]))
52       },
53       _id: "ObjectId('573a1390f29313caabcd5c0f')"
54    }
55 ]

Scripts de PyMongo para recuperar incrustaciones de la colección de incrustaciones generadas

Utilice PyMongo para recuperar incrustaciones de la colección de incrustaciones generados.

Para recuperar incrustaciones de la colección de incrustaciones generadas, puedes utilizar el siguiente script de Python. Para ejecutar el script, instale el controlador PyMongo.

Crear un archivo llamado `get_embedding.py`.

Copia y pega el siguiente código en el archivo `get_embedding.py`.

Ejemplo: Recuperar incrustaciones de la colección de incrustaciones generadas

1 from pymongo import MongoClient
2 
3 MV_DATABASE = "__mdb_internal_search"
4 
5 def get_mv_collection(client, source_db, source_collection, index_name):
6    """Resolve the MV collection for an auto-embedding index."""
7    # 1. Look up the index ID via $listSearchIndexes on the source collection.
8    src = client[source_db][source_collection]
9    indexes = list(src.aggregate([{"$listSearchIndexes": {"name": index_name}}]))
10    if not indexes:
11       raise LookupError(f"No search index named {index_name!r} on {source_db}.{source_collection}")
12    index_id = indexes[0]["id"]
13 
14    # 2. Find the MV collection in __mdb_internal_search whose name starts with the index ID.
15    mv_db = client[MV_DATABASE]
16    matches = [n for n in mv_db.list_collection_names() if n.startswith(index_id)]
17    if not matches:
18       raise LookupError(f"No MV collection found for index {index_id} (index may still be building)")
19    if len(matches) > 1:
20       # Possible briefly during an auto-embed field update; pick the newest.
21       matches.sort(reverse=True)
22    return mv_db[matches[0]]
23 
24 def get_embedding(client, source_db, source_collection, index_name, embed_path, source_id):
25    """Fetch the embedding for a single source document."""
26    mv = get_mv_collection(client, source_db, source_collection, index_name)
27    doc = mv.find_one(
28       {"_id": source_id},
29       {"_id": 1, f"_autoEmbed.{embed_path}": 1},
30    )
31    if doc is None:
32       return None
33    return doc["_autoEmbed"][embed_path]
34 
35 # --- Usage ---
36 client = MongoClient("mongodb+srv://<user>:<pwd>@<cluster>/")
37 
38 embedding = get_embedding(
39    client,
40    source_db="<source_db>",
41    source_collection="<source_collection>",
42    index_name="<auto_embed_index_name>",
43    embed_path="<auto_embed_field>",
44    source_id="<document_id>",
45 )
46 
47 print(f"dims:    {len(embedding)}")
48 print(f"first 5: {embedding[:5]}")

Reemplace los siguientes marcadores de posición en el `get_embedding.py` archivo:

Marcador de posición	Descripción
`<user>`	Tu nombre de usuario para tu implementación de MongoDB.
`<pwd>`	Tu contraseña para tu implementación de MongoDB.
`<cluster>`	Tu cadena de conexión de clúster para tu implementación de MongoDB.
`<source_db>`	Nombre de la base de datos que contiene la colección fuente.
`<source_collection>`	Nombre de la colección de origen.
`<index_name>`	Nombre del índice de incrustación automatizado.
`<source_id>`	`_id` del document en la colección de origen.
`<auto_embed_field>`	Nombre del campo indexado para la Incrustación automática.
`<number_of_documents>`	Número de documentos a devolver.

Ejecute el siguiente comando para recuperar las incrustaciones de la colección de incrustaciones generada.

python get_embedding.py

Para transmitir incrustaciones desde la colección de incrustaciones generadas, puede utilizar el siguiente script de Python.

Crear un archivo llamado `stream_embedding.py`.

Copia y pega el siguiente código en el archivo `stream_embedding.py`.

Ejemplo: Transmisión de incrustaciones desde la colección de incrustaciones generadas

1 from pymongo import MongoClient
2 
3 # --- Usage ---
4 client = MongoClient("mongodb+srv://<user>:<pwd>@<cluster>/")
5 
6 mv = get_mv_collection(client, "<source_db>", "<source_collection>", "<auto_embed_index_name>")
7 
8 cursor = mv.find(
9    {},
10    {"_id": 1, "_autoEmbed.<auto_embed_field>": 1},
11    batch_size=500,
12 )
13 
14 for doc in cursor:
15    src_id = doc["_id"]
16    vec = doc["_autoEmbed"]["<auto_embed_field>"]

Reemplace los siguientes marcadores de posición en el `stream_embedding.py` archivo:

Marcador de posición	Descripción
`<user>`	Tu nombre de usuario para tu implementación de MongoDB.
`<pwd>`	Tu contraseña para tu implementación de MongoDB.
`<cluster>`	Tu cadena de conexión de clúster para tu implementación de MongoDB.
`<source_db>`	Nombre de la base de datos que contiene la colección fuente.
`<source_collection>`	Nombre de la colección de origen.
`<auto_embed_index_name>`	Nombre del índice de incrustación automatizado.
`<auto_embed_field>`	Nombre del campo indexado para la Incrustación automática.

Ejecute el siguiente comando para transmitir incrustaciones desde la colección de incrustaciones generadas.

python stream_embedding.py

Solución de problemas

Las siguientes secciones proporcionan orientación para la resolución de problemas comunes con la incrustación automática.

No hay ninguna colección de incrustaciones generadas que coincida con el ID de índice: Tu índice aún podría estar en el estado Building o Pending. La colección de incrustaciones generadas se crea de forma perezosa en la primera escritura. Comprobar el estado utilizando el $listSearchIndexes.
document faltante para una fuente _id: La incrustación de ese document especificado aún no se ha generado, o el document fue filtrado por la expresión de filtro del índice.
Más de una colección coincide con el ID de índice: La configuración del campo de inserción automática se ha actualizado. Aunque se ha creado una nueva colección de incrustaciones generadas, la anterior puede permanecer temporalmente hasta que se realice la limpieza.

Volver

Gestionar la facturación

Referencia del índice

1	use <database_name>
2	db.<collection_name>.aggregate( [ { $listSearchIndexes: { name: "<index_name>" } } ] )

1	[
2	{
3	id: '69f382ecd6fa583100184fe7',
4	name: 'auto-embed-index',
5	type: 'vectorSearch',
6	status: 'READY',
7	numDocs: 0,
8	latestDefinition: { ... },
9	statusDetail: [ ... ]
10	}
11	]

1	use __mdb_internal_search
2	db.getCollectionNames().filter(n => n.startsWith("<index_id>"))

1	use __mdb_internal_search
2	const mvColl = "<generated_embeddings_collection_name>"
3	db.getCollection(mvColl).countDocuments()

1	use __mdb_internal_search
2	const mvColl = "<generated_embeddings_collection_name>"
3	db.getCollection(mvColl).stats()

1	use __mdb_internal_search
2
3	const mvColl = "<generated_embeddings_collection_name>";
4
5	db.runCommand({ collStats: mvColl }).count
6	db.runCommand({ collStats: mvColl, scale: 1024 * 1024 })

1	{
2	ns: '__mdb_internal_search.69f382ecd6fa583100184fe7-96dad03b0a735a19fd9f1a22f9694efc-1-0',
3	size: 5142,
4	count: 1250000,
5	avgObjSize: 4312,
6	numOrphanDocs: 0,
7	storageSize: 1830,
8	freeStorageSize: 7,
9	capped: false,
10	wiredTiger: { ... },
11	nindexes: 1,
12	indexDetails: { ... },
13	indexBuilds: [],
14	totalIndexSize: 42,
15	indexSizes: { _id_: 0 },
16	totalSize: 1872,
17	scaleFactor: 1048576,
18	ok: 1,
19	'$clusterTime': {
20	clusterTime: Timestamp({ t: 1777646199, i: 1 }),
21	signature: {
22	hash: Binary.createFromBase64('pomqluUIpiZzLro3VWhO4dt2LKE=', 0),
23	keyId: Long('7634583163557117960')
24	}
25	},
26	operationTime: Timestamp({ t: 1777646199, i: 1 })
27	}

1	const s = db.runCommand({ collStats: mvColl, scale: 1024 * 1024 });
2	({
3	count: s.count,
4	avgObjSizeKB: (s.avgObjSize / 1024).toFixed(2),
5	dataMB: s.size,
6	storageMB: s.storageSize,
7	indexesMB: s.totalIndexSize,
8	totalMB: s.totalSize,
9	})

1	{
2	"count": 1250000,
3	"avgObjSizeKB": "4.21",
4	"dataMB": 5142,
5	"storageMB": 1830,
6	"indexesMB": 42,
7	"totalMB": 1872
8	}

1	from pymongo import MongoClient
2
3	MV_DATABASE = "__mdb_internal_search"
4	MB = 1024 * 1024
5
6	def get_mv_storage_stats(client, mv_collection_name):
7	"""Return storage metrics for a generated embeddings collection."""
8	db = client[MV_DATABASE]
9	stats = db.command("collStats", mv_collection_name, scale=MB)
10	return {
11	"count": stats["count"],
12	"avg_obj_kb": round(stats["avgObjSize"] / 1024, 2),
13	"data_mb": stats["size"],
14	"storage_mb": stats["storageSize"],
15	"indexes_mb": stats["totalIndexSize"],
16	"total_mb": stats["totalSize"],
17	}
18
19	client = MongoClient("mongodb+srv://<user>:<pwd>@<cluster>/")
20	print(get_mv_storage_stats(client, "<generated_embeddings_collection_name>"))

1	use __mdb_internal_search
2
3	const MB = 1024 * 1024;
4	const rows = db.getCollectionNames().map(name => {
5	const s = db.runCommand({ collStats: name, scale: MB });
6	return {
7	collection: name,
8	count: s.count,
9	storageMB: s.storageSize,
10	indexesMB: s.totalIndexSize,
11	totalMB: s.totalSize,
12	};
13	});
14
15	const total = rows.reduce((a, r) => ({
16	storageMB: a.storageMB + r.storageMB,
17	indexesMB: a.indexesMB + r.indexesMB,
18	totalMB: a.totalMB + r.totalMB,
19	}), { storageMB: 0, indexesMB: 0, totalMB: 0 });
20
21	print("Per-collection:");
22	printjson(rows);
23	print("Cluster total:");
24	printjson(total);

1	Per-collection:
2	[
3	{ "collection": "69e183...-1-3", "count": 1250000, "storageMB": 1830, "indexesMB": 42, "totalMB": 1872 },
4	{ "collection": "71fa42...-1-1", "count": 84000, "storageMB": 121, "indexesMB": 3, "totalMB": 124 }
5	]
6	Cluster total:
7	{ "storageMB": 1951, "indexesMB": 45, "totalMB": 1996 }
8	}

1	use __mdb_internal_search
2	const mvColl = "<generated_embeddings_collection_name>"
3	db.getCollection(mvColl).findOne(
4	{ _id: "<document_id>" },
5	{ _id: 1, "_autoEmbed.<auto_embed_field>": 1 }
6	)

1	[
2	{ _autoEmbed: {}, _id: "ObjectId('573a1390f29313caabcd5c0f')" },
3	{ _autoEmbed: {}, _id: "ObjectId('573a1390f29313caabcd5c0f')" },
4	{
5	_autoEmbed: {
6	fullplot: Binary.fromInt8Array(new Int8Array([
7	5, -30, 16, 4, -57, -8, -17, -13, 16, 11, -22, 15,
8	-7, 13, 8, -2, -1, -14, 27, 10, -9, 20, 14, -2,
9	3, -56, -21, 10, -24, 12, 10, 9, 12, 7, 4, 14,
10	-7, -24, -15, 16, 13, 21, -4, -16, -12, -15, 3, -33,
11	5, -21, 2, -1, 0, 16, 7, 13, 19, 4, 5, -14,
12	-34, 7, -16, 38, 4, 4, 7, -22, 8, 14, 15, -14,
13	-4, 6, 22, -17, 8, 27, 8, 13, 46, -12, -7, -9,
14	-20, 13, 10, 4, -14, -11, 31, -7, 0, -3, 1, 16,
15	9, 5, 6, -2,
16	... 924 more items
17	]))
18	},
19	_id: "ObjectId('573a1390f29313caabcd5c0f')"
20	},
21	{
22	_autoEmbed: {
23	fullplot: Binary.fromInt8Array(new Int8Array([
24	-5, -22, 22, -6, -43, -13, -5, 4, 5, 2, 4, 13,
25	0, -3, -3, -50, -5, -2, -2, 27, -5, 36, 27, 12,
26	-12, -6, -1, 9, -7, 25, 4, -28, 3, 9, 3, 23,
27	8, 11, 11, 25, -19, 27, 17, 18, -1, 0, 5, -12,
28	13, -5, -3, 3, -17, 16, -15, 43, -1, 1, 1, -6,
29	-26, 16, -11, 13, 14, 0, -9, -23, 25, -16, 11, -25,
30	7, 9, -1, 0, 33, -8, -3, -18, 3, 4, -20, -14,
31	17, -2, -2, -10, 17, -25, -11, 9, 1, 2, -8, 7,
32	20, 18, 17, -2,
33	... 924 more items
34	]))
35	},
36	_id: "ObjectId('573a1390f29313caabcd5c0f')"
37	},
38	{
39	_autoEmbed: {
40	fullplot: Binary.fromInt8Array(new Int8Array([
41	0, -1, 47, 6, -20, -14, 29, -2, 13, -1, 20, 11,
42	-18, -7, 12, -10, -25, 10, 7, -15, 11, 9, -14, 12,
43	-9, -22, 16, 0, 18, 5, 9, -26, 14, -27, 6, 20,
44	-19, -8, 1, -5, 21, 13, -37, -7, 0, -21, -51, 1,
45	-38, -14, 4, 6, -23, 15, 19, 33, 8, 0, -7, -3,
46	-25, 8, -29, 25, -1, 12, 4, -21, -1, 0, -14, -3,
47	-6, -3, 7, 30, 8, -8, 34, -19, -12, -29, -15, -14,
48	1, -4, 6, -2, -36, -18, -2, 4, 23, 17, -13, 1,
49	0, 7, 25, -19,
50	... 924 more items
51	]))
52	},
53	_id: "ObjectId('573a1390f29313caabcd5c0f')"
54	}
55	]

1	use __mdb_internal_search
2	const mvColl = "<generated_embeddings_collection_name>"
3	db.getCollection(mvColl).find(
4	{},
5	{ _id: "<document_id>", "_autoEmbed.<auto_embed_field>": { $slice: 5 } }
6	).limit(<number_of_documents>)

1	from pymongo import MongoClient
2
3	MV_DATABASE = "__mdb_internal_search"
4
5	def get_mv_collection(client, source_db, source_collection, index_name):
6	"""Resolve the MV collection for an auto-embedding index."""
7	# 1. Look up the index ID via $listSearchIndexes on the source collection.
8	src = client[source_db][source_collection]
9	indexes = list(src.aggregate([{"$listSearchIndexes": {"name": index_name}}]))
10	if not indexes:
11	raise LookupError(f"No search index named {index_name!r} on {source_db}.{source_collection}")
12	index_id = indexes[0]["id"]
13
14	# 2. Find the MV collection in __mdb_internal_search whose name starts with the index ID.
15	mv_db = client[MV_DATABASE]
16	matches = [n for n in mv_db.list_collection_names() if n.startswith(index_id)]
17	if not matches:
18	raise LookupError(f"No MV collection found for index {index_id} (index may still be building)")
19	if len(matches) > 1:
20	# Possible briefly during an auto-embed field update; pick the newest.
21	matches.sort(reverse=True)
22	return mv_db[matches[0]]
23
24	def get_embedding(client, source_db, source_collection, index_name, embed_path, source_id):
25	"""Fetch the embedding for a single source document."""
26	mv = get_mv_collection(client, source_db, source_collection, index_name)
27	doc = mv.find_one(
28	{"_id": source_id},
29	{"_id": 1, f"_autoEmbed.{embed_path}": 1},
30	)
31	if doc is None:
32	return None
33	return doc["_autoEmbed"][embed_path]
34
35	# --- Usage ---
36	client = MongoClient("mongodb+srv://<user>:<pwd>@<cluster>/")
37
38	embedding = get_embedding(
39	client,
40	source_db="<source_db>",
41	source_collection="<source_collection>",
42	index_name="<auto_embed_index_name>",
43	embed_path="<auto_embed_field>",
44	source_id="<document_id>",
45	)
46
47	print(f"dims: {len(embedding)}")
48	print(f"first 5: {embedding[:5]}")

Cómo funciona la generación automática de incrustaciones

Sincronización inicial

Nota

Actualizaciones continuas

Document Inserts

Document Updates

Nota

document Eliminaciones

Model Hosting y multiinquilinato

Infraestructura de model

Privacidad de los datos

Límites de velocidad

Procesamiento de queries

Query Límites de velocidad

Impacto en las operaciones

Sincronización inicial

Actualizaciones continuas

Queries

Colección de incrustaciones generadas

Advertencia

Encuentra la colección de incrustaciones generadas

Advertencia

Encontrar la colección de incrustaciones generadas para un índice de incrustaciones automatizado

Conéctese a su implementación de MongoDB mongosh usando.

Obtener el ID del índice.

Obtén la colección de incrustaciones generadas:

Verifica cuántos document se han creado en la colección de incrustaciones generadas

Conéctese a su implementación de MongoDB mongosh usando.

Comprueba cuántos documents se han creado en la colección de incrustaciones generadas.

Comprueba el tamaño de almacenamiento de la colección de incrustaciones generadas

Importante

Comprueba el tamaño de almacenamiento de la colección de incrustaciones generadas

Conéctese a su implementación de MongoDB mongosh usando.

Verifica el tamaño de almacenamiento de la colección de incrustaciones generadas.

Nota

Verificar el almacenamiento en un set de réplicas

Verificar almacenamiento en un clúster particionado

Obtenga la lista de particiones.

Conéctese a cada partición.

Ejecuta el comando en cada fragmento.collStats

Suma los resultados.

Verificar el almacenamiento para todas las colecciones generadas de incrustaciones

Nota

Recuperar incrustaciones de la colección de incrustaciones generadas

Recuperar incrustaciones para un document

Conéctese a su implementación de MongoDB mongosh usando.

Recuperar incrustaciones para un document.

Recuperar incrustaciones para múltiples documentos

Conéctese a su implementación de MongoDB mongosh usando.

Recuperar incrustaciones para múltiples documents.

Scripts de PyMongo para recuperar incrustaciones de la colección de incrustaciones generadas

Crear un archivo llamado get_embedding.py.

Copia y pega el siguiente código en el archivo get_embedding.py.

Reemplace los siguientes marcadores de posición en el get_embedding.py archivo:

Ejecute el siguiente comando para recuperar las incrustaciones de la colección de incrustaciones generada.

Crear un archivo llamado stream_embedding.py.

Copia y pega el siguiente código en el archivo stream_embedding.py.

Reemplace los siguientes marcadores de posición en el stream_embedding.py archivo:

Ejecute el siguiente comando para transmitir incrustaciones desde la colección de incrustaciones generadas.

Solución de problemas

Conéctese a su implementación de MongoDB `mongosh` usando.

Conéctese a su implementación de MongoDB `mongosh` usando.

Conéctese a su implementación de MongoDB `mongosh` usando.

Ejecuta el comando en cada fragmento.`collStats`

Conéctese a su implementación de MongoDB `mongosh` usando.

Conéctese a su implementación de MongoDB `mongosh` usando.

Crear un archivo llamado `get_embedding.py`.

Copia y pega el siguiente código en el archivo `get_embedding.py`.

Reemplace los siguientes marcadores de posición en el `get_embedding.py` archivo:

Crear un archivo llamado `stream_embedding.py`.

Copia y pega el siguiente código en el archivo `stream_embedding.py`.

Reemplace los siguientes marcadores de posición en el `stream_embedding.py` archivo: