Make the MongoDB docs better! We value your opinion. Share your feedback for a chance to win $100.
Click here >
Docs Menu
Docs Home
/ /

Opciones de implementación de la Búsqueda de MongoDB

Puedes estructurar tu clúster con diferentes tipos de implementaciones, proveedores de nube y niveles de clúster para satisfacer las necesidades de un entorno de preproducción o producción. Utilice estas recomendaciones para seleccionar el tipo de implementación, el proveedor de nube y la región, así como los niveles de clúster y búsqueda para realizar una búsqueda vectorial.

Entorno
Tipo de implementación
Nivel de clúster
Región del Proveedor de la Nube
Arquitectura de nodo

Consultas de prueba

Flex or dedicated cluster

Local deployment
Free cluster, Flex, or higher tier

N/A
All


N/A

Los procesos de MongoDB y búsqueda se ejecutan en el mismo nodo

Prototipado de aplicaciones

Clúster dedicado, particionado o sin partición

M10, M20, o nivel superior

Todo

Los procesos de MongoDB y búsqueda se ejecutan en el mismo nodo

Producción

clúster dedicado con nodos de búsqueda separados, particionado o no particionado

M10 o nivel de clúster igual o superior y S20 o nivel de búsqueda igual o superior

AWS y Azure en algunos regiones or Google Cloud en todas las regiones

Los procesos de MongoDB y Search se ejecutan en diferentes nodos

Las siguientes secciones describen cada entorno:

Para probar tus consultas de búsqueda y prototipar tu aplicación, te recomendamos el tipo de implementación y la arquitectura de nodos que se describen en las siguientes secciones.

Esta configuración es la más adecuada para los siguientes casos de uso:

  • Menos de 2M de documentos totales para indexar

  • Menos de 10GB de datos indexados.

  • Menos de 10,000 consultas en un período de 7días

Si tu uso excede los valores listados, migra a nodos de búsqueda dedicados.

Las siguientes secciones describen esta arquitectura de nodo con más detalle.

Tipo de implementación

Para probar consultas de MongoDB Search en clústeres en la nube, puedes implementar un clúster Flex o un clúster dedicado.

To test MongoDB Search queries locally, create a local Atlas deployment using the Atlas CLI. This could be a single-node replica set hosted on your local computer. Local deployments are limited by the CPU, memory, and storage resources of your local machine. When your application is ready for production, migrate your local Atlas deployment to a production environment.

Cluster Tiers

Para probar sus consultas de MongoDB Search, use clústeres gratuitos (antes conocidos como M0) y clústeres flexibles.

For prototyping your application, use dedicated M10, M20, and higher tier clusters or deploy dedicated Search Nodes for workload isolation. When your application is ready for production and to handle large datasets, scale to higher tiers.

Proveedor de nube y región

Utiliza cualquier región de proveedor de nube compatible.

The cloud provider and region that you choose affect the configuration options available for the cluster tiers and the cost of running the cluster.

Para entornos de prueba y creación de prototipos, recomendamos una arquitectura de nodo en la que los procesos de MongoDB y los procesos de MongoDB Search se ejecuten en el mismo nodo. En el siguiente diagrama de este modelo de implementación, el proceso de MongoDB Search mongot se ejecuta junto con mongod en cada nodo del clúster de Atlas y comparten los mismos recursos.

Arquitectura de MongoDB Search

Por defecto, Atlas habilita el proceso MongoDB Search mongot en el mismo nodo que ejecuta el proceso mongod cuando creas tu primer índice MongoDB Search.

Cuando ejecutas una query, MongoDB Search utiliza la preferencia de lectura configurada para identificar el nodo en el que ejecutar la query. La query primero va al proceso de MongoDB, que es mongod para un clúster de conjunto de réplicas o mongos para un clúster particionado.

For a replica set cluster, the mongod process routes the query to the mongot on the same node. For sharded clusters, your cluster data is partitioned across mongod instances (shards) and each mongot process can only access the data on the mongod instance on the same node. Therefore, you can't run MongoDB Search queries that target a particular shard. mongos routes the query to all shards, making these scatter gather queries. If you use zones to distribute a sharded collection over a subset of the shards in the cluster, MongoDB Search routes the query to the zone that contains the shards for the collection that you are querying and runs your $search queries on just the shards where the collection is located.

Después de que la query se enrute a un proceso mongot de MongoDB Search, el proceso mongot realiza la búsqueda y la puntuación, y devuelve los ID de documentos y otros metadatos de búsqueda para los resultados de coincidencia a su proceso mongod correspondiente. El proceso mongod luego realiza una búsqueda completa de documentos de forma implícita para obtener los resultados coincidentes y devuelve los resultados al cliente. Si se usa la opción $search concurrente en la query, MongoDB Search permite el paralelismo intra-query. Para aprender más, se puede consultar Paralelización de la ejecución de queries entre segmentos.

Para obtener más información sobre el proceso de mongot, consulte Procesamiento de query.

Puede definir fuentes almacenadas campos en su índice de MongoDB Search para que el proceso mongot pueda almacenar los campos especificados en mongot. Luego puede utilizar la opción returnStoredSource en su consulta MongoDB Search para recuperar los campos almacenados para los documentos coincidentes directamente desde mongot en lugar de realizar una búsqueda completa de documentos en la base de datos.

Tip

Cuando activas MongoDB Search, puedes generar búsquedas fácilmente sobre tus datos con un motor de búsqueda integrado, totalmente gestionado y que se sincroniza automáticamente con tu base de datos. MongoDB Search ofrece un languaje del query robusto que utiliza etapas del pipeline de agregación de MongoDB Search como $search y $searchMeta para búsquedas de texto completo, y $vectorSearch para búsquedas semánticas junto con otras etapas del pipeline de agregación de MongoDB y clasificación de los resultados basada en puntuaciones.

Dependiendo de los recursos aprovisionados para tu clúster, implementar ambos procesos en el mismo nodo podría ser más rentable que ejecutar el proceso de búsqueda en un nodo dedicado por separado.

Puedes experimentar una contención de recursos entre la base de datos mongod y los procesos de búsqueda mongot. Esto podría afectar negativamente al rendimiento de su índice y a la latencia de sus consultas. Para admitir aplicaciones listas para producción y sus cargas de trabajo de búsqueda, migra a nodos de búsqueda dedicados.

No hay tarifas ni cargos adicionales por habilitar MongoDB Search en tu clúster. Sin embargo, podrías observar un aumento en la utilización de recursos en el clúster para grandes colecciones indexadas o definiciones de índices.

Puesto que los procesos mongod y mongot se ejecutan en el mismo nodo, es posible que mongot deje de estar disponible en determinadas circunstancias. En la siguiente tabla se describen las posibles causas:

Causa
Descripción

cluster Tier Scaling - Network Storage

Cuando escales un clúster hacia arriba o hacia abajo, Atlas aprovisiona una nueva instancia. Una vez que la instancia está lista, Atlas adjunta el almacenamiento de red e inicia mongod y mongot en los nuevos nodos.

Si mongod se inicia antes de mongot, las consultas de MongoDB Search fallan hasta que mongot esté en ejecución.

cluster Tier Scaling - Local SSD

Cuando escalas un clúster Atlas usando SSD local (SSD), no puedes conservar el almacenamiento y volver a adjuntarlo a los nuevos nodos. Por lo tanto, Atlas realiza una sincronización inicial para reconstruir los índices de búsqueda. Las consultas de búsqueda fallan hasta que se complete la sincronización inicial.

Downgrade de Lucene

En casos excepcionales en los que se requiere realizar un downgrade de Lucene, es posible que no se puedan leer los formatos de índice de Lucene más recientes.

Ajuste de almacenamiento

Se puede conservar el almacenamiento en red conectado a los nodos del clúster de Atlas. Esto le permite expandir o contraer la capacidad de volumen sin impacto en mongot.

Sin embargo, conservar el almacenamiento en red puede no ser posible en ciertas regiones, cuando el clúster utiliza discos locales NVMe, o en otras circunstancias poco frecuentes. En estos casos, Atlas realiza una sincronización inicial y las consultas de búsqueda fallan hasta que se complete la sincronización inicial.

mongot Actualización de versión

Durante una actualización de la versión mongot, Atlas detiene la versión anterior de mongot y pone en marcha la nueva versión. Durante este breve periodo, las consultas de búsqueda fallan hasta que el nuevo mongot está en funcionamiento.

Nuevo nodo mongod

Cuando añades un nuevo nodo a tu clúster, Atlas realiza una sincronización inicial para crear los índices de búsqueda. Las consultas de búsqueda que utilizan el nuevo nodo mongod fallan hasta que se complete la sincronización inicial.

Reinicio o reemplazo de instancia

  • Es posible que la instancia de Atlas se reinicie durante la implementación de una nueva política de seguridad o si el proveedor de nube lo requiere. Mientras Atlas se reinicia, si mongod empieza antes de mongot, las consultas de búsqueda fallan hasta que se ejecuta mongot.

  • Puede que tu instancia de Atlas requiera un reemplazo si tienes hardware en mal estado o si has migrado arquitecturas del sistema. Cuando se reemplaza la instancia, mongot realiza una sincronización inicial y las consultas de búsqueda fallan hasta que esta sincronización inicial se complete.

mongot Reiniciar

Cada vez que el proceso mongot se reinicia debido a cambios en la configuración, las consultas de búsqueda fallan hasta que mongot esté disponible.

Para su aplicación lista para producción, recomendamos utilizar el tipo de implementación y la arquitectura de nodos descritos en las siguientes secciones.

Esta configuración es la más adecuada para los siguientes casos de uso:

  • Si decides migrar tu entorno de pruebas existente a producción, agrega Search Nodes (nodos de búsqueda) exclusivos a tu clúster. Para obtener más información, consulta Migrar a nodos de búsqueda dedicados.

  • Si creas una nueva implementación de producción desde cero, asegúrate de utilizar M10 o clústeres de mayor nivel que sean compatibles con MongoDB Search en las regiones y zonas donde MongoDB Search está disponible, y añade Nodos de Búsqueda dedicados a tu entorno. Para obtener más información, consulte Agregar nodos de búsqueda dedicados.

Tipo de implementación

Para las aplicaciones listas para producción, utiliza M10, M20 y los niveles superiores de clústeres dedicados. Estos clústeres de nivel superior pueden gestionar grandes conjuntos de datos y cargas de trabajo de producción.

We recommend that you also deploy dedicated Search Nodes. If your search requirements increase, you can scale up your search deployment independently of scaling up the MongoDB nodes.

Proveedor de nube y región

Use Search Nodes in all Google Cloud regions and in a subset of AWS and Azure regions. You must select a cloud provider and region where Search Nodes are available for your deployment.

All cluster tiers are available in supported cloud provider regions. The cloud provider and region that you choose affect the configuration options and search tiers available for the cluster and the cost of running the cluster.

Para entornos de producción, recomendamos una arquitectura de nodos en la que los procesos de MongoDB y los procesos de MongoDB Search se ejecuten en nodos separados. Para implementar nodos de búsqueda separados, consulta Migrar a nodos de búsqueda dedicados.

En el siguiente diagrama de este modelo de despliegue, el proceso MongoDB Search mongot se ejecuta en nodos de búsqueda dedicados, que están separados de los nodos del clúster en los que se ejecuta el proceso mongod.

Arquitectura de nodos de búsqueda separados

Atlas implementa nodos de búsqueda con cada clúster o con cada partición en el clúster. Por ejemplo, si implementas dos nodos de búsqueda para un clúster con tres particiones, Atlas implementa seis nodos de búsqueda (dos por partición). También puedes configurar el número de nodos de búsqueda y la cantidad de recursos aprovisionados para cada nodo de búsqueda.

When you deploy separate Search Nodes, Atlas automatically assigns a mongod for each mongot for indexing. The mongot communicates with the mongod to listen for and sync index changes for the indexes that it stores. MongoDB Search indexes and processes your queries similar to a deployment where both the mongod and mongot processes run on the same node. To learn more, see Supported Clients and Queries and Indexes. To learn more about deploying Search Nodes separately, see Search Nodes for Workload Isolation.

Cuando se migra a Search Nodes, Atlas implementa los Search Nodes, pero no sirve queries en los nodos hasta que se compila exitosamente todos los índices en el clúster en los Search Nodes. Mientras Atlas construye los índices en los nuevos nodos, continúa sirviendo queries usando los índices en los nodos del clúster. Atlas comienza a atender queries desde los nodos de búsqueda sólo después de compilar correctamente los índices en los nodos de búsqueda y remover los índices en los nodos del clúster.

Nota

Scaling your cluster by adding search nodes or by changing the search tier triggers a rebuild of the full MongoDB Search index. However, if your cluster has dedicated search nodes for which you haven't enabled Encryption at Rest using Customer Key Management, Atlas provides the following optimizations:

  • When you scale your search nodes, Atlas uses a recent copy of your index in S3, Google Cloud Storage, or Azure Blob Storage instead of rebuilding the entire MongoDB Search index on the new node.

  • Para los nodos existentes, Atlas toma y carga periódicamente una nueva lista incremental de archivos de índice. Atlas conserva los archivos de índice durante un máximo de catorce (14) días.

Cuando ejecutas una query, esta se dirige a la mongod en base a la preferencia de lectura configurada. El proceso mongod enruta la consulta de búsqueda a través de un balanceador de carga en el mismo nodo, que distribuye las solicitudes a todos los procesos mongot.

El proceso de MongoDB Search mongot realiza la búsqueda y la puntuación, y devuelve los ID de los documentos y los metadatos de los resultados de las coincidencias a mongod. A continuación, mongod realiza una búsqueda en el documento completo para obtener resultados coincidentes y devuelve los resultados al cliente. Si se utiliza la opción $search concurrente en el query, MongoDB Search permite el paralelismo intra-query. Para aprender más, se puede consultar Paralelización de la ejecución de queries entre segmentos.

If you delete all the Search Nodes on your cluster, there will be an interruption in processing your search query results. To learn more, see Modify a Cluster. If you delete your Atlas cluster, Atlas pauses and then deletes all associated MongoDB Search deployments (mongot processes).

Puede definir fuentes almacenadas campos en su índice de MongoDB Search para que el proceso mongot pueda almacenar los campos especificados en mongot. Luego puede utilizar la opción returnStoredSource en su consulta MongoDB Search para recuperar los campos almacenados para los documentos coincidentes directamente desde mongot en lugar de realizar una búsqueda completa de documentos en la base de datos.

El despliegue de nodos de búsqueda separados proporciona los siguientes beneficios:

Alta disponibilidad
Cuando implementas nodos de búsqueda separados, Atlas aplica un mínimo de dos nodos de búsqueda para garantizar que tu carga de trabajo siga operativa, con un tiempo de inactividad mínimo, en caso de una falla o interrupción.
Escalabilidad

Cuando despliegue nodos de búsqueda por separado, puede escalar el almacenamiento y la computación independientemente de su clúster de MongoDB. Esto permite también escalar la carga de queries de forma independiente de MongoDB.

Para escalar los nodos de búsqueda horizontalmente, incrementa o reduce el número de nodos de búsqueda. Puedes provisionar desde un mínimo de 2 hasta un máximo de 32 nodos de búsqueda. Para equilibrar la carga de consultas, MongoDB Search distribuye las consultas de búsqueda entre todos los nodos de búsqueda disponibles.

Para escalar verticalmente los Nodos de Búsqueda, seleccione diferentes niveles de búsqueda, configuraciones de CPU, RAM y almacenamiento que admitan sus cargas de trabajo de texto completo.

Rendimiento

Cuando implementas nodos de búsqueda dedicados, mejoras el rendimiento y la utilización de recursos tanto para los procesos mongod como mongot, y eliminas la competencia de recursos entre estos procesos.

Los nodos de búsqueda dedicados admiten búsqueda de segmentos concurrentes, lo que permite a MongoDB Search buscar varios segmentos de índices al mismo tiempo. El uso de una búsqueda de segmentos concurrentes mejora el tiempo de respuesta de las consultas en algunos casos.

Aislamiento de cargas de trabajo
La implementación de nodos de búsqueda dedicados no afecta directamente la transferencia de datos a los nodos principales de la base de datos. Los Nodos de Búsqueda gestionan las consultas de búsqueda por separado de las operaciones principales de la base de datos, proporcionando aislamiento de la carga de trabajo mientras solo incurres en cargos de red para el tráfico entre los Nodos de Búsqueda y los nodos de la base de datos.

Para determinar los requisitos de memoria para Search nodos, utiliza las siguientes métricas de Atlas:

  • Tamaño del índice de búsqueda

  • Memoria RAM total en el nodo de búsqueda

Considere una aplicación que tenga un 10GB de Índice de Búsqueda y 4GB de RAM total en el Nodo de Búsqueda. En este caso, si 1GB de RAM son utilizados por otros procesos y solo 3GB están disponibles para los datos del índice, el resto de 7GB de los datos del índice (10GB- 3GB = 7GB) se carga según sea necesario desde el disco. La paginación frecuente desde disco causa un aumento de fallos de página, operaciones de E/S en disco y IOWait de CPU, lo que resulta en una degradación del rendimiento.

Si utiliza un nivel de clúster de búsqueda superior con más RAM, como 8GB o más, esto permite que Atlas sirva la mayor parte de los datos para el índice de búsqueda desde la memoria, minimizando las lecturas en disco y los errores de página, mejorando así el rendimiento.

Nota

Las SSDlocales usadas para los nodos de búsqueda requieren un 20% de almacenamiento adicional para soportar las operaciones del índice.

MongoDB supports separate Search Nodes on dedicated (M10 or higher) clusters. Search Nodes are deployed on compute-intensive instances with high-performance local storage. You must deploy a minimum of two nodes. You will be billed daily for hourly resource usage per node. To learn more, see Search Node Costs.

Por defecto, MongoDB y los procesos de búsqueda se ejecutan en los mismos nodos. Con esta arquitectura, el cifrado gestionado por el cliente se aplica a los datos de su base de datos, pero no se aplica a los índices de búsqueda.

Cuando se habilita nodos de búsqueda dedicados, los procesos de búsqueda se ejecutan en nodos separados. Esto te permite activar Cifrado de datos de nodo de búsqueda, así puedes cifrar tanto los datos de la base de datos como los índices de búsqueda con las mismas claves gestionadas por el cliente para una cobertura de cifrado integral.

Nota

Los nodos de la base de datos y los nodos de búsqueda utilizan diferentes métodos de cifrado con las mismas claves gestionadas por el cliente. Los nodos de la base de datos usan el motor de almacenamiento cifrado WiredTiger, mientras que los nodos de búsqueda usan cifrado a nivel de disco.

Para obtener más información, consulta Permitir la gestión de claves de cliente para los nodos de búsqueda.

Importante

Esta característica está disponible en todos los proveedores de KMS, pero los Nodos de búsqueda deben estar en AWS.

Agregar nodos de búsqueda dedicados a un nuevo clúster permite:

  • Change the size and scale of your search deployment independently from your database deployment.

  • Elimina la competencia por recursos que puedas experimentar en un clúster que ejecuta tanto la base de datos MongoDB como los procesos de búsqueda en el mismo nodo.

Para agregar nodos de búsqueda dedicados:

  1. Create your cluster as an M10 or higher tier in a cloud provider and region that supports node isolation. To learn more, see Create a Cluster.

    Dedicated Search Nodes are supported only for M10 and higher cluster tiers and in cloud provider regions that support node isolation.

  2. Activar Search Nodes for workload isolation and Configure Search Nodes.

Para migrar del entorno de staging a producción y agregar nodos de búsqueda dedicados, realiza los siguientes cambios en tu implementación actual de staging y prototipado:

  1. If your deployment uses a Flex cluster, change the cluster tier to a higher tier. Dedicated Search Nodes are supported only for M10 and higher cluster tiers.

  2. Deploy your cluster in regions where Search Nodes are also available. Dedicated Search Nodes are available on a subset of the AWS and Azure regions and in all supported Google Cloud regions. If your existing cluster is hosted in regions where Search Nodes aren't available, migrate your cluster to regions where Search Nodes are available. To learn more, see Cloud Provider Regions that Support Node Isolation.

  3. Habilita Search Nodes for workload isolation y configura nodos de búsqueda. Para obtener más información, consulta Agregar nodos de búsqueda.

    Cuando se implementan nodos de búsqueda dedicados, ocurre la siguiente secuencia de acciones:

    • Atlas compila los índices de búsqueda en los Search Nodes y remueve los índices de los nodos del clúster.

    • Atlas enruta las consultas de búsqueda a los nodos de búsqueda.

    • MongoDB Search utiliza los índices de búsqueda para servir queries en el clúster.

Si implementas mongot para ejecutarlo junto con mongod y no configuras nodos de búsqueda, es posible que mongot finalice y devuelva el error Failed to Execute search Command durante cualquiera de los siguientes eventos:

  • Escalado de un clúster

  • Failover de nodo

  • Actualización mongot

Si se implementa mongot en nodos de búsqueda dedicados, mongod utiliza un proxy que dirige las consultas de búsqueda solo a los nodos saludables donde el proceso mongot está activo.

Volver

Queries

En esta página