Puedes revisar las siguientes métricas para supervisar tus clústeres. Todas las métricas de hardware incluyen métricas o gráficas individuales para los valores máximos.
Importante
Las métricas disponibles dependen de tu rol de usuario y del tipo de clúster.
Métrica | Descripción |
|---|---|
Asserts | Muestra la siguiente información:
Supervisa las aserciones para rastrear cuántos errores ocurren al intentar leer o guardar datos. Revisa los registros del servidor para identificar la fuente de cualquier error. |
Avg Object Size | Muestra el tamaño promedio de los objetos en todas las colecciones de la base de datos. Supervisa el tamaño de los objetos para rastrear su tamaño y entender mejor el espacio de tu base de datos. |
Cache Activity | Muestra la siguiente información:
Supervisa la caché de MongoDB, que almacena los datos a los que se accede con frecuencia en la memoria para atender las query más rápido. |
Cache Ratio | Muestra las métricas de la tasa de llenado de caché y de la tasa de llenado sucio. La relación de llenado de caché mide qué tan bien una caché puede servir las solicitudes. Se calcula dividiendo la cantidad de bytes que se encuentran actualmente en la caché por la cantidad máxima de bytes configurados, representada como un porcentaje. Una relación de llenado de caché alta indica que la mayoría de las solicitudes de datos se sirven desde la memoria, lo que lleva a un rendimiento más rápido de las query y a una reducción de E/S de disco. La relación de relleno sucio representa la proporción de bytes sucios (que son páginas modificadas en la memoria pero que aún no se han escrito en el disco) en relación con la caché total. Una tasa de relleno sucio alta sugiere que una cantidad significativa de datos está esperando a ser vaciada en el disco, lo que puede tener un impacto en el rendimiento. Usa esta métrica al realizar la supervisión de cargas de trabajo con mucha escritura para garantizar la durabilidad de los datos. |
Cache Usage | Muestra la siguiente información:
Estas métricas incluyen tanto índices como datos del conjunto de trabajo. Un uso sostenido y alto de caché indica que la RAM es demasiado pequeña para las cargas de trabajo. Optimiza las query para evitar lecturas frecuentes de disco. Si las operaciones de escritura aumentan el uso de la caché, limítalas. |
Catalog | Muestra la siguiente información:
Supervise los recuentos de catálogos para evitar que una cantidad excesiva de bases de datos, colecciones, vistas, índices o espacios de nombres provoquen errores de inicio cuando escala un nivel de clúster. |
Collections | Muestra el número de colecciones de la base de datos. Supervisa las colecciones para determinar los tiempos de reinicio, el rendimiento continuo de las copias de seguridad y la estabilidad. |
Connections (set de réplicas) o connection (clúster) | Muestra el número total de conexiones activas al clúster. Supervise las conexiones para determinar si los límites de conexión actuales son suficientes. Si es necesario, escale el nivel del clúster. |
Cursors | Muestra la siguiente información:
Supervisa los cursores para cerrar los cursores innecesarios y reducir la configuración del tiempo de espera en tu aplicación. |
DB Storage | Muestra la siguiente información:
Atlas recupera las métricas de la base de datos cada 20 minutos por defecto, pero ajusta la frecuencia cuando es necesario para reducir el impacto en el rendimiento de la base de datos. Supervise el espacio de almacenamiento para determinar si usar el escalado automático del disco o aumentar manualmente el tamaño del disco. También puede supervisar esta métrica para verificar la facturación de la copia de seguridad. |
Disk IOPS | Muestra las operaciones de entrada por segundo. Supervisar si las IOPS del disco se acercan al máximo aprovisionamiento de IOPS. Determinar si el clúster puede gestionar cargas de trabajo futuras. |
Disk Latency | Muestra la siguiente información:
Supervisa la latencia del disco para rastrear la eficiencia de leer y escribir en el disco. |
Disk Queue Depth | Muestra la longitud promedio de la cola de solicitudes enviadas a la partición de disco que utiliza MongoDB. Supervisa la profundidad de la cola del disco para identificar posibles problemas y cuellos de botella. |
Disk Space Free | Muestra la cantidad total de espacio libre que queda en el disco. Supervisa el espacio libre en disco para determinar si debes utilizar el escalado automático del disco o aumentar manualmente el tamaño del disco. NotaLa interfaz de usuario muestra GB, pero todas las métricas de uso del disco están en gibibytes (GiB). |
Disk Space Percent Free | Muestra la cantidad total de espacio libre restante en el disco como un porcentaje del espacio total en disco. Supervisa el porcentaje de espacio libre en disco para determinar si usar el escalado automático del disco o aumentar manualmente el tamaño del disco. |
Disk Space Used | Muestra el espacio total utilizado en disco. Supervisa el espacio en disco utilizado para determinar si debes utilizar el escalado automático del disco o aumentar manualmente el tamaño del disco. Si Atlas identifica que el nodo principal de su clúster excede Umbrales de política de bloqueo de escritura: Atlas bloquea las escrituras en el clúster hasta que la utilización del disco cae por debajo de los umbrales de desbloqueo. NotaLa interfaz de usuario muestra GB, pero todas las métricas de espacio en disco están en gibibytes (GiB). |
Disk Throughput | Muestra las métricas de rendimiento de lectura y de escritura del disco. El rendimiento de lectura del disco refleja la velocidad a la que se leen los datos del disco en Megabytes por segundo, lo que indica la eficacia con la que la base de datos recupera los datos que no están almacenados en la memoria caché. El rendimiento de guardar en disco mide la velocidad a la que se guardan los datos en el disco en Megabytes por segundo, lo que refleja la capacidad de la base de datos para gestionar las operaciones de guardar y persistir los datos en el almacenamiento de forma eficiente. |
Document Metrics | Muestra la siguiente información:
Supervisa las métricas de documentos para medir el trabajo que completa MongoDB. |
Execution Time | Muestra el tiempo medio en segundos de las siguientes métricas:
Supervisa el tiempo de ejecución ante un aumento en las operaciones de lectura para optimizar las query y los índices. |
Index Size | Muestra el tamaño total de todos los índices de la base de datos. Esta métrica incluye los gastos en general en que incurren los índices, además de los datos reales de los documentos en los que se basan los índices. Supervisa el tamaño del índice para gestionar tus índices. Para aprender más, consulta Estrategias de indexación. |
Indexes | Muestra el número total de índices en la base de datos. Supervisa los índices para gestionarlos. Para aprender más, consulta Estrategias de indexación. |
Max Disk IOPS | Muestra los siguientes valores de IOPS máximas de disco durante el período de tiempo especificado por la granularidad de la métrica:
Supervisar si las IOPS del disco se acercan al máximo aprovisionamiento de IOPS. Determinar si el clúster puede gestionar cargas de trabajo futuras. |
Max Disk Queue Depth | Muestra los valores máximos de profundidad de la cola de disco durante el periodo especificado por la granularidad de la métrica. La profundidad de la cola de disco es la longitud promedio de la cola de solicitudes emitidas a la partición de disco que utiliza MongoDB. Supervisa la profundidad de la cola del disco para identificar posibles problemas y cuellos de botella. |
Max Normalized System CPU | Muestra los valores de uso máximo de CPU de todos los procesos en el nodo, escalados a un rango de 0-100 % dividido por el número de núcleos de CPU. Supervise el uso de la CPU para determinar si es necesario escalar a un nivel de clúster superior. Si no puedes ver el uso que activó la alerta, amplía la gráfica de Normalized System CPU al hacer clic y arrastrar el ratón sobre el período de interés. Con una vista de mayor resolución, puedes identificar picos agudos en el uso de la CPU que no se veían en la visión general. |
Max Process CPU | Muestra los siguientes valores máximos de CPU de proceso durante el período de tiempo especificado por la granularidad de la métrica:
Supervise el uso de la CPU para determinar si es necesario escalar a un nivel de clúster superior. Si no puedes ver el uso que activó la alerta, amplía la gráfica de Normalized System CPU al hacer clic y arrastrar el ratón sobre el período de interés. Con una vista de mayor resolución, puedes identificar picos agudos en el uso de la CPU que no se veían en la visión general. |
Max System CPU | Muestra los valores de uso máximo de CPU de todos los procesos en el nodo. Supervise el uso de la CPU para determinar si es necesario escalar a un nivel de clúster superior. Si no puedes ver el uso que activó la alerta, amplía la gráfica de Normalized System CPU al hacer clic y arrastrar el ratón sobre el período de interés. Con una vista de mayor resolución, puedes identificar picos agudos en el uso de la CPU que no se veían en la visión general. |
Max System Memory | Muestra los valores máximos de memoria del sistema en bytes. Monitorear la memoria para determinar si es necesario escalar a un nivel de clúster superior. Esta métrica se basa en |
Memory | Muestra la cantidad de memoria en uso en un punto determinado, medida en megabytes.
Monitoree la memoria para determinar si es necesario escalar a un nivel de clúster superior. Esta métrica representa el valor promedio durante el período especificado por la granularidad de la métrica. |
Network | Muestra la siguiente información:
|
Normalized Process CPU | Muestra la siguiente información:
Supervise el uso de la CPU para determinar si es necesario escalar a un nivel de clúster superior. Si no puedes ver el uso que activó la alerta, amplía la gráfica de Normalized System CPU al hacer clic y arrastrar el ratón sobre el período de interés. Con una vista de mayor resolución, puedes identificar picos agudos en el uso de la CPU que no se veían en la visión general. |
Normalized System CPU | Muestra el uso de CPU de todos los procesos en el nodo, escalado a un rango de 0–100 % mediante la división por la cantidad de núcleos de CPU. Supervise el uso de la CPU para determinar si es necesario escalar a un nivel de clúster superior. Si no puedes ver el uso que activó la alerta, amplía la gráfica de Normalized System CPU al hacer clic y arrastrar el ratón sobre el período de interés. Con una vista de mayor resolución, puedes identificar picos agudos en el uso de la CPU que no se veían en la visión general. |
Objects | Muestra el número de objetos en la base de datos. Supervisa esta métrica para comprender mejor el espacio de tu base de datos. |
Opcounters | Muestra el número de las siguientes operaciones por segundo ejecutadas en un proceso de MongoDB desde la última vez que se inició el proceso:
Supervisa las operaciones de MongoDB para validar problemas de rendimiento relacionados con grandes cargas de trabajo. Confirma el tipo de operaciones responsables de la carga. |
Opcounters - Repl | Muestra la siguiente información:
Supervisa las operaciones de MongoDB para validar problemas de rendimiento relacionados con grandes cargas de trabajo. Confirma el tipo de operaciones responsables de la carga. |
Operation Execution Time | Muestra el tiempo promedio en milisegundos para ejecutar las siguientes operaciones:
Monitoree el tiempo de ejecución para detectar un aumento en las operaciones de lectura y optimizar las consultas y los índices. Determine si necesita escalar su nivel de clúster. |
Oplog GB/Hour | Muestra la tasa media de los datos oplog sin comprimir en gigabytes que el primario genera por hora. Supervise los datos del oplog para determinar si debe aumentar el tamaño del oplog. |
Orphan Count | Número de documentos huérfanos en la partición. |
Orphan Data Size | Tamaño en bytes de los documentos huérfanos en la partición cuando no están comprimidos. |
Page Faults | Muestra la tasa promedio de fallas de página en este proceso por segundo durante el período de muestra seleccionado. En entornos que no sean Windows, esto se aplica únicamente a los fallos de página graves. Supervisa los errores de página para determinar si debes aumentar tu memoria. |
Process CPU | Muestra la siguiente información:
Supervise el uso de la CPU para determinar si es necesario escalar a un nivel de clúster superior. Si no puedes ver el uso que activó la alerta, amplía la gráfica de Normalized System CPU al hacer clic y arrastrar el ratón sobre el período de interés. Con una vista de mayor resolución, puedes identificar picos agudos en el uso de la CPU que no se veían en la visión general. |
Query Executor | Muestra la siguiente información:
Supervisa el ejecutor de query para determinar si tienes alguna query ineficiente. |
Query Targeting | Muestra la eficiencia de las operaciones de lectura ejecutadas en MongoDB:
Supervisa la segmentación de las query para determinar la eficiencia de lectura y optimizar las query y los índices. Los cursores de flujos de cambios que el proceso de búsqueda de MongoDB ( |
Queues | Muestra la siguiente información:
Supervisa las colas de bloqueo para optimizar las query. |
Read/Write Units | Muestra la siguiente información:
Supervisa las unidades de lectura y escritura para optimizar las query y los índices. |
Replication Headroom | Muestra la diferencia entre la oplog window de replicación del primario y el atraso de la replicación del secundario. Supervisa el margen de replicación para determinar si el secundario podría quedar fuera del oplog. Atlas recopila estos datos en intervalos de 85 segundos, independientemente del nivel de granularidad por defecto del proyecto. |
Replication Lag | Muestra el número aproximado de segundos que el secundario está retrasado con respecto al primario en la aplicación de escritura. Supervisa el atraso de la replicación para determinar si el secundario podría caerse del oplog. Atlas recopila estos datos en intervalos de 85 segundos, independientemente del nivel de granularidad por defecto del proyecto. |
Replication Oplog Window | Muestra el número medio estimado de horas de operaciones de base de datos disponibles en el oplog de replicación del primario, basado en la rotación del oplog. Si el atraso de la replicación en un nodo secundario excede la oplog window de replicación, y el espacio de la replicación llega a cero, se requiere una resincronización completa para que ese nodo vuelva a estar saludable. Supervisa el oplog window, junto con el margen de replicación, para determinar si el secundario puede necesitar pronto una resincronización completa. La oplog window de replicación suele ayudar a determinar de antemano la resiliencia de las secundarias ante interrupciones del servicio planificadas e imprevistas. |
Scan and Order | Muestra el número de operaciones por segundo que devuelven resultados que requirieron una ordenación en memoria. Supervisa esta métrica para identificar si tus query necesitan índices. |
Shard Data Size | Muestra la cantidad de espacio de almacenamiento en bytes que tus datos almacenados utilizan en cada partición. Supervisa esta métrica para verificar si tienes particiones equilibradas. |
Shard Document Count | Muestra el número de documentos en cada partición. Supervisa esta métrica para verificar si tienes particiones equilibradas. |
Sort | Muestra spill to disk during sort, el número total de escrituras en disco causadas por Un número alto de spill to disk during sort puede deberse a las query que consumen muchos recursos y que realizan un escaneo de colección y utilizan una etapa |
System CPU | Muestra el uso de la CPU de todos los procesos en el nodo. Supervise el uso de la CPU para determinar si es necesario escalar a un nivel de clúster superior. Si no puedes ver el uso que activó la alerta, amplía la gráfica de Normalized System CPU al hacer clic y arrastrar el ratón sobre el período de interés. Con una vista de mayor resolución, puedes identificar picos agudos en el uso de la CPU que no se veían en la visión general. |
System Memory | Muestra la siguiente información:
Monitoree la memoria para determinar si es necesario escalar a un nivel de clúster superior. Esta métrica representa el valor promedio durante el período especificado por la granularidad de la métrica. |
System Network | Muestra la siguiente información:
Supervise las métricas de red para rastrear el rendimiento de la red. |
Tickets Available | Muestra la siguiente información:
Supervisa los tickets disponibles para ver cuándo hay solicitudes de lectura y escritura en cola. Para los clústeres que utilizan la versión 7.0 de MongoDB y posteriores, no utilices el número de tickets como métrica para las alertas de sobrecarga. A partir de la versión 7.0 de MongoDB, Atlas ajusta dinámicamente el número de tickets. En su lugar, utiliza la cantidad de lectores y escritores en cola como una métrica de sobrecarga. |
Views | Muestra el número de vistas de la base de datos. Supervisa las vistas para optimizar tu base de datos. |