Puedes configurar Atlas para enviar métricas sobre tu proyecto a tus tableros de Datadog.
Nota
Si se configura el proyecto Atlas para enviar alertas y eventos a Datadog, no es necesario que siga este procedimiento. Atlas envía métricas de proyectos a Datadog mediante la misma integración que se usa para enviar alertas y eventos.
También puedes configurar Datadog para recibir alertas de Atlas. Para obtener más información, consulta Opciones de notificación.
Acceso requerido
Para integrar Atlas con Datadog, debes tener Project Owner acceso al proyecto. Los usuarios con acceso Organization Owner deben agregarse al proyecto como Project Owner.
Requisitos previos
La integración Datadog está disponible únicamente en clústeres M10+.
Para integrar Atlas con Datadog, debes tener una cuenta de Datadog y una clave API de Datadog. Datadog te otorga una clave API al crear tu cuenta de Datadog.
Si no tienes una cuenta existente de Datadog, puedes registrarte en https://app.datadoghq.com/signup.
Procedimiento
Para crear o actualizar una integración de Datadog usando la Atlas CLI, ejecuta el siguiente comando:
atlas integrations create DATADOG [options]
Para obtener más información sobre la sintaxis del comando y los parámetros, consulte la documentación de Atlas CLI para atlas integrations create DATADOG.
Para configurar una integración de Atlas con Datadog usando la Interfaz de Usuario de Atlas:
En Atlas, diríjase a la página Project Settings.
Si aún no se muestra, seleccione la organización que contiene su proyecto deseado en el menú Organizations de la barra de navegación.
Si aún no aparece, selecciona el proyecto deseado en el menú Projects de la barra de navegación.
En la barra lateral, haz clic en el icono junto a Project Overview.
La página Configuración del proyecto se muestra.
En Atlas, diríjase a la página Project Integrations.
Haz clic en la pestaña Integrations.
La página de Integraciones del proyecto se muestra.
Vincula Datadog a tu proyecto utilizando tu clave API de Datadog.
Haz clic en Configure para la tarjeta de integración de Datadog.
Introduce tu clave API de Datadog en el cuadro de entrada.
Selecciona tu región de la API.
Atlas admite las siguientes regiones de Datadog en la interfaz de usuario de Atlas:
US1US3US5EU1AP1
Datadog utiliza
US1por defecto.Para aprender más sobre las regiones de Datadog, se puede consultar Sitios de Datadog.
(Opcional) Para habilitar el seguimiento de métricas de la base de datos, se debe activar Send Database Metrics a On.
(Opcional) Para activar el seguimiento de métricas de latencia de la colección, cambiar Send Collection Latency Metrics a On.
(Opcional) Para activar el seguimiento de métricas de forma del query, cambiar Send Query Shape Metrics a On.
Haga clic en Save.
Métricas de rendimiento disponibles para Datadog
Datadog rastrea las siguientes métricas para tu clúster Atlas. Los nombres de métricas entre paréntesis son los nombres utilizados en la Interfaz de Usuario de DataDog.
Importante
Por defecto, Datadog no hace un seguimiento de los datos métricos de alta cardinalidad. Para habilitar el seguimiento de estas métricas, debes especificar los siguientes ajustes:
sendDatabaseMetrics: Realiza un seguimiento de las métricas de la base de datos, incluidos los nombres de bases de datos, números de colecciones, tamaño de almacenamiento y tamaño de índices. Estas métricas tienen nombres que comienzan conmongodb.atlas.dbstats.sendCollectionLatencyMetrics: Realiza un seguimiento de las métricas de latencia de la colección, incluidos los nombres de las bases de datos, los nombres de las colecciones y la información sobre la latencia de los comandos, las operaciones y las transacciones. Estas métricas tienen nombres con el prefijomongodb.atlas.latencyStats.sendQueryShapeMetricsSupervisar las métricas de la forma del query, incluyendo el tiempo de ejecución y el recuento, las claves y los documentos examinados y devueltos, y el tiempo de respuesta. Estas métricas tienen nombres con el prefijomongodb.atlas.querystats.
Active estos ajustes utilizando un punto de conexión de la Atlas Administration API o a través de la interfaz de Atlas.
Nombres de métricas | Tipo de métrica | Descripción |
|---|---|---|
| Proceso | Número de conexiones abiertas actualmente en el clúster. |
| Proceso | Número de conexiones activas de clientes al servidor de bases de datos. Las conexiones activas son las que actualmente realizan operaciones. |
| Proceso | Tasa de conexiones totales por segundo establecidas al servidor de base de datos. |
| Proceso | Tasa a la que se añaden nuevas solicitudes de conexión a la cola de establecimiento de sesiones de entrada. |
| Proceso | Tasa a la que se eliminan las solicitudes de conexión de la cola de establecimiento de sesión de entrada. |
| Proceso | Tasa a la que se rechazan las solicitudes de conexión debido al limitador de velocidad de establecimiento de sesiones de ingreso. Un valor distinto de cero indica que el limitador de tasa está rechazando activamente nuevas conexiones debido a la carga. |
| Proceso | Tasa a la que las solicitudes de conexión pasan exitosamente por el limitador de tasa de establecimiento de sesión de entrada y son admitidas. |
| Proceso | Tasa por segundo a la que se interrumpen las solicitudes de conexión mientras esperan en la cola de establecimiento de sesión de entrada, como en el caso de un tiempo de espera o cancelación. |
| Proceso | Tamaño total de almacenamiento de la base de datos, tamaño de los datos y tamaño de los índices en el clúster, en bytes. |
| Disk | Indicador de latencia en milisegundos para solicitudes de lectura y escritura. |
| Disk | Indicador de latencia máxima en milisegundos para las solicitudes de lectura y guardado. |
| Disk | Longitud promedio de la cola de solicitudes enviadas a la partición de disco que MongoDB utiliza durante el período de tiempo especificado por la granularidad de métrica. |
| Disk | Valores máximos durante el período de tiempo especificado por la granularidad de las métricas para la longitud promedio de la cola de solicitudes emitidas a la partición de disco que utiliza MongoDB. |
| Proceso | Número de documentos leídos o escritos por segundo. |
| Proceso | Tasa promedio de bytes físicos (tras cualquier compresión de transmisión) enviados al servidor de la base de datos por segundo. |
| Proceso | Tasa promedio de bytes físicos (después de cualquier compresión en la red) enviados desde el servidor de la base de datos por segundo. |
| Proceso | Tasa promedio de solicitudes enviadas al servidor de base de datos por segundo. |
| Proceso | Número de operaciones por segundo, separadas por tipo de operación. |
| Proceso | Tasa de documentos eliminados por segundo por el monitor de índice TTL (Time-To-Live/tiempo de vida útil). Rastrea la limpieza automática de documentos expirados. |
| Proceso | Número de transacciones actualmente activas (operaciones ejecutando un comando) en este servidor. Disponible tanto en las instancias |
| Proceso | Número de transacciones abiertas actualmente (activas + inactivas) en este servidor. Disponible tanto en las instancias |
| Proceso | Tasa por segundo de transacciones iniciadas en este servidor. Disponible tanto en las instancias |
| Proceso | Tasa por segundo de transacciones abortadas en este servidor. Disponible tanto en las instancias |
| Proceso | Tasa por segundo de transacciones confirmadas en este servidor. Disponible tanto en las instancias |
| Proceso | Tasa por segundo de transacciones que han ingresado al estado preparado en este servidor. Indica la participación en transacciones de dos fases con compromiso en múltiples particiones. Disponible sólo en |
| Proceso | Tasa por segundo a la que se inician las transacciones de compromiso en dos fases entre particiones. Un valor diferente de cero indica la presencia de transacciones de escritura de múltiples particiones. Disponible sólo en |
| Proceso | Tasa por segundo a la que se comprometen correctamente las transacciones de compromiso en dos fases entre particiones. Disponible solo en |
| Proceso | Tiempo promedio de operación en milisegundos, separado por tipo de operación. |
| Contador | Número de bytes leídos por la forma del query dada del disco a la caché. |
| Medidor | Proporción de documentos examinados respecto a documentos devueltos por consultas con la forma del query dada. |
| Contador | Número total de documentos examinados por queries con la forma del query dada. |
| Contador | Número total de documentos devueltos por queries con la forma del query dada. |
| Contador | Número total de veces que se han ejecutado queries con la forma del query dada. |
| Medidor | Proporción entre las claves índice dentro y fuera de los límites examinadas y los índices que contienen documentos devueltos por queries con la forma del query dada. |
| Contador | Número total de claves de índice dentro y fuera de los límites examinadas por queries con la forma del query dada. |
| Medidor | Tiempo de ejecución en microsegundos para el query más reciente con la forma del query dada. |
| Contador | Tiempo en microsegundos transcurrido desde el comienzo del procesamiento de la query hasta la primera respuesta del servidor. |
| Contador | Tiempo total en milisegundos dedicado a la ejecución de queries con la forma del query dada. Si la query produjo |
| Proceso | Proporción que mide el número de objetos escaneados sobre los objetos devueltos. Los valores más bajos indican queries más eficientes. |
| Proceso | Número de cursores abiertos actualmente que apuntan a una sola partición. Disponible solo en |
| Proceso | Número de cursores actualmente abiertos que apuntan a múltiples particiones (cursores dispersos y recogidos). Disponible solo en |
| Proceso | La cantidad total de escrituras en disco causadas por |
| Proceso | Tasa por segundo de operaciones de búsqueda que tuvieron como objetivo todas las particiones. Disponible solo en |
| Proceso | Tasa por segundo de operaciones de búsqueda que se dirigieron a más de una, pero no a todas las particiones. Disponible solo en |
| Proceso | Tasa por segundo de operaciones de búsqueda que se dirigieron exactamente a una partición. Disponible únicamente en |
| Proceso | Tasa por segundo de operaciones de búsqueda en colecciones no particionadas. Disponible solo en las instancias |
| Proceso | Tasa por segundo de operaciones de inserción que se dirigieron a todas las particiones. Disponible solo en |
| Proceso | Tasa por segundo de operaciones de inserción que se dirigieron a más de una partición pero no a todas las particiones. Disponible solo en |
| Proceso | Tasa por segundo de las operaciones de inserción que se dirigieron exactamente a una partición. Disponible solo en |
| Proceso | Tasa por segundo de operaciones de inserción en colecciones que no están compartidas. Disponible solo en |
| Proceso | Tasa por segundo de operaciones de actualización que apuntan a todas las particiones. Disponible solo en |
| Proceso | Tasa por segundo de operaciones de actualización que se dirigieron a más de una pero no a todas las particiones. Disponible solo en |
| Proceso | Tasa por segundo de operaciones de actualización que tuvo como objetivo exactamente una partición. Disponible solo en |
| Proceso | Tasa por segundo de operaciones de actualización en colecciones no fragmentadas. Disponible únicamente en |
| Proceso | Tasa por segundo de operaciones de eliminación que se dirigieron a todas las particiones. Disponible solo en |
| Proceso | Tasa por segundo de operaciones de borrado que se dirigieron a más de una partición pero no a todas. Disponible solo en |
| Proceso | Tasa por segundo de operaciones de eliminación que se dirigieron exactamente a una partición. Disponible solo en |
| Proceso | Tasa por segundo de operaciones de borrado en colecciones no particionadas. Disponible solo en |
| Proceso | Tasa por segundo de operaciones agregadas que se dirigieron a todas las particiones. Disponible solo en |
| Proceso | Tasa por segundo de operaciones agregadas que se dirigieron a más de una pero no a todas las particiones. Disponible solo en |
| Proceso | Tasa por segundo de operaciones globales que apuntaban exactamente a una partición. Disponible solo en |
| Proceso | Tasa por segundo de operaciones agregadas en colecciones no distribuidas. Disponible solo en |
| Proceso | Cantidad de tiempo en segundos que las actualizaciones del retardo secundario detrás de las actualizaciones del primario. |
| Proceso | Número promedio estimado, en segundos, de operaciones de base de datos disponibles en el oplog de replicación del principal. Esta métrica se basa en la rotación del registro de operaciones (oplog). Se requiere una resincronización completa si el atraso de la replicación en un nodo secundario supera la oplog window y el margen de replicación llega a cero. |
| Proceso | Número que indica la salud de un miembro del set de réplicas. Un valor de Puede que veas un estado de salud inexacto en los siguientes escenarios:
IMPORTANTE: Si el estado de salud es |
| Proceso | Número entero comprendido entre |
| Sistema | Indicador que muestra la memoria física utilizada, en kilobytes. |
| Sistema | Indicador que señala la máxima memoria física utilizada, en kilobytes. |
| Sistema | Porcentaje del tiempo utilizado por las CPU lógicas en varios procesos para el servidor. Estos valores se normalizan con respecto al número de núcleos lógicos de CPU. |
| Sistema | Valores máximos durante el periodo de tiempo especificado por la granularidad de la métrica para el porcentaje de tiempo utilizado por las CPU lógicas en varios procesos del servidor. Estos valores se normalizan respecto al número de núcleos lógicos de CPU. |
| Proceso | Porcentaje de tiempo utilizado por las CPUs lógicas en varios procesos específicos del proceso MongoDB en el servidor. Estos valores se normalizan con respecto al número de núcleos lógicos de CPU. |
| Proceso | Valores máximos durante el periodo de tiempo especificado por la granularidad de la métrica para el porcentaje de tiempo utilizado por las CPU lógicas en varios procesos específicos del proceso de MongoDB en el servidor. Estos valores se normalizan con respecto al número de núcleos lógicos de CPU. |
| Proceso | Memoria (en |
| Proceso | Tasa por segundo de guardados totales en las colecciones de perfil en todas las bases de datos. Disponible solo en |
| Proceso | Número instantáneo de operaciones que actualmente se escriben en una colección de perfiles en todas las bases de datos. Disponible solo en |
| Proceso | Número total de colecciones system.profile que existen en todas las bases de datos de este servidor. Disponible solo en |
| Proceso | Tasa por segundo de cursores no persistentes abiertos en una colección de perfil. Disponible en MongoDB 8.0 y 8.1 solo en |
| Proceso | Tasa por segundo de cursores con seguimiento abiertos en una colección de perfiles. Disponible en MongoDB 8.0 y 8.1 solo en |
| Proceso | Tasa total por segundo de cursores, tanto tailable como no tailable, abiertos en una colección de perfiles. Disponible en MongoDB 8.0 y 8.1 solo en |
| Proceso | Mida la tasa de operaciones en MongoDB secundarias, según se recopila del documento Puedes ver estas métricas en la gráfica Opcounters - Repl, al que se accede a través de Métricas del clúster. |
| Proceso | La tasa promedio de oplog que genera el nodo primario en gigabytes por hora. |
| MongoDB búsqueda | Número total de |
| MongoDB búsqueda | Cantidad total de documentos o campos (especificados en la definición del índice) eliminados. |
| MongoDB búsqueda | Número total de campos únicos presentes en el índice MongoDB Search. |
| MongoDB búsqueda | Tamaño total de todos los índices en el disco. |
| MongoDB búsqueda | Memoria requerida en bytes para los índices de búsqueda vectorial. |
| MongoDB búsqueda | Número máximo de campos indexados a través de generaciones de índices. |
| MongoDB búsqueda | Número máximo de campos de nGrama en generaciones de índices. |
| MongoDB búsqueda | Número máximo de documentos de Lucene en todas las generaciones del índice. |
| MongoDB búsqueda | Número total de documentos o campos (especificados en la definición de índice) que la MongoDB Search ha indexado. |
| MongoDB búsqueda | |
| MongoDB búsqueda | Número total de documentos o campos (especificados en la definición del índice) que MongoDB Search actualizó. |
| MongoDB búsqueda | Número total de consultas para las que MongoDB Search no ha podido devolver una respuesta. |
| MongoDB búsqueda | Número total de consultas para las que MongoDB Search devolvió una respuesta correctamente. |
| MongoDB búsqueda | Número total de consultas enviadas a MongoDB Search. |
| MongoDB búsqueda | Cantidad de memoria que la pila de JVM está utilizando actualmente. |
| MongoDB búsqueda | Memoria total disponible en el heap de la JVM. |
| MongoDB búsqueda | Memoria residente utilizada por el proceso de búsqueda. |
| MongoDB búsqueda | Memoria virtual utilizada por el proceso de búsqueda. |
| MongoDB búsqueda | Memoria compartida utilizada por el proceso de búsqueda. |
| Disk | Mide el espacio libre en disco y el espacio en disco usado (en bytes) en la partición de disco utilizada por MongoDB. |
| Disk | El rendimiento de lectura del disco en bytes por segundo para la partición de datos. |
| Disk | El rendimiento de escritura en disco en bytes por segundo para la partición de datos. |
| Disk | Valores máximos durante el período de tiempo especificado por la granularidad métrica para espacio libre en disco y espacio en disco utilizado (en bytes) en la partición del disco utilizada por MongoDB. |
| Disk | Mide el rendimiento de IOPS para la partición de disco utilizada por MongoDB. |
| Disk | Valores máximos durante el periodo de tiempo especificado por la granularidad de la métrica para el rendimiento de IOPS en la partición de disco utilizada por MongoDB. |
| Sistema | Tasa promedio de bytes físicos recibidos por segundo. |
| Sistema | Tasa media de bytes físicos transmitidos por segundo. |
| Sistema | Valores máximos durante el período de tiempo especificado por la granularidad métrica para la tasa promedio de bytes físicos recibidos por segundo. |
| Sistema | Valores máximos durante el periodo de tiempo especificado por la granularidad de la métrica para la tasa promedio de bytes físicos transmitidos por segundo. |
| Proceso | Medir la tasa promedio de bytes leídos y escritos desde la caché de WiredTiger. |
| Proceso | Mide el número de bytes de datos y el número de bytes de datos sucios en la memoria caché de WiredTiger. |
| Proceso | Número de páginas leídas en la caché y número de páginas solicitadas desde la caché. |
| Proceso | Numero máximo de bytes configurados para la caché de WiredTiger. Se utiliza para calcular la relación de llenado de la caché (bytes actualmente en la caché / bytes máximos configurados) y la relación de llenado sucio (bytes sucios rastreados en la caché / bytes máximos configurados). Disponible sólo en |
| Proceso | Mida el número de operaciones de lectura y escritura en el motor de almacenamiento. |
| Global | Medidor que indica el número de operaciones que están actualmente en cola debido a los bloqueos que Atlas mantiene en lecturas, escrituras o en una combinación de ambas. |
| Medidor | Tamaño promedio de cada documento en bytes. Este es el |
| Medidor | Número de colecciones en la base de datos. |
| Medidor | Tamaño total de los datos no comprimidos almacenados en la base de datos. |
| Medidor | Tamaño total de todo el espacio en disco en uso en el sistema de archivos donde MongoDB almacena los datos. |
| Medidor | Suma del espacio en disco asignado a todos los índices de la base de datos, incluido el espacio libre de índices. |
| Medidor | Número total de índices en todas las colecciones de la base de datos. |
| Medidor | Contiene un recuento del número de extensiones en la base de datos en todas las colecciones. |
| Medidor | Número de objetos (específicamente, documentos) en la base de datos en todas las colecciones. |
| Medidor | Suma del espacio en disco asignado a todas las colecciones en la base de datos para el almacenamiento de documentos, incluyendo el espacio libre. |
| Medidor | Número de vistas en la base de datos. |
| Contador | Un entero de 64bits que indica la latencia en microsegundos para lectura, guardado, comando y solicitudes totales. |
| Contador | Un número entero de 64bits que indica el número de operaciones realizadas en la colección desde el último intervalo de reporte para operaciones de lectura, escritura, comandos y solicitudes totales. |
| Contador | Número de operaciones en el percentil 50en el histograma de latencia para operaciones de lectura, escritura, comando y solicitudes totales. |
| Contador | Número de operaciones en el percentil 95en el histograma de latencia para operaciones de lectura, escritura, comando y solicitudes totales. |
| Contador | Número de operaciones en el percentil 99en el histograma de latencia para operaciones de lectura, escritura, comando y solicitudes totales. |
| Medidor | Retardo (en segundos) del último evento de cambio leído en comparación con el último evento en el oplog. |
| Contador | Número total de mensajes que se enviaron a la fila de letra muerta (FLM). |
| Contador | Número total de bytes enviados a la fila de letra muerta (DLQ). |
| Contador | Número total de mensajes de entrada leídos, incluyendo los documentos rechazados. |
| Contador | Número total de bytes de entrada leídos, incluidos los mensajes rechazados. |
| Medidor | Suma de todas las demoras de partición (solo aplicable a procesadores de flujo que usan una fuente Kafka). |
| Medidor | Sello de tiempo del último documento enviado a la fila de letra muerta (DLQ). |
| Medidor | Sello de tiempo del último documento procesado. |
| Contador | Número total de mensajes de entrada leídos para un objetivo de operador, incluidos los documentos rechazados. |
| Contador | Número total de mensajes de salida emitidos para un objetivo operador. |
| Contador | Número total de mensajes de salida emitidos. |
| Contador | Número total de bytes de salida emitidos. |
| Contador | Número total de eventos procesados para un par de entrada/salida. |
| Medidor | Latencia percentil n.º 50de entrada + salida en microsegundos. |
| Medidor | 50º percentil de latencia del procesador en microsegundos. |
Etiquetas Disponibles para Datadog
La integración crea las siguientes etiquetas de Datadog en ciertas métricas:
Datadog Tags | Descripción |
|---|---|
| Organización Atlas asociada con la métrica. |
| Proyecto Atlas relacionado con la métrica. |
| Identificador único del proyecto de Atlas asociado con la métrica. |
| clúster de Atlas asociado con la métrica. |
| Set de réplicas asociada con la métrica. |
| Clúster fragmentado asociado con la métrica. |
| Base de datos asociada con la métrica. |
| Colección asociada con la métrica. |
| Número de puerto asociado al nombre de host de Atlas. |
| Estado de tu hostname de Atlas (principal, secundario o proceso individual). Puedes usar esta etiqueta para filtrar las métricas de latencia a nivel de la colección al consultar tu clúster o set de réplicas. |
| Nombre del procesador de flujo asociado con la métrica. |
| Identificador único del procesador de flujos asociado con la métrica. |
| Nombre del área de trabajo de Stream Processing asociada con la métrica. |
| Identificador único del espacio de trabajo de Stream Processing asociado con la métrica. |
Además, Atlas envía etiquetas personalizadas definidas por el usuario a Datadog. Las etiquetas solo se aplican a las métricas, no a las alertas.
Nota
El envío de etiquetas personalizadas a las métricas de Datadog es una función opcional que se habilita a través de la interfaz de usuario o la API.Consulte la sección "Procedimiento" de este documento para obtener más información sobre cada procedimiento.
Funcionalidades de Datadog para supervisar el estado de la integración de Atlas
Datadog ofrece las siguientes funcionalidades que puedes configurar para rastrear el estado de tu integración de Atlas:
No-data Alert
No hay alertas de datos en Datadog te notifica cuando una métrica no informa datos en circunstancias normales. Esta funcionalidad te ayuda a identificar problemas con tu integración de Atlas, como cambios en el rendimiento, problemas con la Clave API o conexiones rotas.
Comprobaciones de servicio
Service Checks in Datadog supervisan el estado de tu integración Atlas con Datadog. Esta funcionalidad supervisa si una métrica de cadencia coherente no está disponible un número específico de veces consecutivas. Si la Verificación del Servicio envía una alerta, tu integración Atlas tiene un problema.