Docs Menu
Docs Home
/ /
/ / /

Solucionar problemas de oplog

Las alertas de registro de operaciones de replicación se pueden activar cuando la cantidad de Los datos deoplog generados en un miembro del clúster principal son más grandes que el tamaño de oplog configurado del clúster.

Puede configurar las siguientes condiciones de alerta en el nivel de proyecto Página de configuración de alertas para activar alertas.

Replication Oplog Window is (X) Se produce si el tiempo aproximado disponible en el registro de operaciones de replicación principal alcanza o es inferior al umbral especificado. Esto se refiere al tiempo que el registro principal puede continuar registrando, dada la velocidad actual de generación de datos del registro de operaciones.

Oplog Data Per Hour is (X) ocurre si la cantidad de datos por hora que se escriben en el registro de operaciones de replicación de un servidor principal cumple o supera el umbral especificado.

Estos son algunos eventos comunes que pueden provocar una mayor actividad del oplog:

  • Operaciones intensivas de escritura y actualización en un corto período de tiempo.

  • El tamaño del registro de operaciones configurado del clúster es menor que el valor en el Oplog GB / Hour Gráfico observado en la vista de métricas del clúster.

Estas son algunas posibles acciones a considerar para ayudar a resolver las alertas del registro de operaciones de replicación:

  • Aumente el tamaño del registro de operaciones editando la configuración de su clúster para asegurarse de que sea mayor que el valor máximo del Oplog GB / Hour gráfico en la vista de métricas del clúster.

  • Aumente el tamaño del registro de operaciones si prevé que se producirán operaciones intensas de escritura y actualización en un período de tiempo corto.

    Nota

    Es posible que necesite aumentar el almacenamiento de su clúster para liberar suficiente espacio para cambiar el tamaño del registro de operaciones.

  • Asegúrese de que todas las operaciones de escritura especifiquen una preocupación de escritura de majority para garantizar que las escrituras se repliquen en al menos un nodo antes de pasar a la siguiente operación de escritura. Esto controla la velocidad del tráfico de su aplicación al evitar que el nodo principal acepte escrituras a una velocidad mayor que la que pueden gestionar los secundarios.

Consulte Cargas de trabajo que pueden requerir un tamaño de registro de operaciones mayor para obtener más información sobre los requisitos de tamaño oplog para su caso de uso.

Es posible que observe los siguientes escenarios cuando se activan estas alertas:

  • El Oplog GB / Hour gráfico en la vista de métricas aumenta gradualmente.

  • El Replication Oplog Window gráfico en la vista de métricas es bajo.

  • La vista Atlas y la descarga de registros MongoDB de nodos secundarios o en mal estado muestran el siguiente mensaje:

    We are too stale to use <node>:27017 as a sync source.
  • Un nodo Atlas informa un estado de INICIO2 y RECUPERÁNDOSE durante un período de tiempo prolongado.

    Normalmente, esto indica que el nodo se ha desconectado del registro de operaciones y no puede seguir el ritmo de los datos generados por el nodo principal. En este caso, el nodo requerirá una sincronización inicial para recuperarse y garantizar la coherencia de los datos en todos los nodos. Puede comprobar el estado de un nodo mediante el rs.status() método de shell.

Volver

Primario perdido

En esta página