Compartir a través de


Referencia de datos de supervisión de Azure Managed Redis

Este artículo contiene toda la información de referencia de supervisión de este servicio.

Métricas

En esta sección se indican todas las métricas de la plataforma recopiladas automáticamente para este servicio. Estas métricas también forman parte de la lista global de todas las métricas de plataforma admitidas en Azure Monitor.

Para obtener información sobre la retención de métricas, consulte Información general sobre las métricas de Azure Monitor.

Para obtener más información e información sobre las métricas admitidas para Microsoft.Cache/redisEnterprise, consulte la sección siguiente.

Métricas soportadas para Microsoft.Cache/redisEnterprise

En la tabla siguiente se enumeran las métricas disponibles para el tipo de recurso Microsoft.Cache/redisEnterprise.

  • Es posible que todas las columnas no estén presentes en todas las tablas.
  • Es posible que algunas columnas estén fuera del área de visualización de la página. Seleccione Expandir tabla para ver todas las columnas disponibles.

Encabezados de tabla

  • Categoría: el grupo de métricas o la clasificación.
  • Métrica: el nombre de presentación de la métrica tal como aparece en el portal de Azure.
  • Nombre en la API REST: el nombre de la métrica por el que se conoce en la API REST.
  • Unidad: unidad de medida.
  • Agregación: el tipo de agregación predeterminado. Valores válidos: promedio (Avg), mínimo (Min), máximo (Max), total (Sum), recuento.
  • Dimensiones - : dimensiones disponibles para la métrica.
  • Intervalos de agregación - : intervalos en los que se obtiene una muestra de la métrica. Por ejemplo, PT1M indica que la métrica se muestrea cada minuto, PT30M cada 30 minutos, PT1H cada hora, etc.
  • Exportación de DS: indica si la métrica se puede exportar a los registros de Azure Monitor a través de la configuración de diagnóstico. Para obtener más información sobre la exportación de métricas, consulte Crear configuración de diagnóstico en Azure Monitor.
Métrica Nombre en la API de REST Unidad Agregación Dimensiones Granulos de tiempo Exportación de DS
Aciertos de caché

El número de búsquedas de claves correctas. Para obtener más información, vea https://aka.ms/redis/enterprise/metrics.
cachehits Contar Suma (Total) <ninguno> PT5M, PT1H
Microsegundos de latencia de caché (versión preliminar)

La latencia de la caché en microsegundos. Para obtener más información, vea https://aka.ms/redis/enterprise/metrics.
cacheLatency Contar Promedio InstanceId PT5M, PT1H
Errores de caché

El número de búsquedas de claves con error. Para obtener más información, vea https://aka.ms/redis/enterprise/metrics.
cachemisses Contar Suma (Total) <ninguno> PT5M, PT1H
Lectura de caché

La cantidad de datos que se leen de la caché en megabytes por segundo (MB/s). Para obtener más información, vea https://aka.ms/redis/enterprise/metrics.
cacheRead Bytes por Segundo Máxima InstanceId PT5M, PT1H
Escritura de caché

La cantidad de datos que se escriben en la caché en megabytes por segundo (MB/s). Para obtener más información, vea https://aka.ms/redis/enterprise/metrics.
cacheWrite Bytes por Segundo Máxima InstanceId PT5M, PT1H
Clientes conectados

El número de conexiones de cliente a la memoria caché. Para obtener más información, vea https://aka.ms/redis/enterprise/metrics.
connectedclients Contar Máxima InstanceId PT5M, PT1H
Claves expulsadas

El número de elementos expulsados de la caché. Para obtener más información, vea https://aka.ms/redis/enterprise/metrics.
evictedkeys Contar Suma (Total) <ninguno> PT5M, PT1H
Claves expiradas

El número de elementos expirados en la caché. Para obtener más información, vea https://aka.ms/redis/enterprise/metrics.
expiredkeys Contar Suma (Total) <ninguno> PT5M, PT1H
Replicación geográfica saludable

El estado de la replicación geográfica en un grupo de replicación geográfica activa. 0 representa insalubre y 1 representa saludable. Para obtener más información, vea https://aka.ms/redis/enterprise/metrics.
geoReplicationHealthy Contar Máxima <ninguno> PT5M, PT1H
Obtiene

El número de operaciones Get de la caché. Para obtener más información, vea https://aka.ms/redis/enterprise/metrics.
getcommands Contar Suma (Total) <ninguno> PT5M, PT1H
Operaciones por segundo

El número de operaciones instantáneas por segundo ejecutadas en la caché. Para obtener más información, vea https://aka.ms/redis/enterprise/metrics.
operationsPerSecond Contar Máxima <ninguno> PT5M, PT1H
CPU

El uso de CPU del servidor de Azure Cache for Redis como porcentaje. Para obtener más información, vea https://aka.ms/redis/enterprise/metrics.
percentProcessorTime Porcentaje Máxima InstanceId PT5M, PT1H
Carga del servidor

El porcentaje de ciclos en los que el servidor de Redis está ocupado procesando y no está inactivo esperando mensajes. Para obtener más información, vea https://aka.ms/redis/enterprise/metrics.
serverLoad Porcentaje Máxima <ninguno> PT5M, PT1H
Conjuntos

El número de operaciones Set a la caché. Para obtener más información, vea https://aka.ms/redis/enterprise/metrics.
setcommands Contar Suma (Total) <ninguno> PT5M, PT1H
Operaciones totales

El número total de comandos procesados por el servidor de caché. Para obtener más información, vea https://aka.ms/redis/enterprise/metrics.
totalcommandsprocessed Contar Suma (Total) <ninguno> PT5M, PT1H
Total de claves

El número total de elementos en la caché. Para obtener más información, vea https://aka.ms/redis/enterprise/metrics.
totalkeys Contar Máxima <ninguno> PT5M, PT1H
Memoria usada

La cantidad de memoria caché usada para pares clave-valor en la caché en MB. Para obtener más información, vea https://aka.ms/redis/enterprise/metrics.
usedmemory Bytes (unidades de información digital) Máxima <ninguno> PT5M, PT1H
Porcentaje de memoria usada

El porcentaje de memoria caché usada para pares clave-valor. Para obtener más información, vea https://aka.ms/redis/enterprise/metrics.
usedmemorypercentage Porcentaje Máxima <ninguno> PT5M, PT1H

Detalles sobre las métricas de Azure Managed Redis

En la lista siguiente se proporcionan detalles y más información sobre las métricas de Azure Monitor admitidas para Microsoft.Cache/redisEnterprise.

Métrica Detalles
Latencia de caché (versión preliminar) Latencia media de las solicitudes controladas por puntos de conexión en el nodo de caché durante el intervalo de informes especificado. Esta métrica se mide en milisegundos y se obtiene de la node_avg_latency métrica Prometheus. Esta métrica solo se notifica cuando hay tráfico activo en la memoria caché.
Aciertos de caché Número de búsquedas de claves correctas durante el intervalo de informes especificado. Este valor se obtiene de la bdb_read_hits métrica Prometheus.
Errores de caché El número de búsquedas de claves incorrectas durante el intervalo de informes. Este valor se obtiene de la bdb_read_misses_max métrica Prometheus. Los errores de caché no significan necesariamente que haya un problema con la memoria caché. Por ejemplo, cuando se utiliza el modelo de programación cache-aside, una aplicación busca un elemento en primer lugar en la memoria caché. Si el elemento no está allí (error de caché), se recupera de la base de datos y se agrega a la caché para la próxima vez. Los errores de caché son un comportamiento normal del modelo de programación cache-aside. Si el número de errores de caché es mayor de lo esperado, examine la lógica de aplicación que rellena y lee de la memoria caché. Si los elementos se expulsan de la memoria caché debido a la presión de memoria, es posible que haya algunos errores de caché, pero una métrica mejor para supervisar la presión de memoria sería Used Memory or Evicted Keys.
Lectura de caché Velocidad del tráfico de red entrante al nodo de caché en bytes por segundo durante el intervalo de informes especificado. Este valor se obtiene de la node_ingress_bytes_max métrica Prometheus. Si desea configurar alertas para los límites de ancho de banda de red del lado servidor, créelo con este contador de lectura de caché. Consulte esta tabla para conocer los límites de ancho de banda de los diferentes tamaños y planes de tarifa de caché.
Escritura de caché Velocidad del tráfico de red saliente del nodo de caché en bytes por segundo durante el intervalo de informes especificado. Este valor se obtiene de la node_egress_bytes_max métrica Prometheus.
Clientes conectados El número de conexiones de clientes a la caché durante el intervalo de informes especificado. Este valor se obtiene de la node_conns métrica Prometheus, que cuenta los clientes conectados a los puntos de conexión del nodo. Una vez alcanzado el límite de conexión, se producirá un error en los intentos posteriores de conectarse a la memoria caché. Incluso si no hay ninguna aplicación de cliente activa, puede haber algunas instancias de clientes conectadas debido a procesos y conexiones internos.
Unidad Central de Procesamiento (CPU) El uso de CPU del servidor de Redis administrado de Azure como porcentaje durante el intervalo de informes especificado. Este valor se deriva de la node_cpu_idle_min métrica Prometheus, que representa la parte de tiempo de inactividad de CPU más baja observada durante el intervalo y se invierte para reflejar el tiempo ocupado de la CPU. La métrica de CPU incluye procesos en segundo plano, como antimalware que no son estrictamente procesos de servidor de Redis, por lo que a veces puede aumentar independientemente de la carga de trabajo de Redis. Se recomienda usar esta métrica sobre la carga del servidor para la supervisión, ya que admite la exploración en profundidad de nivel de instancia mediante la división en el identificador de instancia, lo que proporciona una mayor granularidad en la que el nodo está bajo presión.
Claves expulsadas Número de claves expulsadas de la memoria caché durante el intervalo de informes especificado. Este valor se obtiene de la bdb_evicted_objects métrica Prometheus.
Claves expiradas Número de claves expiradas de la memoria caché durante el intervalo de informes especificado. Este valor se obtiene de la bdb_expired_objects métrica Prometheus.
Replicación geográfica correcta Indica el estado del vínculo de replicación geográfica entre las memorias caché de un grupo de Active Geo-Replication. La métrica notifica uno de los dos valores:

0: desconectado o incorrecto
1: correcto

La métrica está disponible en cachés de capas optimizadas para memoria, equilibradas y optimizadas para proceso con replicación geográfica habilitada. Un valor de 0 no significa que se hayan perdido los datos de la réplica geográfica. Simplemente significa que el vínculo entre la base de datos geográfica principal y secundaria es incorrecto.

Esta métrica puede indicar un estado de replicación desconectado o incorrecto por varios motivos, como la aplicación de revisiones mensuales, las actualizaciones del sistema operativo host, la configuración incorrecta de la red o el aprovisionamiento de vínculos de replicación geográfica con errores. El servicio Azure Managed Redis revisa periódicamente las memorias caché con las últimas características y mejoras de la plataforma. Durante estas actualizaciones, cada nodo de caché se desconecta, lo que deshabilita temporalmente el vínculo de replicación geográfica. Si el vínculo de replicación geográfica es incorrecto, compruebe si se debe a un evento de aplicación de revisiones en la caché geográfica principal o secundaria geográfica mediante Diagnóstico y solución de problemas en el menú Recurso del portal. En función de la cantidad de datos de la memoria caché, el tiempo de inactividad de la aplicación de revisiones puede tardar entre unos minutos y una hora. Si el vínculo de replicación geográfica es incorrecto durante más de una hora, abra una solicitud de soporte técnico.
Se Número de solicitudes de lectura a la memoria caché durante el intervalo de informes especificado. Este valor se obtiene de la bdb_read_req métrica Prometheus, que representa la tasa de todas las solicitudes de lectura de la base de datos, y es equivalente a la suma de aciertos y errores de caché durante el intervalo de informes.
Operaciones por segundo Número total de solicitudes controladas por segundo por todas las particiones de la memoria caché durante el intervalo de informes especificado. Este valor se obtiene de la bdb_instantaneous_ops_per_sec métrica Prometheus.
Carga de servidor La métrica Carga del servidor refleja la propia evaluación del servidor de Redis de la carga general y es similar a la métrica de CPU , pero medida en un nivel de clúster en lugar de por instancia. Este valor se deriva de la métrica Prometheus e invierte para reflejar el node_cpu_idle_min tiempo ocupado del servidor. Si este contador llega a 100, significa que el servidor de Redis ha llegado a un límite de rendimiento y la CPU no puede procesar el trabajo más rápidamente. Puede esperar un efecto de latencia grande. Si ve una carga de servidor elevada sostenida, considere la posibilidad de escalar verticalmente la memoria caché o crear particiones de datos entre varias cachés. Cuando la carga del servidor solo es moderadamente alta, como del 50 al 80 por ciento, la latencia media suele ser baja y las excepciones de tiempo de espera podrían tener otras causas que la latencia alta del servidor.

Dado que la carga del servidor se mide en el nivel de clúster, no permite explorar en profundidad las instancias individuales. Se recomienda usar la métrica de CPU en su lugar, ya que admite la división por identificador de instancia para el análisis de nivel de instancia.

Precaución: La métrica Carga del servidor puede presentar datos incorrectos para las cachés de Azure Managed Redis. A veces, la carga del servidor se representa como superior a 100. Estamos investigando esta incidencia. En su lugar, se recomienda usar la métrica de CPU .
Conjuntos Número de solicitudes de escritura en la memoria caché durante el intervalo de informes especificado. Este valor se obtiene de la bdb_write_req métrica Prometheus, que representa la tasa de todas las solicitudes de escritura en la base de datos.
Total de claves Número de claves de la memoria caché durante el intervalo de informes especificado. Este valor se obtiene de la bdb_no_of_keys métrica Prometheus.

Importante: Debido a una limitación en el sistema de métricas subyacentes para las memorias caché con la agrupación en clústeres habilitada, las claves totales devuelven el número máximo de claves de la partición que tenían el número máximo de claves durante el intervalo de informes.
Operaciones totales Número total de solicitudes procesadas por la memoria caché durante el intervalo de informes especificado. Este valor se obtiene de la bdb_total_req métrica Prometheus.
Memoria usada Cantidad de memoria caché en bytes usada por la base de datos durante el intervalo de informes especificado. Este valor se obtiene de la bdb_used_memory métrica Prometheus. En las memorias caché de niveles optimizados para Flash, este valor incluye tanto el uso de memoria RAM como de memoria flash. Este valor no incluye la fragmentación.

Cuando la alta disponibilidad está habilitada, el valor Memoria usada incluye la memoria en los nodos principal y de réplica. Esto puede hacer que la métrica aparezca el doble de grande de lo que se esperaba.
Porcentaje de memoria usado Porcentaje del límite de memoria configurado que está actualmente en uso durante el intervalo de informes especificado. Este valor se calcula como la relación entre bdb_used_memorybdb_memory_limit y desde las métricas de Redis Enterprise Prometheus. Este valor no incluye la fragmentación.

Registros de recursos

En esta sección se enumeran los tipos de registros de recursos que se pueden recopilar para este servicio. La sección extrae de la lista de todos los tipos de categorías de registros admitidos en Azure Monitor.

Registros de recursos admitidos para Microsoft.Cache/redisEnterprise/databases

Categoría Nombre de categoría mostrado Tabla de registro Admite el plan de registro básico Permite la transformación en el momento de la ingesta. Consultas de ejemplo Costes de exportación
ConnectionEvents Eventos de conexión (nueva conexión/autenticación/desconexión) REDConnectionEvents

Registra los eventos de conexión cuando el cliente se conecta a la base de datos empresarial de Redis.

Consultas

Tablas de registros de Azure Monitor

En esta sección, se enumeran todas las tablas de registros de Azure Monitor relacionadas con este servicio y que están disponibles para consulta mediante Log Analytics con consultas de Kusto. Las tablas contienen datos de registro de recursos y, posiblemente, más dependiendo de lo que se recopila y se enrutan a ellos.

Azure Managed Redis

Microsoft.Cache/redisEnterprise

Registro de actividad

En la tabla vinculada se enumeran las operaciones que se pueden registrar en el registro de actividad de este servicio. Estas operaciones son un subconjunto de todas las posibles operaciones del proveedor de recursos en el registro de actividad.

Para obtener más información sobre el esquema de las entradas del registro de actividad, consulte Esquema del registro de actividad.