Compartilhar via


Referência de dados de monitoramento do Redis Gerenciado do Azure

Este artigo contém todas as informações de referência de monitoramento para este serviço.

Métricas

Esta seção lista todas as métricas da plataforma coletadas automaticamente para este serviço. Essas métricas também fazem parte da lista global de todas as métricas da plataforma com suporte no Azure Monitor.

Para obter informações sobre retenção de métricas, consulte Visão geral das métricas do Azure Monitor.

Para obter mais detalhes e informações sobre as métricas com suporte para Microsoft.Cache/redisEnterprise, consulte a seção a seguir.

Métricas com suporte para Microsoft.Cache/redisEnterprise

A tabela a seguir lista as métricas disponíveis para o tipo de recurso Microsoft.Cache/redisEnterprise.

  • Nem todas as colunas podem estar presentes em todas as tabelas.
  • Algumas colunas podem estar além da área de visualização da página. Selecione Expandir tabela para exibir todas as colunas disponíveis.

Títulos de tabela

  • Categoria: o grupo ou classificação de métricas.
  • Métrica: o nome de exibição da métrica como aparece no portal do Azure.
  • Nome na API REST: o nome da métrica, conforme mencionado na API REST.
  • Unidade: unidade de medida
  • Agregação – o tipo de agregação padrão. Valores válidos: Médio (Méd.), Mínimo (Mín.), Máximo (Máx.), Total (Soma), Contagem.
  • Dimensões - Dimensões disponíveis para a métrica.
  • Intervalos de agregação: os - em que a métrica é amostrada. Por exemplo, PT1M indica que a métrica é amostrada a cada minuto, PT30M a cada 30 minutos, PT1H a cada hora e assim por diante.
  • Exportação de DS: se a métrica é exportável para os Logs do Azure Monitor via configurações de diagnóstico. Para obter mais informações sobre exportação de métricas, consulte as Criar configurações de diagnóstico no Azure Monitor.
Métrica Nome na API REST Unidade Agregação Dimensões Intervalos de Tempo Exportação de DS
Ocorrências no Cache

O número de pesquisas de chave com êxito. Para obter mais detalhes, confira https://aka.ms/redis/enterprise/metrics.
cachehits Contagem Soma (Total) <nenhum> PT5M, PT1H Sim
Microssegundos de latência de cache (versão prévia)

A latência para o cache em microssegundos. Para obter mais detalhes, confira https://aka.ms/redis/enterprise/metrics.
cacheLatency Contagem Mediana InstanceId PT5M, PT1H Sim
Perdas no Cache

O número de pesquisas de chave com falha. Para obter mais detalhes, confira https://aka.ms/redis/enterprise/metrics.
cachemisses Contagem Soma (Total) <nenhum> PT5M, PT1H Sim
Cache Lido

A quantidade de dados lidos do cache em Megabytes por segundo (MB/s). Para obter mais detalhes, confira https://aka.ms/redis/enterprise/metrics.
cacheRead Bytes por Segundo Máximo InstanceId PT5M, PT1H Sim
Gravação no Cache

A quantidade de dados gravados no cache em Megabytes por segundo (MB/s). Para obter mais detalhes, confira https://aka.ms/redis/enterprise/metrics.
cacheWrite Bytes por Segundo Máximo InstanceId PT5M, PT1H Sim
Clientes Conectados

O número de conexões do cliente com o cache. Para obter mais detalhes, confira https://aka.ms/redis/enterprise/metrics.
connectedclients Contagem Máximo InstanceId PT5M, PT1H Sim
Chaves removidas

O número de itens removidos do cache. Para obter mais detalhes, confira https://aka.ms/redis/enterprise/metrics.
evictedkeys Contagem Soma (Total) <nenhum> PT5M, PT1H Sim
Chaves expiradas

O número de itens expirados do cache. Para obter mais detalhes, confira https://aka.ms/redis/enterprise/metrics.
expiredkeys Contagem Soma (Total) <nenhum> PT5M, PT1H Sim
Replicação geográfica saudável

A integridade da replicação geográfica em um grupo de replicação geográfica ativa. 0 representa Insalubre e 1 representa Saudável. Para obter mais detalhes, confira https://aka.ms/redis/enterprise/metrics.
geoReplicationHealthy Contagem Máximo <nenhum> PT5M, PT1H Sim
Obtém

O número de operações get do cache. Para obter mais detalhes, confira https://aka.ms/redis/enterprise/metrics.
getcommands Contagem Soma (Total) <nenhum> PT5M, PT1H Sim
Operações por Segundo

O número de operações instantâneas por segundo executadas no cache. Para obter mais detalhes, confira https://aka.ms/redis/enterprise/metrics.
operationsPerSecond Contagem Máximo <nenhum> PT5M, PT1H Sim
CPU

A utilização da CPU do servidor Azure Redis Cache em porcentagem. Para obter mais detalhes, confira https://aka.ms/redis/enterprise/metrics.
percentProcessorTime Porcentagem Máximo InstanceId PT5M, PT1H Sim
Carga do Servidor

O percentual de ciclos em que o servidor Redis está ocupado processando, em vez de ocioso esperando por mensagens. Para obter mais detalhes, confira https://aka.ms/redis/enterprise/metrics.
serverLoad Porcentagem Máximo <nenhum> PT5M, PT1H Sim
Define

O número de operação de conjuntos para o cache. Para obter mais detalhes, confira https://aka.ms/redis/enterprise/metrics.
setcommands Contagem Soma (Total) <nenhum> PT5M, PT1H Sim
Total de Operações

O número total de comandos processados pelo servidor de cache. Para obter mais detalhes, confira https://aka.ms/redis/enterprise/metrics.
totalcommandsprocessed Contagem Soma (Total) <nenhum> PT5M, PT1H Sim
Total de Chaves

O número total de itens no cache. Para obter mais detalhes, confira https://aka.ms/redis/enterprise/metrics.
totalkeys Contagem Máximo <nenhum> PT5M, PT1H Sim
Memória Usada

A quantidade de memória cache usada para pares de chave-valor no cache em MB. Para obter mais detalhes, confira https://aka.ms/redis/enterprise/metrics.
usedmemory Bytes Máximo <nenhum> PT5M, PT1H Sim
Percentual de memória utilizada

A porcentagem de memória cache usada para pares de chave-valor. Para obter mais detalhes, confira https://aka.ms/redis/enterprise/metrics.
usedmemorypercentage Porcentagem Máximo <nenhum> PT5M, PT1H Sim

Detalhes sobre as métricas do Redis Gerenciado do Azure

A lista a seguir fornece detalhes e mais informações sobre as métricas do Azure Monitor com suporte para Microsoft.Cache/redisEnterprise.

Métrica Detalhes
Latência do cache (versão prévia) A latência média de solicitações manipuladas por pontos de extremidade no nó de cache durante o intervalo de relatórios especificado. Essa métrica é medida em milissegundos e é originada da node_avg_latency métrica Prometheus. Essa métrica só é relatada quando há tráfego ativo no cache.
Acertos de cache O número de pesquisas de chave bem-sucedidas durante o intervalo de relatórios especificado. Esse valor é originado da bdb_read_hits métrica Prometheus.
Erros de Cache O número de pesquisas de chave com falha durante o intervalo de relatório especificado. Esse valor é originado da bdb_read_misses_max métrica Prometheus. Erros de cache não significam necessariamente que há um problema com o cache. Por exemplo, ao se usar o padrão de programação cache-aside, um aplicativo procura um item no cache primeiro. Se o item não estiver lá (erro de cache), o item será recuperado do banco de dados e adicionado ao cache na próxima vez. Erros de cache são o comportamento normal para o padrão de programação cache-aside. Se o número de erros de cache for maior do que o esperado, examine a lógica do aplicativo que popula e lê do cache. Se os itens estiverem sendo removidos do cache devido à pressão de memória, talvez haja alguns erros de cache, mas uma métrica melhor para monitorar a pressão de memória seria Used Memory or Evicted Keys.
Cache Lido A taxa de tráfego de rede de entrada para o nó de cache em bytes por segundo durante o intervalo de relatórios especificado. Esse valor é originado da node_ingress_bytes_max métrica Prometheus. Se você quiser configurar alertas para limites de largura de banda de rede do lado do servidor, crie-o usando este contador de Leitura de Cache. Confira esta tabela para ver os limites de largura de banda observados para vários tamanhos e tipos de preço de cache.
Gravação no Cache A taxa de tráfego de rede de saída do nó de cache em bytes por segundo durante o intervalo de relatórios especificado. Esse valor é originado da node_egress_bytes_max métrica Prometheus.
Clientes conectados O número de conexões de cliente com o cache durante o intervalo de relatório especificado. Esse valor é proveniente da node_conns métrica Prometheus, que conta os clientes conectados aos pontos de extremidade no nó. Depois que o limite de conexão for atingido, as tentativas posteriores de se conectar ao cache falharão. Mesmo que não haja aplicativos clientes ativos, ainda pode haver algumas instâncias de clientes conectados devido a conexões e processos internos.
CPU A utilização da CPU do servidor Redis Gerenciado do Azure como uma porcentagem durante o intervalo de relatórios especificado. Esse valor é derivado da node_cpu_idle_min métrica Prometheus, que representa a menor parte de tempo ocioso da CPU observada durante o intervalo e é invertida para refletir o tempo ocupado da CPU. A métrica da CPU inclui processos em segundo plano, como antimalware que não são estritamente processos do servidor Redis, portanto, às vezes, pode aumentar independentemente da carga de trabalho redis. É recomendável usar essa métrica sobre a Carga do Servidor para monitoramento, pois ela dá suporte à busca detalhada no nível da instância dividindo-se na ID da Instância, fornecendo mais granularidade na qual o nó está sob pressão.
Chaves removidas O número de chaves removidas do cache durante o intervalo de relatórios especificado. Esse valor é originado da bdb_evicted_objects métrica Prometheus.
Chaves expiradas O número de chaves expirou do cache durante o intervalo de relatórios especificado. Esse valor é originado da bdb_expired_objects métrica Prometheus.
Replicação geográfica íntegra Indica a integridade do link de replicação geográfica entre caches em um grupo do Active Geo-Replication. A métrica relata um dos dois valores:

0 – desconectado/não íntegro
1 – íntegro

A métrica está disponível em caches de camada otimizada para memória, balanceada e computação com replicação geográfica habilitada. Um valor de 0 não significa que os dados na replicação geográfica foram perdidos. Isso significa apenas que o link entre a geografia primária e a secundária não é íntegro.

Essa métrica pode indicar um status de replicação desconectado/não íntegro por vários motivos, incluindo: aplicação de patch mensal, atualizações do sistema operacional do host, configuração incorreta de rede ou falha no provisionamento de link de replicação geográfica. O serviço Redis Gerenciado do Azure periodicamente corrige caches com os recursos e melhorias mais recentes da plataforma. Durante essas atualizações, cada nó do cache fica offline, o que desabilita temporariamente o link da replicação geográfica. Se o link de replicação geográfica não estiver íntegro, verifique se ele foi causado por um evento de aplicação de patch no cache geográfico ou geográfico secundário usando Diagnosticar e Resolver Problemas no menu Recurso no portal. Dependendo da quantidade de dados no cache, o tempo de inatividade da aplicação de patches pode levar de alguns minutos a uma hora. Se o link de replicação geográfica não estiver íntegro por mais de uma hora, registre uma solicitação de suporte.
Obtém O número de solicitações de leitura para o cache durante o intervalo de relatórios especificado. Esse valor é originado da bdb_read_req métrica Prometheus, que representa a taxa de todas as solicitações de leitura no banco de dados e é equivalente à soma de acertos e erros de cache durante o intervalo de relatórios.
Operações por segundo O número total de solicitações manipuladas por segundo por todos os fragmentos do cache durante o intervalo de relatórios especificado. Esse valor é originado da bdb_instantaneous_ops_per_sec métrica Prometheus.
Carga do Servidor A métrica de Carga do Servidor reflete a própria avaliação do servidor Redis sobre a carga geral e é semelhante à métrica da CPU , mas medida em um nível de cluster em vez de por instância. Esse valor é derivado da métrica prometheus node_cpu_idle_min e invertido para refletir o tempo de disponibilidade do servidor. Se esse contador atingir 100, o servidor Redis atingiu um limite de desempenho, e a CPU não pode processar o trabalho mais depressa. Você pode esperar um grande efeito de latência. Se você estiver vendo uma carga de servidor alta sustentada, considere escalar verticalmente o cache ou particionar dados em vários caches. Quando a carga do servidor é apenas moderadamente alta, como 50 a 80%, a latência média geralmente permanece baixa e as exceções de tempo limite podem ter outras causas além da alta latência do servidor.

Como a carga do servidor é medida no nível do cluster, ela não permite que você faça drill down em instâncias individuais. Em vez disso, recomendamos usar a métrica de CPU , pois ela dá suporte à divisão por ID da Instância para análise de nível de instância.

Cuidado: A métrica de Carga do Servidor pode apresentar dados incorretos para caches Redis Gerenciados do Azure. Às vezes, a Carga do Servidor é representada como sendo mais de 100. Estamos investigando esse problema. Em vez disso, recomendamos usar a métrica da CPU .
Conjuntos O número de solicitações de gravação no cache durante o intervalo de relatórios especificado. Esse valor é proveniente da bdb_write_req métrica Prometheus, que representa a taxa de todas as solicitações de gravação no banco de dados.
Total de chaves O número de chaves no cache durante o intervalo de relatórios especificado. Esse valor é originado da bdb_no_of_keys métrica Prometheus.

Importante: Devido a uma limitação no sistema de métricas subjacente para caches com clustering habilitado, as Chaves Totais retornam o número máximo de chaves do fragmento que tinha o número máximo de chaves durante o intervalo de relatórios.
Total de Operações O número total de solicitações processadas pelo cache durante o intervalo de relatórios especificado. Esse valor é originado da bdb_total_req métrica Prometheus.
Memória Usada A quantidade de memória de cache em bytes usados pelo banco de dados durante o intervalo de relatórios especificado. Esse valor é originado da bdb_used_memory métrica Prometheus. Em caches de camada com otimização flash, esse valor inclui o uso de memória flash e RAM. Esse valor não inclui fragmentação.

Quando a Alta Disponibilidade está habilitada, o valor de Memória Usada inclui a memória nos nós primário e de réplica. Isso pode fazer com que a métrica apareça duas vezes maior do que o esperado.
Porcentagem de memória utilizada A porcentagem do limite de memória configurado que está em uso no momento durante o intervalo de relatórios especificado. Esse valor é calculado como a proporção de bdb_used_memory para bdb_memory_limit das métricas do Redis Enterprise Prometheus. Esse valor não inclui fragmentação.

Logs de recursos

Esta seção lista os tipos de logs de recursos que você pode coletar para o este serviço. A seção extrai da lista de todos os tipos de categoria de logs de recursos com suporte no Azure Monitor.

Logs de recursos com suporte para Microsoft.Cache/redisEnterprise/databases

Categoria Nome de exibição da categoria Tabela de log Suporta plano de registro básico Suporta transformação durante a ingestão Consultas de exemplo Custos de exportação
ConnectionEvents Eventos de conexão (Nova Conexão/Autenticação/Desconexão) REDConnectionEvents

Registra os eventos de conexão quando o cliente se conecta ao banco de dados do Redis Enterprise.

Sim Sim Consultas Sim

Tabelas de Logs do Azure Monitor

Esta seção lista todas as tabelas dos Logs do Azure Monitor relevantes para este serviço e disponíveis para consulta pela análise de logs usando o Kusto. As tabelas contêm dados de log de recursos e possivelmente mais, dependendo do que é coletado e roteado para elas.

Redis Gerenciado pelo Azure

Microsoft.Cache/redisEnterprise

Log de atividades

A tabela vinculada lista as operações que podem ser registradas no log de atividades desse serviço. Essas operações são um subconjunto de todas as operações do provedor de recursos possíveis no log de atividades.

Para obter mais informações sobre o esquema de entradas do log de atividades, confira Esquema do log de atividades.