Solucionar problemas de alertas de métrica do Azure Monitor

Este artigo aborda perguntas comuns sobre alertas de métrica do Azure Monitor e como solucioná-los.

Os alertas do Azure Monitor notificam você proativamente quando condições importantes são encontradas nos dados de monitoramento. Eles permitem que você identifique e resolva problemas antes que os usuários do seu sistema os percebam. Para obter mais informações sobre como criar alertas, confira Visão geral de alertas no Microsoft Azure.

Meu alerta de métrica não disparou quando deveria

Se você acredita que um alerta de métrica deveria ter sido disparado, mas não foi, e ele não está listado no portal do Azure, tente as seguintes etapas:

  1. Examine a configuração da regra de alerta de métrica.

    • Verifique se o Tipo de agregação e a Granularidade de agregação (período) estão configurados conforme o esperado. O Tipo de agregação determina como os valores de métrica são agregados. Para saber mais, confira Agregação e exibição das métricas do Azure Monitor explicadas. A Granularidade de agregação (período) controla até que ponto a avaliação agrega os valores de métrica sempre que a regra de alerta é executada.

    • Verifique se Valor de limite ou Sensibilidade está configurado de acordo conforme o esperado.

    • Para uma regra de alerta que usa Limites dinâmicos, verifique se as configurações avançadas estão configuradas. O Número de violações pode filtrar alertas e Ignorar dados antes pode afetar a forma como os limites são calculados.

      Observação

      Os Limites dinâmicos exigem pelo menos 3 dias e 30 amostras de métricas antes de ficarem ativos.

  2. Verifique se o alerta disparou, mas não enviou a notificação.

    Examine a lista de alertas disparados para ver se você consegue localizar o alerta disparado. Se você puder ver o alerta na lista, mas tiver um problema com algumas de suas ações ou notificações, confira Solucionar problemas em alertas do Azure Monitor.

  3. Verifique se o alerta já está ativo.

    Verifique se já existe um alerta disparado sobre a série temporal de métrica para a qual você esperava receber um alerta. Os alertas de métricas são com estado, o que significa que, uma vez que um alerta é disparado em uma série temporal de métrica específica, não serão disparados mais alertas nessa série temporal até que o problema não seja mais observado. Essa opção de design reduz o ruído. O alerta é resolvido automaticamente quando a condição de alerta não é atendida por três avaliações consecutivas.

  4. Verifique as dimensões usadas.

    Se você selecionou alguns valores de dimensão para uma métrica, a regra de alerta monitora cada série temporal de métrica individual (conforme definido pela combinação de valores de dimensão) para uma violação de limite. Para monitorar também a série temporal de métrica de agregação (sem dimensões selecionadas), configure outra regra de alerta na métrica, sem selecionar dimensões.

  5. Verifique a agregação e a granularidade de tempo.

    Se você estiver usando gráficos de métricas, verifique se:

    • A Agregação selecionada no gráfico de métrica é o mesmo Tipo de agregação da regra de alerta.
    • A Granularidade de tempo selecionada é a mesma que a Granularidade de agregação (período) da regra de alerta e não está definida como Automática.
  6. Verifique se a regra de alerta perdeu o primeiro período de avaliação em uma série temporal.

    Você pode reduzir a probabilidade de perder a primeira avaliação da série temporal adicionada, certificando-se de escolher uma Granularidade de agregação (período) maior que a Frequência de avaliação nos seguintes casos:

    • Quando uma nova combinação de valores de dimensão é adicionada a uma regra de alerta de métrica que monitora várias dimensões.
    • Quando um novo recurso é adicionado ao escopo de uma regra de alerta de métrica que monitora vários recursos.
    • Quando a métrica é emitida após um período maior que 24 horas em que não foi emitida para a regra de alerta de métrica que monitora uma métrica que não é emitida continuamente (métrica esparsa).

O alerta de métrica não dispara sempre que a condição é atendida

Os alertas de métrica são com estado por padrão, portanto, não serão disparados outros alertas caso já exista um alerta disparado sobre uma série temporal específica. Para tornar uma regra de alerta de métrica específica sem estado e receber alertas em todas as avaliações em que a condição de alerta for atendida, use uma dessas opções:

  • Se você criar a regra de alerta programaticamente, por exemplo, via Azure Resource Manager, PowerShell, REST ou CLI do Azure, defina a propriedade autoMitigate como False.

  • Se você criar a regra de alerta no portal do Azure, desmarque a opção Resolver alertas automaticamente na seção Detalhes da regra de alerta. A frequência de notificações de alertas de métrica sem estado difere com base na frequência configurada da regra de alerta:

  • Frequência de alerta de menos de cinco minutos: enquanto a condição continua a ser atendida, uma notificação é enviada no intervalo de um a seis minutos.

  • Frequência de alerta de mais de cinco minutos: enquanto a condição continua a ser atendida, uma notificação é enviada na frequência configurada ou até no dobro dessa frequência. Por exemplo, para uma regra de alerta com uma frequência de 15 minutos, uma notificação é enviada no intervalo de 15 a 30 minutos.

Observação

Ao fazer uma regra de alerta de métrica sem estado, impede-se que alertas disparados sejam resolvidos. Portanto, mesmo depois que a condição deixar de ser atendida, os alertas disparados permanecerão em um estado disparado até o período de retenção de 30 dias.

A regra de alerta de métrica com limite dinâmico não dispara o suficiente

Você pode perceber que uma regra de alerta que usa limites dinâmicos não é disparada ou não é sensível o suficiente, mesmo que ela esteja configurada com alta sensibilidade. Isso pode acontecer quando a distribuição da métrica é muito irregular. Considere uma das seguintes soluções para corrigir o problema:

  • Passe a monitorar uma métrica complementar adequada ao seu cenário, se aplicável. Por exemplo, verifique se há alterações na taxa de sucesso, em vez da taxa de falha.
  • Tente selecionar um valor diferente para Granularidade de agregação (ponto).
  • Verifique se houve alteração drástica no comportamento da métrica nos últimos 10 dias, como uma interrupção. Uma alteração abrupta pode afetar os limites superior e inferior calculados para a métrica e torná-los mais amplos. Aguarde alguns dias até que a interrupção deixe de ser considerada no cálculo dos limites. Você também pode editar a regra de alerta para usar a opção Ignorar dados antes nas Configurações avançadas.
  • Se os dados tiverem sazonalidade semanal, mas não houver histórico suficiente disponível para a métrica, os limites calculados poderão resultar em limites superiores e inferiores mais amplos. Por exemplo, o cálculo pode tratar da mesma maneira os dias da semana e os finais de semana e criar limites amplos que nem sempre se ajustam aos dados. Esse problema deve se resolver depois que houver um histórico de métricas suficiente disponível. Então, a sazonalidade correta é detectada e os limites calculados são atualizados de acordo.

Um alerta de métrica foi acionado quando não deveria

Se você acredita que o alerta de métrica não deveria ter sido disparado, mas foi, as etapas a seguir podem ajudar a resolver o problema.

  1. Examine a lista de alertas disparados para localizar o alerta disparado. Selecione o alerta para exibir os detalhes. Examine as informações fornecidas em Por que esse alerta foi disparado? para ver o gráfico de métrica, o Valor da métrica e o Valor do limite no momento em que o alerta foi disparado.

    Observação

    Se você estiver usando limites dinâmicos e achar que os limites não estão corretos, forneça comentários usando o ícone de desaprovação. Esses comentários afetam a pesquisa de algoritmos de aprendizado de máquina e ajudarão a melhorar as detecções futuras.

  2. Se você tiver selecionado vários valores de dimensão para uma métrica, o alerta será disparado quando alguma série temporal de métrica (conforme definido por uma combinação de valores de dimensão) ultrapassar o limite. Para obter mais informações sobre o uso de dimensões em alertas de métrica, confira Restringir o destino usando dimensões.

  3. Examine a configuração da regra de alerta para certificar-se de que ela está configurada corretamente:

    • Verifique se Tipo de agregação, Granularidade de agregação (período) e Valor limite ou Sensibilidade estão configurados conforme o esperado.
    • Para uma regra de alerta que usa limites dinâmicos, verifique se as configurações avançadas estão definidas, uma vez que o Número de violações pode filtrar alertas e Ignorar dados antes de pode afetar a forma como os limites são calculados.

    Observação

    Os Limites dinâmicos exigem pelo menos 3 dias e 30 amostras de métricas antes de ficarem ativos.

  4. Se você estiver usando gráficos de métricas, verifique se:

    • A Agregação selecionada no gráfico de métrica é o mesmo Tipo de agregação da regra de alerta.
    • A Granularidade de tempo selecionada é a mesma que a Granularidade de agregação (Ponto) da sua regra de alertas, e ela não está definida como Automática.
  5. Se o alerta for disparado enquanto já houver alertas disparados que monitoram os mesmos critérios que não foram resolvidos, verifique se a regra de alerta foi configurada para não resolver alertas automaticamente. Isso significa que a regra de alerta é sem estado, não resolve automaticamente os alertas disparados e não exige que um alerta disparado seja resolvido antes de ser disparado novamente na mesma série temporal. Para verificar se a regra de alerta está configurada para não ser resolvida automaticamente:

    • Edite a regra de alerta no portal do Azure. Veja se a caixa de seleção Resolver alertas automaticamente na seção Detalhes da regra de alerta está desmarcada.
    • Examine o script usado para implantar a regra de alerta ou recupere a definição da regra de alerta. Verifique se a propriedade autoMitigate está definida como false.

Uma regra de alerta de métrica com limites dinâmicos dispara demais ou é muito ruidosa

Se uma regra de alerta que usa limites dinâmicos for muito ruidosa ou disparar demais, talvez seja necessário reduzir a sensibilidade da regra de alerta de limites dinâmicos. Use uma das seguintes opções:

  • Sensibilidade do limite: defina a sensibilidade como Baixa para ter mais tolerância a desvios.
  • Número de violações (em Configurações avançadas): configure a regra de alerta para disparar somente se vários desvios ocorrerem em um determinado período de tempo. Essa configuração torna a regra menos suscetível a desvios temporários.

Uma regra de alerta de métrica com limites dinâmicos está mostrando valores que não estão dentro do intervalo de valores esperados

Quando um valor de métrica exibe grandes flutuações, os limites dinâmicos podem compilar um modelo amplo em torno dos valores de métrica, o que pode resultar em um limite menor ou maior do que o esperado. Esse cenário pode ocorrer quando:

  • A sensibilidade estiver definida como baixa.

  • A métrica exibir um comportamento irregular com alta variação, que aparece como picos ou vales nos dados.

    Cogite tornar o modelo menos sensível ao escolher uma sensibilidade maior ou selecionar um Período de retrospectiva maior. Você também pode usar a opção Ignorar dados antes de para excluir uma irregularidade recente dos dados históricos usados para criar o modelo.

Problemas ao configurar regras de alerta de métrica

Não é possível encontrar a métrica sobre a qual alertar

Se quiser alertar sobre uma métrica específica, mas não conseguir vê-la ao criar uma regra de alerta, verifique para determinar:

Não é possível encontrar a métrica sobre a qual alertar: métricas de convidado de máquinas virtuais

Para alertar sobre métricas do sistema operacional convidado de máquinas virtuais, como memória e espaço em disco, verifique se você instalou o agente necessário para coletar esses dados para métricas do Azure Monitor para:

Para obter mais informações sobre como coletar dados do sistema operacional convidado de uma máquina virtual, confira este site.

Observação

Se você tiver configurado métricas de convidado para serem enviadas para um workspace do Log Analytics, essas métricas aparecerão no recurso do workspace do Log Analytics e começarão a mostrar dados apenas após a criação de uma regra de alerta que as monitore. Para isso, siga as etapas para configurar um alerta de métrica para os logs.

No momento, os alertas de métrica não dão suporte ao monitoramento de uma métrica de convidado de várias máquinas virtuais com uma única regra de alerta. Mas você pode usar uma regra de alerta de log. Para fazer isso, verifique se as métricas de convidado são coletadas para um workspace do Log Analytics e crie uma regra de alerta de log no workspace.

Não é possível localizar a dimensão da métrica sobre a qual alertar

Se você quiser alertar sobre valores de dimensão específicos de uma métrica, mas não conseguir encontrar esses valores:

  • Pode levar alguns minutos para que os valores de dimensão apareçam na lista Valores de dimensão.
  • Os valores de dimensão exibidos se baseiam nos dados de métrica coletados no último dia.
  • Se o valor de dimensão não foi emitido ainda ou não foi mostrado, você pode usar a opção Adicionar valor personalizado para adicionar um valor de dimensão personalizado.
  • Se você quiser alertar sobre todos os valores possíveis de uma dimensão, incluindo até mesmo valores futuros, escolha a opção Selecionar todos os valores atuais e futuros.
  • As dimensões de métricas personalizadas de recursos do Application Insights ficam desativadas por padrão. Para ativar a coleção de dimensões para essas métricas personalizadas, confira Métricas baseadas em log e pré-agregadas no Application Insights.

Você quer configurar uma regra de alerta em uma métrica personalizada que ainda não foi emitida

Ao criar uma regra de alerta de métrica, o nome da métrica é validado com a API de Definições de Métrica para verificar se ela existe. Em alguns casos, você deseja criar uma regra de alerta em uma métrica personalizada mesmo antes de ela ser emitida. Um exemplo é ao usar um modelo do Resource Manager para criar um recurso do Application Insights que emitirá uma métrica personalizada, juntamente com uma regra de alerta que vai monitorar essa métrica.

Para evitar uma falha de implantação ao tentar validar as definições da métrica personalizada, use o parâmetro skipMetricValidation na seção criteria da regra de alerta. Esse parâmetro fará com que a validação da métrica seja ignorada. Veja o exemplo a seguir para saber como usar esse parâmetro em um modelo do Resource Manager. Para obter mais informações, consulte as amostras de modelo do Resource Manager completos para criar regras de alerta de métrica.

"criteria": {
    "odata.type": "Microsoft.Azure.Monitor.SingleResourceMultipleMetricCriteria",
        "allOf": [
            {
                "name" : "condition1",
                "metricName": "myCustomMetric",
                "metricNamespace": "myCustomMetricNamespace",
                "dimensions":[],
                "operator": "GreaterThan",
                "threshold" : 10,
                "timeAggregation": "Average",
                "skipMetricValidation": true
            }
        ]
    }

Observação

O uso do parâmetro skipMetricValidation também pode ser necessário ao definir uma regra de alerta em uma métrica personalizada existente que não tenha sido emitida há vários dias.

Avisos e erros ao configurar regras de alerta de métrica

No momento, os limites dinâmicos não estão disponíveis para esse aviso de métrica

Os limites dinâmicos têm suporte para a maioria das métricas, mas não com todas. Veja Métricas não compatíveis com limites dinâmicos para obter a lista de métricas.

A métrica não está disponível para o escopo selecionado. Isso pode acontecer se a métrica se aplicar apenas a uma versão específica ou a um erro de SKU

Examine a descrição da métrica em Métricas compatíveis com o Azure Monitor para verificar se ela está disponível apenas em versões ou edições específicas do recurso ou desse tipo específico.

Por exemplo, em Recursos do banco de dados SQL ou Serviços de arquivo de armazenamento, há métricas específicas compatíveis apenas com versões específicas do recurso.

Não há sinais disponíveis para exibição. Tente alterar o escopo desse erro de regra de alerta

Esse erro indica um problema com o escopo da regra de alerta. Isso pode acontecer ao editar uma regra de alerta com escopo para um tipo de recurso que ofereça suporte à configuração de vários recursos (como máquina virtual ou banco de dados SQL) e ao tentar adicionar outro recurso do mesmo tipo, mas de uma região diferente. Não há suporte para alertas em vários recursos do mesmo tipo de regiões diferentes em Alertas de métrica.

Os limites de serviço para regras de alerta de métrica são muito pequenos

O número permitido de regras de alerta de métrica por assinatura está sujeito aos limites do serviço.

Confira Verificar o número de regras de alerta de métrica em uso para ver quantas regras de alerta de métrica estão sendo usadas no momento.

Se você atingiu o limite do serviço, as etapas a seguir podem ajudar a resolver o problema:

  1. Tente excluir ou desabilitar regras de alerta de métricas que não são mais usadas.
  2. Alterne para o uso de regras de alerta de métrica que monitoram vários recursos. Com essa funcionalidade, uma única regra de alerta pode monitorar vários recursos, usando apenas uma regra de alerta contada em relação à cota. Para obter mais informações sobre esse recurso e os tipos de recursos com suporte, confira metric-alerts.
  3. Se você precisar aumentar o limite de cota, abra uma solicitação de suporte e forneça:
    • As IDs de assinatura nas quais o limite de cota precisa ser aumentado.
    • Tipo de recurso para o aumento da cota. Selecione Alertas de métrica.
    • Limite de cota solicitado.

Próximas etapas

Para obter informações gerais de solução de problemas sobre alertas e notificações, confira Solucionar problemas em alertas do Azure Monitor.