Resolver problemas de alertas métricos do Azure Monitor

Este artigo discute perguntas comuns sobre alertas de métricas do Azure Monitor e como solucioná-los.

Os alertas do Azure Monitor notificam proativamente quando as condições importantes são encontradas nos dados de monitorização. Eles permitem que você identifique e resolva problemas antes que os usuários do seu sistema percebam. Para obter mais informações sobre alertas, consulte Visão geral de alertas no Microsoft Azure.

O alerta métrico não disparou quando deveria

Se você acredita que um alerta de métrica deveria ter sido acionado, mas não foi disparado, e não está listado no portal do Azure, tente as seguintes etapas:

  1. Revise a configuração da regra de alerta métrico.

    • Verifique se o tipo de agregação e a granularidade de agregação (Período) estão configurados conforme o esperado. O tipo de agregação determina como os valores métricos são agregados. Para saber mais, consulte Azure Monitor Metrics aggregation and display explained. A granularidade da agregação (Período) controla até que ponto a avaliação agrega os valores da métrica cada vez que a regra de alerta é executada.

    • Verifique se o valor do Limite ou a Sensibilidade estão configurados conforme o esperado.

    • Para uma regra de alerta que usa Limites Dinâmicos, verifique se as configurações avançadas estão configuradas. O número de violações pode filtrar alertas e Ignorar dados antes pode afetar a forma como os limites são calculados.

      Nota

      Os limiares dinâmicos requerem pelo menos 3 dias e 30 amostras métricas antes de se tornarem ativos.

  2. Verifique se o alerta disparou, mas não enviou a notificação.

    Reveja a lista de alertas disparados para ver se consegue localizar o alerta disparado. Se você puder ver o alerta na lista, mas tiver um problema com algumas de suas ações ou notificações, consulte Solução de problemas nos alertas do Azure Monitor.

  3. Verifique se o alerta já está ativo.

    Verifique se já existe um alerta disparado na série temporal métrica para a qual esperava receber um alerta. Os alertas métricos são com monitoração de estado, o que significa que, uma vez que um alerta é disparado em uma série temporal métrica específica, mais alertas nessa série temporal não serão disparados até que o problema não seja mais observado. Esta escolha de design reduz o ruído. O alerta será automaticamente resolvido quando a condição de alerta não for cumprida durante três períodos consecutivos.

  4. Verifique as dimensões utilizadas.

    Se você selecionou alguns valores de dimensão para uma métrica, a regra de alerta monitora cada série temporal de métrica individual (conforme definido pela combinação de valores de dimensão) para uma violação de limite. Para monitorar também a série temporal da métrica agregada, sem nenhuma dimensão selecionada, configure outra regra de alerta na métrica sem selecionar dimensões.

  5. Verifique a agregação e a granularidade do tempo.

    Se você estiver usando gráficos de métricas, certifique-se de que:

    • A Agregação selecionada no gráfico de métricas é a mesma que o tipo de Agregação na regra de alerta.
    • A granularidade de tempo selecionada é a mesma que a granularidade de agregação (Período) na regra de alerta e não está definida como Automática.
  6. Verifique se a regra de alerta está faltando no primeiro período de avaliação de uma série temporal.

    Você pode reduzir a probabilidade de perder a primeira avaliação de séries temporais adicionadas certificando-se de escolher uma granularidade de agregação (Período) maior do que a Frequência de avaliação nos seguintes casos:

    • Quando uma nova combinação de valor de dimensão é adicionada a uma regra de alerta de métrica que monitora várias dimensões.
    • Quando um novo recurso é adicionado ao escopo para uma regra de alerta de métrica que monitora vários recursos.
    • Quando a métrica é emitida após um período superior a 24 horas em que não foi emitida para a regra de alerta métrico que monitora uma métrica que não é emitida continuamente (métrica esparsa).

O alerta métrico não é acionado toda vez que a condição é atendida

Os alertas métricos são com monitoração de estado por padrão, portanto, outros alertas não são disparados se já houver um alerta disparado em uma série temporal específica. Para tornar uma regra de alerta métrica específica sem estado e ser alertado em cada avaliação em que a condição de alerta é atendida, use uma destas opções:

  • Se você criar a regra de alerta programaticamente, por exemplo, por meio do Gerenciador de Recursos do Azure, PowerShell, REST ou CLI do Azure, defina a autoMitigate propriedade como False.

  • Se você criar a regra de alerta no portal do Azure, desmarque a opção Resolver alertas automaticamente na seção Detalhes da regra de alerta. A frequência das notificações para alertas de métricas sem estado difere com base na frequência configurada da regra de alerta:

  • Frequência de alerta inferior a 5 minutos: enquanto a condição continua a ser cumprida, é enviada uma notificação entre um e seis minutos.

  • Frequência de alerta superior a 5 minutos: Enquanto a condição continua a ser cumprida, é enviada uma notificação entre a frequência configurada e o dobro da frequência. Por exemplo, para uma regra de alerta com uma frequência de 15 minutos, uma notificação é enviada entre 15 a 30 minutos.

Nota

Tornar uma regra de alerta métrica sem estado impede que os alertas disparados sejam resolvidos. Assim, mesmo depois que a condição não é mais cumprida, os alertas disparados permanecem em um estado disparado até o período de retenção de 30 dias.

Uma regra de alerta métrico com limite dinâmico não é acionada o suficiente

Você pode encontrar uma regra de alerta que usa limites dinâmicos, não é acionada ou não é sensível o suficiente, mesmo que esteja configurada com alta sensibilidade. Isso pode acontecer quando a distribuição da métrica é altamente irregular. Considere uma das seguintes soluções para corrigir o problema:

  • Passe para o monitoramento de uma métrica complementar adequada ao seu cenário, se aplicável. Por exemplo, verifique se há alterações na taxa de sucesso em vez da taxa de falha.
  • Tente selecionar um valor diferente para Granularidade de agregação (Período).
  • Verifique se houve uma mudança drástica no comportamento da métrica nos últimos 10 dias, como uma interrupção. Uma mudança abrupta pode afetar os limites superior e inferior calculados para a métrica e torná-los mais amplos. Aguarde alguns dias até que a interrupção não seja mais levada para o cálculo dos limites. Você também pode editar a regra de alerta para usar a opção Ignorar dados antes nas Configurações avançadas.
  • Se os dados tiverem sazonalidade semanal, mas não houver histórico suficiente disponível para a métrica, os limites calculados podem resultar em limites superiores e inferiores amplos. Por exemplo, o cálculo pode tratar dias úteis e fins de semana da mesma maneira e criar bordas amplas que nem sempre se ajustam aos dados. Esse problema deve se resolver depois que o histórico de métricas suficiente estiver disponível. Em seguida, a sazonalidade correta é detetada e os limites calculados são atualizados de acordo.

Um alerta de métricas foi acionado quando não devia

Se você acredita que seu alerta métrico não deveria ter disparado, mas disparou, as etapas a seguir podem ajudar a resolver o problema.

  1. Revise a lista de alertas disparados para localizar o alerta disparado. Selecione o alerta para ver os seus detalhes. Analise as informações fornecidas em Por que este alerta foi acionado? para ver o gráfico métrico, o valor da métrica e o valor do limite no momento em que o alerta foi acionado.

    Nota

    Se você estiver usando limites dinâmicos e achar que os limites não estavam corretos, forneça feedback usando o ícone de franzir a testa. Esse feedback afeta a pesquisa algorítmica de aprendizado de máquina e ajudará a melhorar as deteções futuras.

  2. Se você selecionou vários valores de dimensão para uma métrica, o alerta será acionado quando qualquer uma das séries temporais da métrica (conforme definido pela combinação de valores de dimensão) ultrapassar o limite. Para obter mais informações sobre como usar dimensões em alertas métricos, consulte Restringir o destino usando dimensões.

  3. Reveja a configuração da regra de alerta para se certificar de que está configurada corretamente:

    • Verifique se Tipo de agregação, granularidade de agregação (período) e valor de limite ou sensibilidade estão configurados conforme o esperado.
    • Para uma regra de alerta que usa limites dinâmicos, verifique se as configurações avançadas estão configuradas, pois Número de violações pode filtrar alertas e Ignorar dados antes pode afetar como os limites são calculados.

    Nota

    Os limiares dinâmicos requerem pelo menos 3 dias e 30 amostras métricas antes de se tornarem ativos.

  4. Se você estiver usando gráficos de métricas, certifique-se de que:

    • A Agregação selecionada no gráfico de métricas é a mesma que o tipo de Agregação na regra de alerta.
    • A granularidade de tempo selecionada é a mesma que a granularidade de agregação (Período) na regra de alerta e não está definida como Automática.
  5. Se o alerta disparou enquanto já existem alertas disparados que monitorizam os mesmos critérios que não foram resolvidos, verifique se a regra de alerta foi configurada para não resolver automaticamente os alertas. Isso significa que a regra de alerta é sem monitoração de estado e não resolve automaticamente os alertas disparados e não exige que um alerta disparado seja resolvido antes de disparar novamente na mesma série temporal. Para verificar se a regra de alerta está configurada para não resolver automaticamente:

    • Edite a regra de alerta no portal do Azure. Veja se a caixa de seleção Resolver alertas automaticamente na seção Detalhes da regra de alerta está desmarcada.
    • Revise o script usado para implantar a regra de alerta ou recupere a definição da regra de alerta. Verifique se a autoMitigate propriedade está definida como false.

Uma regra de alerta métrico com limites dinâmicos dispara demais ou é muito barulhenta

Se uma regra de alerta que usa limites dinâmicos for muito barulhenta ou acionar demais, talvez seja necessário reduzir a sensibilidade da regra de alerta de limites dinâmicos. Utilize uma das seguintes opções:

  • Sensibilidade do limiar: defina a sensibilidade como Baixa para ser mais tolerante a desvios.
  • Número de violações (em Configurações avançadas): Configure a regra de alerta para acionar somente se ocorrerem vários desvios dentro de um determinado período de tempo. Essa configuração torna a regra menos suscetível a desvios transitórios.

Uma regra de alerta de métrica com limites dinâmicos está mostrando valores que não estão dentro do intervalo de valores esperados

Quando um valor métrico exibe grandes flutuações, os limites dinâmicos podem construir um modelo amplo em torno dos valores métricos, o que pode resultar em um limite menor ou maior do que o esperado. Este cenário pode acontecer quando:

  • A sensibilidade é definida como baixa.

  • A métrica exibe um comportamento irregular com alta variância, que aparece como picos ou quedas nos dados.

    Considere tornar o modelo menos sensível escolhendo uma sensibilidade maior ou selecionando um período de retrospetiva maior. Você também pode usar a opção Ignorar dados antes para excluir uma irregularidade recente dos dados históricos usados para criar o modelo.

Problemas ao configurar regras de alerta de métricas

Não é possível encontrar a métrica para alertar em

Se você quiser alertar sobre uma métrica específica, mas não conseguir vê-la ao criar uma regra de alerta, verifique para determinar:

Não é possível encontrar a métrica para alertar: Métricas de convidado de máquinas virtuais

Para alertar sobre métricas do sistema operacional convidado de máquinas virtuais, como memória e espaço em disco, certifique-se de ter instalado o agente necessário para coletar esses dados no Azure Monitor Metrics para:

Para obter mais informações sobre como coletar dados do sistema operacional convidado de uma máquina virtual, consulte este site.

Nota

Se você configurou métricas de convidado para serem enviadas a um espaço de trabalho do Log Analytics, as métricas aparecerão no recurso de espaço de trabalho do Log Analytics e começarão a mostrar dados somente depois que você criar uma regra de alerta que as monitore. Para o fazer, siga os passos para configurar um alerta de métricas para os registos.

Atualmente, o monitoramento de uma métrica de convidado para várias máquinas virtuais com uma única regra de alerta não é suportado por alertas de métrica. Mas você pode usar uma regra de alerta de log. Para fazer isso, certifique-se de que as métricas de convidado sejam coletadas em um espaço de trabalho do Log Analytics e crie uma regra de alerta de log no espaço de trabalho.

Não é possível encontrar a dimensão métrica para alertar

Se você quiser alertar sobre valores de dimensão específicos de uma métrica, mas não conseguir encontrar esses valores:

  • Pode demorar alguns minutos até os valores de dimensão aparecerem na lista de Valores de dimensão.
  • Os valores de dimensão apresentados baseiam-se nos dados das métricas recolhidos no último dia.
  • Se o valor da dimensão ainda não tiver sido emitido ou não for mostrado, você poderá usar a opção Adicionar valor personalizado para adicionar um valor de dimensão personalizado.
  • Se quiser alertar sobre todos os valores possíveis de uma dimensão e até mesmo incluir valores futuros, escolha a opção Selecionar todos os valores atuais e futuros .
  • As dimensões das métricas personalizadas dos recursos do Application Insights estão desativadas por predefinição. Para ativar a obtenção de dimensões para estas métricas personalizadas, consulte Métricas baseadas em registos e pré-agregadas no Application Insights.

Você deseja configurar uma regra de alerta em uma métrica personalizada que ainda não foi emitida

Quando você cria uma regra de alerta de métrica, o nome da métrica é validado em relação à API de Definições de Métrica para garantir que ela exista. Em alguns casos, você deseja criar uma regra de alerta em uma métrica personalizada antes mesmo de ela ser emitida. Um exemplo é quando você usa um modelo do Gerenciador de Recursos para criar um recurso do Application Insights que emitirá uma métrica personalizada, juntamente com uma regra de alerta que monitora essa métrica.

Para evitar uma falha de implantação ao tentar validar as definições da métrica personalizada, use o skipMetricValidationcriteria parâmetro na seção da regra de alerta. Esse parâmetro faz com que a validação da métrica seja ignorada. Consulte o exemplo a seguir para saber como usar esse parâmetro em um modelo do Resource Manager. Para obter mais informações, consulte os exemplos de modelo completos do Gerenciador de Recursos para criar regras de alerta de métrica.

"criteria": {
    "odata.type": "Microsoft.Azure.Monitor.SingleResourceMultipleMetricCriteria",
        "allOf": [
            {
                "name" : "condition1",
                "metricName": "myCustomMetric",
                "metricNamespace": "myCustomMetricNamespace",
                "dimensions":[],
                "operator": "GreaterThan",
                "threshold" : 10,
                "timeAggregation": "Average",
                "skipMetricValidation": true
            }
        ]
    }

Nota

O uso do skipMetricValidation parâmetro também pode ser necessário quando você define uma regra de alerta em uma métrica personalizada existente que não é emitida há vários dias.

Avisos e erros ao configurar regras de alerta métrico

Os limites dinâmicos não estão atualmente disponíveis para este aviso de métrica

Os limites dinâmicos são suportados para a maioria das métricas, mas não para todas. Consulte Métricas não suportadas por limites dinâmicos para obter a lista de métricas.

A métrica não está disponível para o escopo selecionado. Isso pode acontecer se a métrica se aplicar apenas a uma versão específica ou erro de SKU

Analise a descrição da métrica em Métricas com suporte com o Azure Monitor para verificar se ela só está disponível em versões ou edições específicas do recurso ou desse tipo específico.

Por exemplo, em recursos da Base de Dados SQL ou Serviços de Ficheiros de Armazenamento, existem métricas específicas que apenas são suportadas em versões específicas do recurso.

Não há sinais disponíveis para exibir. Tente alterar o âmbito deste erro de regra de alerta

Este erro indica um problema no âmbito da regra de alerta. Isto pode acontecer ao editar uma regra de alerta com âmbito para um tipo de recurso que suporta a configuração de vários recursos (tal como Máquina virtual ou base de dados SQL) e tentar adicionar outro recurso do mesmo tipo, mas de uma região diferente. Alertas em vários recursos do mesmo tipo de regiões diferentes não são suportados nos alertas de Métricas.

Os limites de serviço para regras de alerta métrico são muito pequenos

O número permitido de regras de alerta métrico por assinatura está sujeito a limites de serviço.

Consulte Verificar o número de regras de alerta de métrica em uso para ver quantas regras de alerta de métrica estão em uso no momento.

Se você atingiu o limite de serviço, as etapas a seguir podem ajudar a resolver o problema:

  1. Tente excluir ou desativar as regras de alerta métrico que não são mais usadas.
  2. Mude para utilizar regras de alerta de métricas que monitorizem vários recursos. Com esse recurso, uma única regra de alerta pode monitorar vários recursos usando apenas uma regra de alerta contada em relação à cota. Para obter mais informações sobre esse recurso e os tipos de recursos suportados, consulte alertas de métrica.
  3. Se precisar que o limite de cota seja aumentado, abra uma solicitação de suporte e forneça:
    • IDs de assinatura para os quais o limite de cota precisa ser aumentado.
    • Tipo de recurso para o aumento da cota. Selecione Alertas métricos.
    • Limite de cota solicitado.

Próximos passos

Para obter informações gerais de solução de problemas sobre alertas e notificações, consulte Solução de problemas em alertas do Azure Monitor.