Tipos de alertas do Azure Monitor

Este artigo descreve os tipos de alertas do Azure Monitor que você pode criar e ajuda você a entender quando usar cada tipo de alerta.

Há quatro tipos de alertas:

Escolhendo o tipo certo de alerta

Esta tabela pode ajudar você a decidir quando usar o tipo de alerta. Para obter informações detalhadas sobre os preços, consulte a Página de preços.

Tipo de alerta Quando usar Informações sobre preços
Alerta de métrica Alertas de métrica são úteis quando você deseja ser alertado sobre dados que exigem pouca ou nenhuma manipulação. Os dados de métrica são armazenados no sistema já pré-computados, portanto, os alertas de métrica são mais baratos do que os alertas de log. Se os dados que você deseja monitorar estão disponíveis nos dados de métrica, é recomendado usar os alertas de métrica. Cada regra de alerta de métricas é cobrada com base no número de séries temporais monitoradas.
Alerta do log Os alertas de log permitem que você execute operações lógicas avançadas em seus dados. Se os dados que você deseja monitorar estiverem disponíveis em logs ou exigirem lógica avançada, você poderá usar os recursos robustos do KQL para manipulação de dados usando alertas de log. Os alertas de log são mais caros do que os alertas de métrica. Cada regra de alerta de log é cobrada com base no intervalo em que a consulta de log é avaliada (uma avaliação de consulta mais frequente resulta em um custo mais alto). Além disso, para alertas de log configurados como monitoramento em escala, o custo também dependerá do número de séries temporais criadas pelas dimensões resultantes da consulta.
Alerta do log de atividades Os logs de atividades fornecem auditoria de todas as ações que ocorreram nos recursos. Use alertas de log de atividades para ser alertado quando um evento específico acontecer com um recurso, por exemplo, uma reinicialização, um desligamento ou a criação ou exclusão de um recurso. Para saber mais, confira a página de preço.

Alertas de métricas

Uma regra de alerta de métrica monitora um recurso avaliando as condições nas métricas de recurso em intervalos regulares. Se as condições forem atendidas, um alerta será acionado. Uma série temporal de métrica é uma série de valores de métrica capturados em um período de tempo.

Você pode criar regras usando estas métricas:

As regras de alerta de métrica incluem estes recursos:

O destino da regra de alerta de métrica pode ser:

  • Um único recurso, como uma VM. Consulte este artigo para obter tipos de recursos com suporte.
  • Vários recursos do mesmo tipo na mesma região do Azure, como um grupo de recursos.

Condições múltiplas

Ao criar uma regra de alerta para um único recurso, você pode aplicar várias condições. Um exemplo para esse tipo de regra de alerta seria monitorar uma máquina virtual do Azure e alertar quando "o percentual de CPU for maior que 90%" e "o comprimento da fila for de mais de 300 itens". Quando uma regra de alerta tem várias condições, o alerta é acionado quando todas as condições na regra de alerta são verdadeiras e é resolvida quando pelo menos uma das condições não é mais verdadeira para três verificações consecutivas.

Restringir o destino usando Dimensões

As dimensões são pares nome-valor que contêm dados adicionais sobre o valor da métrica. O uso de dimensões permite filtrar as métricas e monitorar séries temporais específicas, em vez de monitorar a agregação de todos os valores dimensionais. Por exemplo, a métrica Transações de uma conta de armazenamento tem uma dimensão chamada Nome da API, que descreve o nome da API chamada por cada transação (por exemplo, GetBlob, DeleteBlob, PutPage). Você pode optar por um alerta acionado quando houver um número alto de transações em qualquer nome de API (que é os dados agregados) ou pode usar dimensões para dividi-lo ainda mais para alertar somente quando o número de transações for alto para nomes de API específicos. Se você usar mais de uma dimensão, uma regra de alerta de métrica de várias dimensões também pode monitorar vários valores de dimensão de dimensões diferentes de uma métrica. Nesse caso, a regra de alerta monitora separadamente todas as combinações de valor das dimensões. Consulte este artigo para obter instruções detalhadas sobre como usar dimensões nas regras de alerta de métrica.

Criar alertas centrados em recursos usando a divisão por dimensões

Para monitorar a mesma condição em vários recursos do Azure, você pode usar a divisão por dimensões. Dividir por dimensões permite criar alertas centrados em escala para uma assinatura ou grupo de recursos. Os alertas são divididos em alertas separados agrupando combinações. A divisão na coluna de ID de recurso do Azure transforma o recurso especificado no destino do alerta.

Você também pode decidir não dividir quando quiser uma condição em vários recursos no escopo. Por exemplo, se você quiser criar um alerta se o uso da CPU de pelo menos cinco computadores no escopo do grupo de recursos estiver acima de 80%.

Monitorar vários recursos

Você pode monitorar em escala aplicando a mesma regra de alerta de métrica a vários recursos do mesmo tipo para recursos que existem na mesma região do Azure. Notificações individuais são enviadas para cada recurso monitorado.

As métricas de plataforma para esses serviços nas seguintes nuvens do Azure têm suporte:

Serviço Azure Global Governo China
Máquinas virtuais* Sim Sim Sim
Bancos de dados do SQL Server Sim Sim Sim
Pools elásticos do SQL Server Sim Sim Sim
Pools de capacidade de arquivos do NetApp Sim Sim Sim
Volumes de arquivos do NetApp Sim Sim Sim
Cofres de chaves Sim Sim Sim
Cache Redis do Azure Sim Sim Sim
Dispositivos do Azure Stack Edge Sim Sim Sim
Cofres dos Serviços de Recuperação Sim No No
Banco de Dados do Azure para PostgreSQL – Servidores Flexíveis Sim Sim Sim

Observação

Não há suporte para alertas de métrica de vários recursos para os seguintes cenários:

  • Alertas sobre as métricas de convidado das máquinas virtuais
  • Alertas sobre métricas de rede de máquina virtual (rede no total, total de saída de rede, fluxos de entrada, fluxos de saída, taxa de criação máxima de fluxos de entrada, taxa de criação máxima de fluxos de saída).

Você pode especificar o escopo de monitoramento de uma única regra de alerta de métrica de uma destas três maneiras. Por exemplo, com máquinas virtuais, você pode especificar o escopo como:

  • uma lista de máquinas virtuais (em uma região do Azure) dentro de uma assinatura
  • todas as máquinas virtuais (em uma única região do Azure) em um ou mais grupos de recursos em uma assinatura
  • todas as máquinas virtuais (em uma região do Azure) em uma assinatura

Limites dinâmicos

Os limites dinâmicos usam aprendizado de máquina avançado (ML) para:

  • Saber o comportamento histórico das métricas
  • Identificar padrões e adaptar-se às alterações de métrica ao longo do tempo, como padrões por hora, diários ou semanais.
  • Reconhecer anomalias que indicam possíveis problemas de serviço
  • Calcular o limite mais apropriado para a métrica

O Machine Learning usa continuamente novos dados para saber mais e tornar o limite mais preciso. Como o sistema se adapta ao comportamento das métricas ao longo do tempo e alertas com base em desvios de padrão, você não precisa saber o limite "certo" para cada métrica.

Os limites dinâmicos ajudam a:

  • Criar alertas escalonáveis para centenas de séries de métricas com uma regra de alerta. Se você tiver menos regras de alerta, gastará menos tempo para criar e gerenciar regras de alertas.
  • Criar regras sem precisar saber qual limite configurar
  • Configurar alertas de métrica usando conceitos de alto nível sem amplo conhecimento de domínio sobre a métrica
  • Evitar ruído (baixa precisão) ou limites amplos (baixo recall) que não têm um padrão esperado
  • Manipular métricas com ruído (como CPU ou memória do computador) e métricas com baixa dispersão (como disponibilidade e taxa de erros).

Consulte este artigo para obter instruções detalhadas sobre como usar limites dinâmicos nas regras de alerta de métrica.

Alertas de registro

Uma regra de alerta de log monitora um recurso usando uma consulta do Log Analytics para avaliar os logs de recursos em uma frequência definida. Se as condições forem atendidas, um alerta será acionado. Como você pode usar consultas do Log Analytics, pode executar operações lógicas avançadas em seus dados e usar os recursos robustos de KQL para manipular dados de log.

O destino da regra de alerta de log pode ser:

  • Um único recurso, como uma VM.
  • Vários recursos do mesmo tipo na mesma região do Azure, como um grupo de recursos. No momento, isso está disponível para tipos de recursos selecionados.
  • Vários recursos usando a consulta entre recursos.

Os alertas de log podem medir duas coisas diferentes que podem ser usadas para monitorar cenários diferentes:

  • Linhas da tabela: conta o número de linhas retornadas pela consulta e pode ser usado para trabalhar com eventos como logs de eventos do Windows, syslog, exceções de aplicativo.
  • Cálculo de uma coluna numérica: faz um cálculo com base em uma coluna numérica e pode ser usado para incluir qualquer número de recursos. Por exemplo, percentual de CPU.

Você pode configurar se os alertas de log estiverem com estado ou sem estado (atualmente em versão prévia).

Observação

Os alertas de log funcionam melhor quando você está tentando detectar dados específicos nos logs, em vez de quando você está tentando detectar a falta de dados nos logs. Como os logs são dados semiestruturados, eles são inerentemente mais latentes do que os dados de métrica em informações como uma pulsação de VM. Para evitar erros ao tentar detectar a falta de dados nos logs, considere o uso de alertas de métrica. Você pode enviar dados para o repositório de métricas de logs usando alertas de métricas para logs.

Dimensões nas regras de alerta de log

Você pode usar dimensões ao criar regras de alerta de log para monitorar os valores de várias instâncias de um recurso com uma regra. Por exemplo, você pode monitorar o uso da CPU em várias instâncias executando seu site ou aplicativo. Cada instância é monitorada individualmente as notificações são enviadas para cada instância.

Divisão por dimensões nas regras de alerta de log

Para monitorar a mesma condição em vários recursos do Azure, você pode usar a divisão por dimensões. Dividir por dimensões permite criar alertas centrados em escala para uma assinatura ou grupo de recursos. Os alertas são divididos em alertas separados agrupando combinações usando colunas numéricas ou de cadeia de caracteres. A divisão na coluna de ID de recurso do Azure transforma o recurso especificado no destino do alerta. Você também pode decidir não dividir quando quiser uma condição em vários recursos no escopo. Por exemplo, se você quiser criar um alerta se o uso da CPU de pelo menos cinco computadores no escopo do grupo de recursos estiver acima de 80%.

Usando a API

Gerencie novas regras em seus workspaces usando a API ScheduledQueryRules.

Observação

Alertas de log do Log Analytics usados para serem gerenciados usando a API herdada de Alerta do Log Analytics. Saiba mais sobre como alternar para a API atual ScheduledQueryRules.

Alertas de log na fatura do Azure

Os alertas de log são listados no provedor de recursos microsoft.insights/scheduledqueryrules com:

  • Alertas de log no Application Insights mostrados com o nome exato do recurso, juntamente com o grupo de recursos e propriedades do alerta.
  • Alertas de log no Log Analytics mostrados com o nome exato do recurso, juntamente com o grupo de recursos e propriedades do alerta, quando criados usando scheduledQueryRules API.
  • Os alertas de log criados a partir da API herdada do Log Analytics não são rastreados pelos Recursos do Azure e não têm nomes exclusivos de recursos aplicados. Esses alertas ainda são criados no microsoft.insights/scheduledqueryrules como recursos ocultos, que têm essa estrutura de nomenclatura de recurso <WorkspaceName>|<savedSearchId>|<scheduleId>|<ActionId>. Alertas de log na API herdada são mostrados com o nome do recurso oculto acima, juntamente com as propriedades de alerta e do grupo de recursos.

Observação

Os caracteres de recurso sem suporte, como <, >, %, &, ?, / , são substituídos por _ nos nomes de recursos ocultos e isso também refletirá nas informações de cobrança.

Alertas do log de atividades

Um alerta do log de atividades monitora um recurso verificando os logs de atividades para um novo evento de log de atividades que corresponde às condições definidas.

Talvez você queira usar alertas de log de atividades para esses tipos de cenários:

  • Quando uma operação específica ocorre em recursos em um grupo de recursos ou assinatura específico. Por exemplo, talvez você queira ser notificado quando:
    • Qualquer máquina virtual em um grupo de recursos de produção é excluída.
    • Quaisquer funções novas são atribuídas a um usuário em sua assinatura.
  • Ocorre um evento de integridade do serviço. Os eventos de integridade de serviço incluem uma notificação de incidentes e eventos de manutenção que se aplicam aos recursos em sua assinatura.

Crie um alerta do log de atividades em:

  • Qualquer uma das categorias de evento do log de atividades, exceto em eventos de alerta.
  • Qualquer evento de log de atividades na propriedade de nível superior no objeto JSON.

As regras de alerta do log de atividades são recursos do Azure e, portanto, podem ser criados usando um modelo do Azure Resource Manager. Eles também podem ser criados, atualizados ou excluídos no portal do Azure.

Um alerta do log de atividades só monitorará eventos na assinatura na qual o alerta foi criado.

Alertas de detecção inteligente

Após a configuração do Application Insights para seu projeto e se o aplicativo gerar certa quantidade mínima de dados, a Detecção Inteligente de anomalias de falha levará 24 horas para compreender o comportamento normal do aplicativo antes que ele seja ligado e possa enviar alertas. O desempenho do seu aplicativo tem um padrão típico de comportamento. Algumas solicitações ou chamadas de dependência serão mais propensas a falhas do que outras; a taxa geral de falha poderá aumentar à medida que a carga crescer. A Detecção Inteligente usa aprendizado de máquina para encontrar essas anomalias. A Detecção Inteligente monitora os dados recebidos do aplicativo, especialmente as taxas de falha. O Application Insights alertará você automaticamente, quase em tempo real, se seu aplicativo Web experimentar um aumento anormal de solicitações com falha.

Conforme os dados entram no Application Insights vindos do aplicativo Web, a Detecção Inteligente compara o comportamento atual com os padrões vistos nos últimos dias. Se for observado um aumento anormal na taxa de falha em comparação com o desempenho anterior, uma análise será disparada. Para ajudar você na triagem e no diagnóstico do problema, uma análise das características das falhas e dados relacionados do aplicativo são fornecidos nos detalhes do alerta. Também há links para portal do Application Insights, onde você pode obter um diagnóstico mais detalhado. O recurso não precisa de qualquer configuração, pois usa algoritmos de aprendizado de máquina para prever a taxa normal de falhas.

Embora os alertas de métrica informem que pode haver um problema, a Detecção Inteligente inicia o trabalho de diagnóstico para você, executando grande parte da análise que, de outra forma, você teria que fazer por conta própria. Você obtém os resultados empacotados organizadamente, o que ajuda a chegar rapidamente à raiz do problema.

A detecção inteligente funciona com aplicativos Web hospedados na nuvem ou em seus servidores que geram dados de dependência ou de solicitação de aplicativo.

Próximas etapas