Tipos de alertas do Azure Monitor

Este artigo descreve os tipos de alertas do Azure Monitor que pode criar. Ajuda-o a compreender quando utilizar cada tipo de alerta.

Os tipos de alertas são:

Escolher o tipo de alerta certo

As informações nesta tabela podem ajudá-lo a decidir quando deve utilizar cada tipo de alerta. Para obter mais informações sobre preços, consulte a página de preços.

Tipo de alerta Quando utilizar Informações de preços
Alerta de métrica Os dados de métricas são armazenados no sistema já pré-calculado. Os alertas de métricas são úteis quando quer ser alertado sobre dados que requerem pouca ou nenhuma manipulação. Utilize alertas de métricas se os dados que pretende monitorizar estiverem disponíveis nos dados de métricas. Cada regra de alerta de métrica é cobrada com base no número de séries temporais que são monitorizadas.
Alerta de registo Pode utilizar alertas de registo para realizar operações lógicas avançadas nos seus dados. Se os dados que pretende monitorizar estiverem disponíveis nos registos ou precisarem de lógica avançada, pode utilizar as funcionalidades robustas do Linguagem de Pesquisa Kusto (KQL) para manipulação de dados através de alertas de registo. Cada regra de alerta de registo é faturada com base no intervalo em que a consulta de registo é avaliada. A avaliação de consultas mais frequente resulta num custo mais elevado. Para alertas de registo configurados para monitorização em escala, o custo também depende do número de séries de tempo criadas pelas dimensões resultantes da consulta.
Alerta do registo de atividades Os registos de atividades fornecem uma auditoria de todas as ações que ocorreram nos recursos. Utilize alertas do registo de atividades para ser alertado quando um evento específico acontece a um recurso, como um reinício, um encerramento ou a criação ou eliminação de um recurso. Os alertas do Service Health e os alertas de Resource Health informam-no quando existe um problema com um dos seus serviços ou recursos. Para obter mais informações, veja a página de preços.
Alertas do Prometheus (pré-visualização) Os alertas do Prometheus são utilizados principalmente para alertar sobre o desempenho e o estado de funcionamento dos clusters do Kubernetes, incluindo Azure Kubernetes Service. As regras de alerta baseiam-se no PromQL, que é uma linguagem de consulta open source. Os alertas do Prometheus não são cobrados durante o período de pré-visualização.

Alertas de métricas

Uma regra de alerta de métrica monitoriza um recurso ao avaliar as condições nas métricas de recursos em intervalos regulares. Se as condições se cumprirem, é acionado um alerta. Uma série temporal de métricas é uma série de valores de métricas capturados durante um período de tempo.

Pode criar regras com estas métricas:

As regras de alerta de métricas incluem estas funcionalidades:

O destino da regra de alerta de métricas pode ser:

Múltiplas condições

Quando cria uma regra de alerta para um único recurso, pode aplicar várias condições. Por exemplo, pode criar uma regra de alerta para monitorizar uma máquina virtual do Azure e alertar quando "Percentagem de CPU é superior a 90%" e "O comprimento da fila é superior a 300 itens". Quando uma regra de alerta tem várias condições, o alerta é acionado quando todas as condições na regra de alerta são verdadeiras e são resolvidas quando pelo menos uma das condições deixa de ser verdadeira durante três verificações consecutivas.

Restringir o destino com Dimensões

Para obter instruções sobre como utilizar dimensões em regras de alerta de métricas, veja Monitorizar várias séries de tempo numa única regra de alerta de métricas.

Criar alertas centrados em recursos ao utilizar a divisão por dimensões

Para monitorizar a mesma condição em vários recursos do Azure, pode utilizar a divisão por dimensões. Quando utiliza a divisão por dimensões, pode criar alertas centrados em recursos à escala para uma subscrição ou grupo de recursos. Os alertas são divididos em alertas separados por combinações de agrupamento. Dividir numa coluna de ID de recurso do Azure torna o recurso especificado no destino do alerta.

Também pode decidir não dividir quando pretende que uma condição seja aplicada a vários recursos no âmbito. Por exemplo, poderá querer acionar um alerta se, pelo menos, cinco máquinas no âmbito do grupo de recursos tiverem uma utilização da CPU superior a 80%.

Monitorizar vários recursos

Pode monitorizar em escala ao aplicar a mesma regra de alerta de métrica a vários recursos do mesmo tipo para recursos que existem na mesma região do Azure. São enviadas notificações individuais para cada recurso monitorizado.

As métricas da plataforma para estes serviços nas seguintes clouds do Azure são suportadas:

Serviço Global Azure Administração Pública China
Máquinas virtuais Yes Yes Yes
bases de dados SQL Server Yes Yes Yes
SQL Server conjuntos elásticos Yes Yes Yes
Conjuntos de capacidade de ficheiros NetApp Yes Yes Yes
Volumes de ficheiros NetApp Yes Yes Yes
Azure Key Vault Yes Yes Yes
Cache do Azure para Redis Yes Yes Yes
Dispositivos Azure Stack Edge Yes Yes Yes
Cofres dos Serviços de Recuperação Yes No No
Base de Dados do Azure para PostgreSQL – Servidor Flexível Yes Yes Yes

Nota

Os alertas de métricas de vários recursos não são suportados para:

  • Alertas sobre as métricas de convidado da VM.
  • Alertas sobre métricas de rede de VM (Total de Rede, Total de Saída da Rede, Fluxos de Entrada, Fluxos de Saída, Taxa de Criação Máxima de Fluxos de Entrada e Taxa de Criação Máxima de Fluxos de Saída).

Pode especificar o âmbito da monitorização com uma única regra de alerta de métrica de uma de três formas. Por exemplo, com as VMs, pode especificar o âmbito como:

  • Uma lista de VMs numa região do Azure numa subscrição.
  • Todas as VMs numa região do Azure num ou mais grupos de recursos numa subscrição.
  • Todas as VMs numa região do Azure numa subscrição.

Limiares dinâmicos

Os limiares dinâmicos utilizam machine learning avançado para:

  • Conheça o comportamento histórico das métricas.
  • Identifique padrões e adapte-se a alterações de métricas ao longo do tempo, como padrões de hora a hora, diariamente ou semanais.
  • Reconhecer anomalias que indicam possíveis problemas de serviço.
  • Calcule o limiar mais adequado para a métrica.

O machine learning utiliza continuamente novos dados para saber mais e tornar o limiar mais preciso. Uma vez que o sistema se adapta ao comportamento das métricas ao longo do tempo e alertas com base em desvios do padrão, não tem de saber o limiar "certo" para cada métrica.

Os limiares dinâmicos ajudam-no:

  • Crie alertas dimensionáveis para centenas de séries de métricas com uma regra de alerta. Se tiver menos regras de alerta, passa menos tempo a criar e a gerir regras de alertas.
  • Crie regras sem ter de saber qual o limiar a configurar.
  • Configure alertas de métricas com conceitos de alto nível sem um vasto conhecimento de domínio sobre a métrica.
  • Evite limiares ruidosos (de baixa precisão) ou largos (baixa recolha) que não tenham um padrão esperado.
  • Processe métricas ruidosas (como CPU ou memória do computador) e métricas com dispersão baixa (como disponibilidade e taxa de erros).

Veja limiares dinâmicos para obter instruções detalhadas sobre a utilização de limiares dinâmicos nas regras de alerta de métricas.

Alertas de registo

Uma regra de alerta de registo monitoriza um recurso através de uma consulta do Log Analytics para avaliar os registos de recursos numa frequência definida. Se as condições se cumprirem, é acionado um alerta. Como pode utilizar consultas do Log Analytics, pode realizar operações lógicas avançadas nos seus dados e utilizar as funcionalidades de KQL robustas para manipular dados de registo.

O destino da regra de alerta de registo pode ser:

  • Um único recurso, como uma VM.
  • Um único contentor de recursos, como um grupo de recursos ou uma subscrição.
  • Vários recursos que utilizam uma consulta entre recursos.

Os alertas de registo podem medir duas coisas diferentes, que podem ser utilizadas para diferentes cenários de monitorização:

  • Linhas de tabela: o número de linhas devolvidas pode ser utilizado para trabalhar com eventos como registos de eventos do Windows, Syslog e exceções de aplicações.
  • Cálculo de uma coluna numérica: os cálculos baseados em qualquer coluna numérica podem ser utilizados para incluir qualquer número de recursos. Um exemplo é a percentagem da CPU.

Pode configurar se os alertas de registo estiverem com estado ou sem estado. Esta funcionalidade encontra-se em pré-visualização.

Nota

Os alertas de registo funcionam melhor quando tenta detetar dados específicos nos registos, ao contrário de quando está a tentar detetar a falta de dados nos registos. Uma vez que os registos são dados semiestruturados, são inerentemente mais latentes do que os dados de métricas em informações como um heartbeat de VM. Para evitar falhas ao tentar detetar a falta de dados nos registos, considere utilizar alertas de métricas. Pode enviar dados para o arquivo de métricas a partir de registos através de alertas de métricas para registos.

Dimensões nas regras de alerta de registo

Pode utilizar dimensões quando cria regras de alerta de registo para monitorizar os valores de várias instâncias de um recurso com uma regra. Por exemplo, pode monitorizar a utilização da CPU em várias instâncias que executam o seu site ou aplicação. Cada instância é monitorizada individualmente. São enviadas notificações para cada instância.

Dividir por dimensões nas regras de alerta de registo

Para monitorizar a mesma condição em vários recursos do Azure, pode utilizar a divisão por dimensões. Quando utiliza a divisão por dimensões, pode criar alertas centrados em recursos em escala para uma subscrição ou grupo de recursos. Os alertas são divididos em alertas separados ao agrupar combinações com colunas numéricas ou de cadeia. Dividir na coluna ID de recurso do Azure torna o recurso especificado no destino do alerta.

Também pode decidir não dividir quando pretende que uma condição seja aplicada a vários recursos no âmbito. Por exemplo, poderá querer acionar um alerta se, pelo menos, cinco máquinas no âmbito do grupo de recursos tiverem uma utilização da CPU superior a 80%.

Utilizar a API

Faça a gestão de novas regras nas áreas de trabalho com a API ScheduledQueryRules .

Nota

Alertas de registo do Log Analytics utilizados para serem geridos com a API de Alertas do Log Analytics legada. Saiba mais sobre como mudar para a API ScheduledQueryRules atual.

Registar alertas na fatura do Azure

Os alertas de registo estão listados no fornecedor microsoft.insights/scheduledqueryrules de recursos com:

  • Os alertas de registo no Application Insights são apresentados com o nome exato do recurso, juntamente com as propriedades de grupo de recursos e alertas.
  • Os alertas de registo no Log Analytics são apresentados com o nome exato do recurso, juntamente com o grupo de recursos e as propriedades de alerta quando são criados através da API scheduledQueryRules.
  • Os alertas de registo criados a partir da API do Log Analytics legada não são controlados pelos recursos do Azure e não têm nomes de recursos exclusivos impostos. Estes alertas ainda são criados como microsoft.insights/scheduledqueryrules recursos ocultos, que têm a estrutura <WorkspaceName>|<savedSearchId>|<scheduleId>|<ActionId>de nomenclatura de recursos . Os alertas de registo na API legada são apresentados com o nome de recurso oculto anterior, juntamente com o grupo de recursos e as propriedades de alerta.

Nota

Carateres de recursos não suportados, como <, >, %, &, ? e /são substituídos por um caráter de sublinhado (_) nos nomes de recursos ocultos. Esta alteração de caráter também se reflete nas informações de faturação.

Alertas do registo de atividades

Um alerta do registo de atividades monitoriza um recurso ao verificar os registos de atividades de um novo evento de registo de atividades que corresponda às condições definidas.

Poderá querer utilizar alertas de registo de atividades para estes tipos de cenários:

  • Quando ocorre uma operação específica em recursos num grupo de recursos ou subscrição específico. Por exemplo, poderá querer ser notificado quando:
    • Uma VM num grupo de recursos de produção é eliminada.
    • São atribuídas novas funções a um utilizador na sua subscrição.
  • Ocorre um evento do Service Health. Os eventos do Service Health incluem notificações de incidentes e eventos de manutenção que se aplicam aos recursos na sua subscrição.

Pode criar um alerta de registo de atividades em:

  • Qualquer uma das categorias de eventos do registo de atividades, exceto em eventos de alerta.
  • Qualquer evento de registo de atividades numa propriedade de nível superior no objeto JSON.

As regras de alerta do registo de atividades são recursos do Azure, pelo que podem ser criadas com um modelo de Resource Manager do Azure. Também podem ser criados, atualizados ou eliminados no portal do Azure.

Um alerta do registo de atividades monitoriza apenas eventos na subscrição em que o alerta é criado.

Alertas do Service Health

Os alertas do Service Health são um tipo de alerta de atividade. O Service Health informa-o sobre interrupções, atividades de manutenção planeada e outros avisos de estado de funcionamento porque a experiência autenticada do Service Health sabe que serviços e recursos utiliza atualmente.

A melhor forma de utilizar o Service Health é configurar alertas do Service Health para notificá-lo através dos seus canais de comunicação preferenciais quando os problemas de serviço, a manutenção planeada ou outras alterações podem afetar os serviços e regiões do Azure que utiliza.

alertas de Resource Health

Resource Health alertas são um tipo de alerta de atividade. A Resource Health descrição geral ajuda-o a diagnosticar e obter suporte para problemas de serviço que afetam os seus recursos do Azure. Comunica o estado de funcionamento atual e anterior dos recursos.

Resource Health depende de sinais de diferentes serviços do Azure para avaliar se um recurso está em bom estado de funcionamento. Se um recurso estiver em mau estado de funcionamento, Resource Health analisa mais informações para determinar a origem do problema. Também comunica as ações que a Microsoft está a tomar para corrigir o problema e identifica as ações que pode tomar para o resolver.

Alertas de deteção inteligente

Depois de configurar o Application Insights para o seu projeto e a sua aplicação gerar uma determinada quantidade de dados, a deteção inteligente demora 24 horas a aprender o comportamento normal da sua aplicação. O desempenho da sua aplicação tem um padrão de comportamento típico. Alguns pedidos ou chamadas de dependência serão mais propensos a falhas do que outros e a taxa de falha geral pode aumentar à medida que a carga aumenta.

A deteção inteligente utiliza machine learning para encontrar estas anomalias. A deteção inteligente monitoriza os dados recebidos da sua aplicação e, em particular, as taxas de falha. O Application Insights alerta-o automaticamente quase em tempo real se a sua aplicação Web tiver um aumento anormal na taxa de pedidos falhados.

À medida que os dados chegam ao Application Insights a partir da sua aplicação Web, a deteção inteligente compara o comportamento atual com os padrões vistos nos últimos dias. Se existir um aumento anormal da taxa de falhas em comparação com o desempenho anterior, é acionada uma análise.

Para ajudá-lo a fazer a triagem e diagnosticar um problema, é fornecida uma análise das características das falhas e dos dados relacionados da aplicação nos detalhes do alerta. Também existem ligações para o portal do Application Insights para um diagnóstico mais aprofundado. A funcionalidade não precisa de configuração ou configuração porque utiliza algoritmos de machine learning para prever a taxa de falhas normal.

Embora os alertas de métricas lhe digam que pode haver um problema, a deteção inteligente inicia o trabalho de diagnóstico automaticamente. Executa grande parte da análise que teria de fazer sozinho. Obtém os resultados cuidadosamente empacotados, o que o ajuda a chegar rapidamente à raiz do problema.

A deteção inteligente funciona para aplicações Web alojadas na cloud ou nos seus próprios servidores que geram pedidos de aplicação ou dados de dependência.

Alertas do Prometheus (pré-visualização)

Os alertas do Prometheus baseiam-se em valores de métricas armazenados nos serviços geridos do Azure Monitor para Prometheus. São acionados quando o resultado de uma consulta PromQL é resolvido como verdadeiro. Os alertas do Prometheus são apresentados e geridos como outros tipos de alerta quando são acionados, mas são configurados com um grupo de regras prometheus. Para obter mais informações, veja Grupos de regras no serviço gerido do Azure Monitor para Prometheus.

Passos seguintes