Tipos de alertas do Azure Monitor

Este artigo descreve os tipos de alertas do Azure Monitor que pode criar e ajuda-o a compreender quando utilizar cada tipo de alerta.

Existem quatro tipos de alertas:

Escolher o tipo de alerta certo

Esta tabela pode ajudá-lo a decidir quando deve utilizar o tipo de alerta. Para obter informações mais detalhadas sobre os preços, consulte a página de preços.

Tipo de Alerta Quando Utilizar Informações de Preços
Alerta de métrica Os dados de métricas são armazenados no sistema já pré-calculado. Os alertas de métricas são úteis quando quer ser alertado sobre dados que requerem pouca ou nenhuma manipulação. Recomendamos que utilize alertas de métricas se os dados que pretende monitorizar estiverem disponíveis nos dados de métricas. Cada regra de alerta de métrica é cobrada com base no número de séries temporais que são monitorizadas.
Alerta de registo Os alertas de registo permitem-lhe realizar operações lógicas avançadas nos seus dados. Se os dados que pretende monitorizar estiverem disponíveis nos registos ou exigirem lógica avançada, pode utilizar as funcionalidades robustas do KQL para manipulação de dados através de alertas de registo. Cada regra de alerta de registo é faturada com base no intervalo em que a consulta de registo é avaliada (a avaliação de consultas mais frequente resulta num custo mais elevado). Além disso, para alertas de registo configurados para monitorização em escala, o custo também depende do número de séries de tempo criadas pelas dimensões resultantes da consulta.
Alerta do Registo de Atividades Os registos de atividades fornecem uma auditoria de todas as ações que ocorreram nos recursos. Utilize alertas do registo de atividades para ser alertado quando um evento específico acontece a um recurso, por exemplo, um reinício, um encerramento ou a criação ou eliminação de um recurso. Os alertas do Service Health e os alertas de Resource Health podem informá-lo quando existe um problema com um dos seus serviços ou recursos. Para obter mais informações, veja a página de preços.
Alertas do Prometheus (pré-visualização) Os alertas do Prometheus são utilizados principalmente para alertar sobre o desempenho e o estado de funcionamento dos clusters do Kubernetes (incluindo o AKS). As regras de alerta baseiam-se no PromQL, que é uma linguagem de consulta open source. Os alertas do Prometheus não são cobrados durante o período de pré-visualização.

Alertas de métricas

Uma regra de alerta de métrica monitoriza um recurso ao avaliar as condições nas métricas de recursos em intervalos regulares. Se as condições se cumprirem, é acionado um alerta. Uma série temporal de métricas é uma série de valores de métricas capturados durante um período de tempo.

Pode criar regras com estas métricas:

As regras de alerta de métricas incluem estas funcionalidades:

O destino da regra de alerta de métricas pode ser:

  • Um único recurso, como uma VM. Veja este artigo para obter os tipos de recursos suportados.
  • Vários recursos do mesmo tipo na mesma região do Azure, como um grupo de recursos.

Múltiplas condições

Quando cria uma regra de alerta para um único recurso, pode aplicar várias condições. Por exemplo, pode criar uma regra de alerta para monitorizar uma máquina virtual do Azure e alertar quando "Percentagem de CPU é superior a 90%" e "O comprimento da fila é superior a 300 itens". Quando uma regra de alerta tem várias condições, o alerta é acionado quando todas as condições na regra de alerta são verdadeiras e são resolvidas quando pelo menos uma das condições deixa de ser verdadeira durante três verificações consecutivas.

Restringir o destino com Dimensões

As dimensões são pares nome-valor que contêm mais dados sobre o valor da métrica. A utilização de dimensões permite-lhe filtrar as métricas e monitorizar séries temporológicas específicas, em vez de monitorizar a agregação de todos os valores dimensional. Por exemplo, a métrica Transações de uma conta de armazenamento pode ter uma dimensão de nome de API que contém o nome da API chamada por cada transação (por exemplo, GetBlob, DeleteBlob, PutPage). Pode optar por acionar um alerta quando existe um número elevado de transações em qualquer nome de API (que são os dados agregados) ou pode utilizar dimensões para o dividir ainda mais para alertar apenas quando o número de transações for elevado para nomes de API específicos. Se utilizar mais do que uma dimensão, a regra de alerta de métricas pode monitorizar valores de várias dimensões de dimensões diferentes de uma métrica. A regra de alerta monitoriza separadamente todas as combinações de valores de dimensões. Veja este artigo para obter instruções detalhadas sobre como utilizar dimensões em regras de alerta de métricas.

Criar alertas centrados em recursos com a divisão por dimensões

Para monitorizar a mesma condição em vários recursos do Azure, pode utilizar a divisão por dimensões. Dividir por dimensões permite-lhe criar alertas centrados em recursos em escala para uma subscrição ou grupo de recursos. Os alertas são divididos em alertas separados por combinações de agrupamento. Dividir na coluna ID de recurso do Azure torna o recurso especificado no destino do alerta.

Também pode decidir não dividir quando pretende que uma condição seja aplicada a vários recursos no âmbito. Por exemplo, se quiser acionar um alerta se, pelo menos, cinco máquinas no âmbito do grupo de recursos tiverem uma utilização da CPU superior a 80%.

Monitorizar vários recursos

Pode monitorizar em escala ao aplicar a mesma regra de alerta de métrica a vários recursos do mesmo tipo para recursos que existem na mesma região do Azure. São enviadas notificações individuais para cada recurso monitorizado.

As métricas da plataforma para estes serviços nas seguintes clouds do Azure são suportadas:

Serviço Global Azure Administração Pública China
Máquinas virtuais* Yes Yes Yes
Bases de dados do SQL Server Yes Yes Yes
Conjuntos elásticos do SQL Server Yes Yes Yes
Conjuntos de capacidade de ficheiros NetApp Yes Yes Yes
Volumes de ficheiros NetApp Yes Yes Yes
Cofres de chaves Yes Yes Yes
Cache do Azure para Redis Yes Yes Yes
Dispositivos do Azure Stack Edge Yes Yes Yes
Cofres dos Serviços de Recuperação Yes No No
Base de Dados do Azure para PostgreSQL - Servidores Flexíveis Yes Yes Yes

Nota

Os alertas de métricas de vários recursos não são suportados para os seguintes cenários:

  • Alertas sobre as métricas de convidado das máquinas virtuais
  • Alertas sobre as métricas de rede das máquinas virtuais (Rede No Total, Total de Saída da Rede, Fluxos de Entrada, Fluxos de Saída, Taxa de Criação Máxima de Fluxos de Entrada, Taxa de Criação Máxima de Fluxos de Saída).

Pode especificar o âmbito da monitorização com uma única regra de alerta de métricas de uma de três formas. Por exemplo, com máquinas virtuais, pode especificar o âmbito como:

  • uma lista de máquinas virtuais (numa região do Azure) numa subscrição
  • todas as máquinas virtuais (numa região do Azure) num ou mais grupos de recursos numa subscrição
  • todas as máquinas virtuais (numa região do Azure) numa subscrição

Limiares dinâmicos

Os limiares dinâmicos utilizam machine learning avançado (ML) para:

  • Conhecer o comportamento histórico das métricas
  • Identifique padrões e adapte-se a alterações de métricas ao longo do tempo, como padrões de hora a hora, diariamente ou semanalmente.
  • Reconhecer anomalias que indicam possíveis problemas de serviço
  • Calcular o limiar mais adequado para a métrica

O Machine Learning utiliza continuamente novos dados para saber mais e tornar o limiar mais preciso. Uma vez que o sistema se adapta ao comportamento das métricas ao longo do tempo e alertas com base em desvios do seu padrão, não precisa de saber o limiar "certo" para cada métrica.

Os limiares dinâmicos ajudam-no:

  • Crie alertas dimensionáveis para centenas de séries de métricas com uma regra de alerta. Se tiver menos regras de alerta, passa menos tempo a criar e gerir regras de alertas.
  • Criar regras sem ter de saber que limiar configurar
  • Configurar alertas de métricas com conceitos de alto nível sem um vasto conhecimento de domínio sobre a métrica
  • Impedir limiares ruidosos (de baixa precisão) ou largos (baixa recolha) que não tenham um padrão esperado
  • Processe métricas ruidosas (como a CPU ou a memória do computador) e métricas com dispersão baixa (como disponibilidade e taxa de erros).

Veja este artigo para obter instruções detalhadas sobre como utilizar limiares dinâmicos em regras de alerta de métricas.

Alertas de registo

Uma regra de alerta de registo monitoriza um recurso através de uma consulta do Log Analytics para avaliar os registos de recursos com uma frequência definida. Se as condições se cumprirem, é acionado um alerta. Como pode utilizar consultas do Log Analytics, pode realizar operações lógicas avançadas nos seus dados e utilizar as funcionalidades de KQL robustas para manipular dados de registo.

O destino da regra de alerta de registo pode ser:

  • Um único recurso, como uma VM.
  • Um único contentor de recursos, como um grupo de recursos ou uma subscrição.
  • Vários recursos com a consulta entre recursos.

Os alertas de registo podem medir duas coisas diferentes, que podem ser utilizadas para diferentes cenários de monitorização:

  • Linhas de tabela: o número de linhas devolvidas pode ser utilizado para trabalhar com eventos como registos de eventos do Windows, syslog, exceções de aplicações.
  • Cálculo de uma coluna numérica: os cálculos baseados em qualquer coluna numérica podem ser utilizados para incluir qualquer número de recursos. Por exemplo, percentagem da CPU.

Pode configurar se os alertas de registo têm monitorização de estado ou sem estado (atualmente em pré-visualização).

Nota

Os alertas de registo funcionam melhor quando está a tentar detetar dados específicos nos registos, ao contrário de quando está a tentar detetar a falta de dados nos registos. Uma vez que os registos são dados semiestruturados, são inerentemente mais latentes do que os dados de métricas em informações como um heartbeat de VM. Para evitar erros de incêndio quando está a tentar detetar a falta de dados nos registos, considere utilizar alertas de métricas. Pode enviar dados para o arquivo de métricas a partir de registos através de alertas de métricas para registos.

Dimensões nas regras de alerta de registo

Pode utilizar dimensões ao criar regras de alerta de registo para monitorizar os valores de várias instâncias de um recurso com uma regra. Por exemplo, pode monitorizar a utilização da CPU em várias instâncias que executam o seu site ou aplicação. Cada instância é monitorizada individualmente as notificações são enviadas para cada instância.

Dividir por dimensões nas regras de alerta de registo

Para monitorizar a mesma condição em vários recursos do Azure, pode utilizar a divisão por dimensões. Dividir por dimensões permite-lhe criar alertas centrados em recursos em escala para uma subscrição ou grupo de recursos. Os alertas são divididos em alertas separados ao agrupar combinações com colunas numéricas ou de cadeia. Dividir na coluna ID de recurso do Azure torna o recurso especificado no destino do alerta. Também pode decidir não dividir quando pretende que uma condição seja aplicada a vários recursos no âmbito. Por exemplo, se quiser acionar um alerta se, pelo menos, cinco máquinas no âmbito do grupo de recursos tiverem uma utilização da CPU superior a 80%.

Utilizar a API

Faça a gestão de novas regras nas áreas de trabalho com a API ScheduledQueryRules .

Nota

Os alertas de registo do Log Analytics eram geridos com a API de Alertas do Log Analytics legada. Saiba mais sobre como mudar para a API ScheduledQueryRules atual.

Registar alertas na fatura do Azure

Os Alertas de Registo estão listados em fornecedor de recursos microsoft.insights/scheduledqueryrules com:

  • Alertas de Registo no Application Insights mostrados com o nome exato do recurso, juntamente com o grupo de recursos e as propriedades do alerta.
  • Alertas de Registo no Log Analytics mostrados com o nome exato do recurso, juntamente com o grupo de recursos e as propriedades de alerta; quando criada com a API scheduledQueryRules.
  • Os alertas de registo criados a partir da API do Log Analytics legada não são controlados pelos Recursos do Azure e não têm nomes de recursos exclusivos impostos. Estes alertas ainda são criados microsoft.insights/scheduledqueryrules como recursos ocultos, que têm esta estrutura <WorkspaceName>|<savedSearchId>|<scheduleId>|<ActionId>de nomenclatura de recursos. Os Alertas de Registo na API legada são apresentados com o nome de recurso oculto acima, juntamente com o grupo de recursos e as propriedades de alerta.

Nota

Os carateres de recursos não suportados, como <, , >%, &, , ?, / são substituídos por _ nos nomes de recursos ocultos, o que também será refletido nas informações de faturação.

Alertas do registo de atividades

Um alerta do registo de atividades monitoriza um recurso ao verificar os registos de atividades de um novo evento de registo de atividades que corresponda às condições definidas.

Poderá querer utilizar alertas do registo de atividades para estes tipos de cenários:

  • Quando ocorre uma operação específica em recursos num grupo de recursos ou subscrição específico. Por exemplo, poderá querer ser notificado quando:
    • Qualquer máquina virtual num grupo de recursos de produção é eliminada.
    • Todas as novas funções são atribuídas a um utilizador na sua subscrição.
  • Ocorre um evento de estado de funcionamento do serviço. Estado de funcionamento dos serviços eventos incluem notificações de incidentes e eventos de manutenção que se aplicam aos recursos na sua subscrição.

Pode criar um alerta de registo de atividades em:

  • Qualquer uma das categorias de eventos do registo de atividades, exceto em eventos de alerta.
  • Qualquer evento de registo de atividades na propriedade de nível superior no objeto JSON.

As regras de alerta do registo de atividades são recursos do Azure, pelo que podem ser criadas com um modelo de Resource Manager do Azure. Também podem ser criados, atualizados ou eliminados no portal do Azure.

Um alerta do registo de atividades monitoriza apenas eventos na subscrição em que o alerta é criado.

Alertas do Service Health

Os alertas do Service Health são um tipo de alerta de atividade. O Service Health informa-o sobre interrupções, atividades de manutenção planeada e outros avisos de estado de funcionamento porque a experiência autenticada do Service Health sabe que serviços e recursos utiliza atualmente.

A melhor forma de utilizar o Service Health é configurar alertas do Service Health para notificá-lo através dos seus canais de comunicação preferidos quando problemas de serviço, manutenção planeada ou outras alterações podem afetar os serviços e regiões do Azure que utiliza.

alertas de Resource Health

Resource Health alertas são um tipo de alerta de atividade. Resource Health descrição geral ajuda-o a diagnosticar e obter suporte para problemas de serviço que afetam os seus recursos do Azure. Comunica o estado de funcionamento atual e anterior dos recursos. Resource Health depende de sinais de diferentes serviços do Azure para avaliar se um recurso está em bom estado de funcionamento. Se um recurso estiver em mau estado de funcionamento, Resource Health analisa informações adicionais para determinar a origem do problema. Também comunica ações que a Microsoft está a tomar para corrigir o problema e identifica o que pode fazer para o resolver.

Alertas de Deteção Inteligente

Depois de configurar o Application Insights para o seu projeto, quando a sua aplicação gera uma determinada quantidade mínima de dados, a Deteção Inteligente demora 24 horas a aprender o comportamento normal da sua aplicação. O desempenho da sua aplicação tem um padrão de comportamento típico. Alguns pedidos ou chamadas de dependência serão mais propensos a falhas do que outros; e a taxa de falhas geral pode aumentar à medida que a carga aumenta. A Deteção Inteligente utiliza machine learning para encontrar estas anomalias. A Deteção Inteligente monitoriza os dados recebidos da sua aplicação e, em particular, as taxas de falha. O Application Insights alerta-o automaticamente quase em tempo real se a sua aplicação Web tiver um aumento anormal na taxa de pedidos falhados.

À medida que os dados chegam ao Application Insights a partir da sua aplicação Web, a Deteção Inteligente compara o comportamento atual com os padrões vistos nos últimos dias. Se existir um aumento anormal da taxa de falhas em comparação com o desempenho anterior, é acionada uma análise. Para ajudá-lo a fazer a triagem e diagnosticar o problema, é fornecida uma análise das características das falhas e dos dados relacionados da aplicação nos detalhes do alerta. Também existem ligações para o portal do Application Insights para um diagnóstico mais aprofundado. A funcionalidade não precisa de configuração nem configuração, uma vez que utiliza algoritmos de machine learning para prever a taxa normal de falhas.

Embora os alertas de métricas lhe digam que pode haver um problema, a Deteção Inteligente inicia o trabalho de diagnóstico automaticamente, realizando grande parte da análise que teria de fazer sozinho. Obtém os resultados cuidadosamente empacotados, ajudando-o a chegar rapidamente à raiz do problema.

A deteção inteligente funciona para aplicações Web alojadas na cloud ou nos seus próprios servidores que geram pedidos de aplicação ou dados de dependência.

Alertas do Prometheus (pré-visualização)

Os alertas do Prometheus baseiam-se em valores de métricas armazenados nos serviços geridos do Azure Monitor para Prometheus. São acionados quando os resultados de uma consulta PromQL são resolvidos como verdadeiros. Os alertas do Prometheus são apresentados e geridos como outros tipos de alerta quando são acionados, mas são configurados com um grupo de regras prometheus. Veja Grupos de regras no serviço gerido do Azure Monitor para Prometheus para obter detalhes.

Passos seguintes