Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Quando você não tem certeza dos melhores valores a serem usados como limites para suas regras de alerta, os limites dinâmicos aplicam aprendizado de máquina avançado e usam um conjunto de algoritmos e métodos para:
- Conheça o comportamento histórico das métricas e dos resultados da consulta de log.
- Analise dados ao longo do tempo e identifique padrões como padrões por hora, diários ou semanais.
- Reconhecer anomalias que indicam possíveis problemas.
- Calcule os limites mais apropriados.
Ao usar limites dinâmicos, você não precisa saber o limite ideal para cada métrica. O recurso de limites dinâmicos calcula os limites mais adequados para você.
Os limites dinâmicos ajudam a:
- Criar alertas escalonáveis para centenas de séries de métricas com uma regra de alerta. Se tiver menos regras de alerta, você gastará menos tempo para criá-las e gerenciá-las. Alertas escalonáveis são especialmente úteis para várias dimensões ou vários recursos, como, por exemplo, todos os recursos em uma assinatura.
- Crie regras sem precisar saber qual limite configurar.
- Configure alertas de métricas usando conceitos de alto nível sem precisar de um amplo conhecimento do domínio a que a métrica se refere.
- Evite limites com muito ruído (baixa precisão) ou muita amplitude (baixo nível de detecção) que não têm um padrão esperado.
Você pode usar limites dinâmicos:
- A maioria das métricas personalizadas e da plataforma Azure Monitor.
- Métricas comuns de aplicativos e infraestrutura.
- Métricas barulhentas, como a da CPU da máquina virtual ou memória ou métricas com baixa dispersão, como disponibilidade e taxa de erro.
- Resultados da consulta de log (versão prévia).
Você pode configurar limites dinâmicos usando:
- O Portal do Azure.
- Modelos de alerta de métricas.
- Modelos do PowerShell, da CLI ou do Azure Resource Manager para regras de alerta de métrica.
- Modelos do Azure Resource Manager para regras de alerta de consulta de logs. O PowerShell e a CLI ainda não têm suporte.
Cálculo e visualização do limite de alerta
Quando uma regra de alerta é criada, os limites dinâmicos usam 10 dias de dados históricos para calcular padrões sazonais, por hora ou por dia. O gráfico que você vê na visualização de alerta reflete esses dados.
Os limites dinâmicos usam todos os dados históricos disponíveis continuamente para aprender e fazem ajustes para se tornarem mais precisos. Após três semanas, os limites dinâmicos terão dados suficientes para identificar padrões semanais e o modelo é ajustado para incluir a sazonalidade semanal.
Isso garante que, depois que a interrupção terminar, os limites permaneçam consistentes com o comportamento normal em vez de se adaptarem à interrupção como o novo normal. Picos curtos ou valores oscilantes são tratados de forma diferente: os limites dinâmicos aplicam sazonalidade e detecção de tendência, juntamente com a duração mínima de violação, para reduzir falsos positivos causados por anomalias breves.
Considerações sobre o uso de limites dinâmicos
- Para ajudar a garantir um cálculo de limite preciso, as regras de alerta que usam limites dinâmicos não disparam um alerta antes de coletar três dias e pelo menos 30 amostras de dados. Novos recursos ou recursos que estão faltando dados não disparam um alerta até que dados suficientes estejam disponíveis.
- Os limites dinâmicos precisam de pelo menos três semanas de dados históricos para detectar sazonalidade semanal. Alguns padrões detalhados, como a cada duas horas ou a cada meia semana, podem não ser detectados.
- Alterações no comportamento dos dados – se o comportamento dos dados foi alterado recentemente, as alterações não serão refletidas imediatamente nos limites superior e inferior do limite dinâmico. As bordas são calculadas com base nos dados de métrica dos últimos 10 dias.
- Limites dinâmicos são bons para detectar desvios significativos, não problemas que se desenvolvem lentamente. Mudanças de comportamento mais lentas provavelmente não irão disparar um alerta.
- Você não pode usar limites dinâmicos em regras de alerta que monitoram várias condições.
- Você não pode usar limites dinâmicos nas regras de alerta de pesquisa de log com frequência de 1 minuto.
Criar uma regra de alerta de métrica com limites dinâmicos
Para configurar limites dinâmicos, siga o procedimento para criar uma regra de alerta. Use as seguintes configurações na guia Condição:
- Para Limite, selecione Dinâmico.
- Para Tipo de agregação, recomendamos que você não selecione o Máximo.
- Para Operador, selecione Maior que, a menos que o comportamento represente o uso do aplicativo.
- Para Sensibilidade do limite, selecione Médio ou Baixo, para reduzir o ruído do alerta.
- Para Verificar a cada, selecione com que frequência a regra de alerta deve verificar se a condição foi atendida. Para minimizar o impacto do alerta sobre os negócios, pense em usar uma frequência mais baixa. Certifique-se de que esse valor seja menor ou igual ao valor do Período retrospectivo.
- Para Período retrospectivo, defina o período de tempo a ser examinado retrospectivamente a cada vez que os dados forem verificados. Certifique-se de que esse valor seja maior ou igual ao valor de Verificar a cada.
- Para Opções avançadas, escolha quantas violações irão disparar o alerta dentro de um período de tempo específico. Opcionalmente, defina a data a partir da qual iniciar o aprendizado dos dados históricos de métrica e calcular os limites dinâmicos.
Observação
As regras de alerta de métricas que você cria por meio do portal são criadas no mesmo grupo de recursos que o recurso de destino.
Gráfico de limite dinâmico
O gráfico abaixo mostra uma métrica, os respectivos limites dinâmicos e alguns alertas acionados quando o valor estava fora dos limites permitidos.
Use as seguintes informações para interpretar o gráfico:
- Linha azul: a métrica medida ao longo do tempo.
- Área sombreada azul: o intervalo permitido para a métrica. Se os valores de métrica permanecerem dentro desse intervalo, nenhum alerta é disparado.
- Pontos azuis: valores de métrica agregados. Se selecionar uma parte do gráfico e passar o mouse sobre a linha azul, você verá um ponto azul aparecer embaixo do seu cursor para indicar um valor individual de métrica agregada.
- Caixa pop-up com um ponto azul: o valor medido da métrica (o ponto azul) e os valores superior e inferior do intervalo permitido.
- Ponto vermelho com um círculo preto: o primeiro valor da métrica fora do intervalo permitido. Esse valor dispara um alerta de métrica e o coloca em um estado ativo.
- Pontos vermelhos: outros valores medidos fora do intervalo permitido. Eles não vão disparar alertas de métrica adicionais, mas o alerta permanecerá no estado ativo.
- Área vermelha: a hora em que o valor da métrica estava fora do intervalo permitido. O alerta permanece no estado ativo enquanto os valores medidos subsequentes estiverem fora do intervalo permitido sem que nenhum alerta novo seja acionado.
- Fim da área vermelha: um retorno aos valores permitidos. Quando a linha azul estiver novamente dentro dos valores permitidos, a área vermelha irá parar e a linha do valor medido se tornará azul. O status do alerta da métrica acionado na hora do ponto vermelho com contorno preto será definido como resolvido.
Métricas sem suporte de limites dinâmicos
Os limites dinâmicos são compatíveis com a maioria das métricas, mas as métricas a seguir não podem usar limites dinâmicos:
| Tipo de recurso | Nome da métrica |
|---|---|
| Microsoft.ClassicStorage/storageAccounts | Capacidade Usada |
| Microsoft.ClassicStorage/storageAccounts/blobServices | BlobCapacity |
| Microsoft.ClassicStorage/storageAccounts/blobServices | BlobCount |
| Microsoft.ClassicStorage/storageAccounts/blobServices | IndexCapacity |
| Microsoft.ClassicStorage/storageAccounts/fileServices | Capacidade de Arquivo |
| Microsoft.ClassicStorage/storageAccounts/fileServices | FileCount |
| Microsoft.ClassicStorage/storageAccounts/fileServices | FileShareCount |
| Microsoft.ClassicStorage/storageAccounts/fileServices | FileShareSnapshotCount |
| Microsoft.ClassicStorage/storageAccounts/fileServices | FileShareSnapshotSize |
| Microsoft.ClassicStorage/storageAccounts/fileServices | FileShareQuota |
| Microsoft.Compute/disks | Bytes de Leitura de Disco Composta/s |
| Microsoft.Compute/disks | Operações Compostas de Leitura de Disco por Segundo |
| Microsoft.Compute/disks | Bytes de Gravação em Disco Composta/s |
| Microsoft.Compute/disks | Operações de Gravação em Disco Composta/s |
| Microsoft.ContainerService/managedClusters | NodesCount |
| Microsoft.ContainerService/managedClusters | PodCount |
| Microsoft.ContainerService/managedClusters | CompletedJobsCount |
| Microsoft.ContainerService/managedClusters | RestartingContainerCount |
| Microsoft.ContainerService/managedClusters | OomKilledContainerCount |
| Microsoft.Devices/IotHubs | TotalDeviceCount |
| Microsoft.Devices/IotHubs | ContagemDeDispositivosConectados |
| Microsoft.DocumentDB/databaseAccounts | CassandraConnectionClosures |
| Microsoft.EventHub/clusters | Tamanho |
| Microsoft.EventHub/namespaces | CPU |
| Microsoft.EventHub/namespaces | Uso de memória |
| Microsoft.EventHub/namespaces | ReplicationLagCount |
| Microsoft.EventHub/namespaces | Tamanho |
| Microsoft.IoTCentral/IoTApps | connectedDeviceCount |
| Microsoft.IoTCentral/IoTApps | provisionedDeviceCount |
| Microsoft.Kubernetes/connectedClusters | NodesCount |
| Microsoft.Kubernetes/connectedClusters | PodCount |
| Microsoft.Kubernetes/connectedClusters | CompletedJobsCount |
| Microsoft.Kubernetes/connectedClusters | RestartingContainerCount |
| Microsoft.Kubernetes/connectedClusters | OomKilledContainerCount |
| Microsoft.MachineLearningServices/áreasDeTrabalho/pontosFinaisOnline | Solicitações Por Minuto |
| Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments | Capacidade de Implantação |
| Microsoft.Maps/accounts | CreatorUsage |
| Microsoft.Media/mediaservices/streamingEndpoints | EgressBandwidth |
| Microsoft.Network/applicationGateways | Taxa de transferência |
| Microsoft.Network/azureFirewalls | Taxa de transferência |
| Microsoft.Network/expressRouteGateways | ExpressRouteGatewayPacketsPerSecond |
| Microsoft.Network/expressRouteGateways | ExpressRouteGatewayNumberOfVmInVnet |
| Microsoft.Network/expressRouteGateways | ExpressRouteGatewayFrequencyOfRoutesChanged |
| Microsoft.Network/virtualNetworkGateways | ExpressRouteGatewayBitsPerSecond |
| Microsoft.Network/virtualNetworkGateways | ExpressRouteGatewayPacketsPerSecond |
| Microsoft.Network/virtualNetworkGateways | ExpressRouteGatewayNumberOfVmInVnet |
| Microsoft.Network/virtualNetworkGateways | ExpressRouteGatewayFrequencyOfRoutesChanged |
| Microsoft.ServiceBus/namespaces | Contagem de mensagens ativas em uma fila/tópico. (ActiveMessages) |
| Microsoft.ServiceBus/namespaces | Contagem de mensagens mortas em uma fila/um tópico (DeadletteredMessages) |
| Microsoft.ServiceBus/namespaces | Contagem de mensagens em uma fila/tópico (Mensagens) |
| Microsoft.ServiceBus/namespaces | Contagem de mensagens agendadas em uma Fila/Tópico (MensagensAgendadas) |
| Microsoft.ServiceBus/namespaces | CPU (NamespaceCpuUsage) |
| Microsoft.ServiceBus/namespaces | Uso de memória (NamespaceMemoryUsage) |
| Microsoft.ServiceBus/namespaces | Tamanho |
| Microsoft.ServiceFabricMesh/applications | AllocatedCpu |
| Microsoft.ServiceFabricMesh/applications | Memória Alocada |
| Microsoft.ServiceFabricMesh/applications | ActualCpu |
| Microsoft.ServiceFabricMesh/applications | ActualMemory |
| Microsoft.ServiceFabricMesh/applications | Status do Aplicativo |
| Microsoft.ServiceFabricMesh/applications | ServiceStatus |
| Microsoft.ServiceFabricMesh/applications | ServiceReplicaStatus |
| Microsoft.ServiceFabricMesh/applications | ContainerStatus |
| Microsoft.ServiceFabricMesh/applications | Contagem de Reinicializações |
| Microsoft.Storage/storageAccounts | Capacidade Usada |
| Microsoft.Storage/storageAccounts/blobServices | BlobCapacity |
| Microsoft.Storage/storageAccounts/blobServices | BlobCount |
| Microsoft.Storage/storageAccounts/blobServices | BlobProvisionedSize |
| Microsoft.Storage/storageAccounts/blobServices | IndexCapacity |
| Microsoft.Storage/storageAccounts/fileServices | Capacidade de Arquivo |
| Microsoft.Storage/storageAccounts/fileServices | FileCount |
| Microsoft.Storage/storageAccounts/fileServices | FileShareCount |
| Microsoft.Storage/storageAccounts/fileServices | FileShareSnapshotCount |
| Microsoft.Storage/storageAccounts/fileServices | FileShareSnapshotSize |
| Microsoft.Storage/storageAccounts/fileServices | FileShareCapacityQuota |
| Microsoft.Storage/storageAccounts/fileServices | FileShareProvisionedIOPS |
Criar uma regra de alerta de pesquisa de log com limite dinâmico (versão prévia)
Para configurar limites dinâmicos, siga o procedimento para criar uma regra de alerta. Use estas configurações na guia Condição:
- Configure sua consulta, medida e dimensões da mesma maneira que com o limite estático.
- Para Limite, selecione Dinâmico.
- Selecione Gráfico de Visualização para ver os resultados da consulta histórica junto com o limite dinâmico calculado, ajudando você a visualizar como o limite se adapta a padrões normais e onde possíveis alertas seriam disparados.
- Depois que qualquer alteração for feita na guia Condição, selecione Atualizar Gráfico para ver a visualização atualizada.
Observação
Não há suporte para frequência de 1 minuto nas regras de alerta de pesquisa de log com limite dinâmico.
Gráfico de visualização de limite dinâmico
O gráfico a seguir mostra o valor de um resultado de consulta de uma regra de alerta de log, seus limites dinâmicos, violações de limites dinâmicos e alertas que foram disparados quando o valor estava fora dos limites permitidos. Nesse cenário, o número de violações necessárias para disparar um alerta é 2.
- Linha azul: o valor medido do resultado da consulta ao longo do tempo.
- Área sombreada roxa: o intervalo de limite dinâmico calculado. Intervalo de valor permitido para o resultado da consulta. Se os valores permanecerem dentro desse intervalo, nenhum alerta será disparado.
- Pontos vermelhos: os pontos vermelhos representam violações - avaliações que resultaram no limite sendo atingido.
- Barras rosas: representam um alerta de pesquisa de log acionado.
Observação
Para garantir o desempenho do gráfico de visualização, impomos uma limitação no número de pontos de dados retornados e, consequentemente, no intervalo de tempo permitido exibido, dependendo da frequência da regra de alerta. Uma frequência de 5 minutos dá suporte a 6 horas. Uma frequência de 10 a 15 minutos dá suporte a 6 e 12 horas. Uma frequência de 30 minutos dá suporte a 6 e 12 horas e 1 dia. A frequência de 1 hora ou mais dá suporte a 6 e 12 horas, bem como 1 e 2 dias.
Problemas conhecidos com confidencialidade de limite dinâmico
Se uma regra de alerta que usa limites dinâmicos tiver muito ruído ou disparar com frequência excessiva, talvez seja necessário reduzir sua sensibilidade. Use uma das seguintes opções:
- Sensibilidade do limite: defina a sensibilidade como Baixa para torná-lo mais tolerante a desvios.
- Período retroativo (para regras de alerta de métrica) ou Granularidade de agregação (para regras de alerta de pesquisa de log) – o aumento da janela de dados torna a regra menos suscetível a desvios transitórios.
- Número de violações (em Configurações avançadas): configure a regra de alerta para disparar somente se vários desvios ocorrerem dentro de um determinado período de tempo. Essa configuração torna a regra menos suscetível a desvios temporários.
** Você pode descobrir que uma regra de alerta que usa limites dinâmicos não é disparada ou não é sensível o suficiente, mesmo que a regra esteja configurada com alta sensibilidade. Esse cenário pode acontecer quando a distribuição do resultado da métrica ou da consulta é altamente irregular. Tente uma das seguintes soluções:
- Mova para monitorar uma métrica complementar ou uma consulta de log adequada para seu cenário, se aplicável. Por exemplo, verifique se há alterações na taxa de sucesso, em vez da taxa de falha.
- Tente selecionar um valor diferente para Granularidade de agregação (Período).
- Verifique se ocorreu uma alteração drástica no comportamento dos dados nos últimos 10 dias, como uma interrupção. Uma alteração abrupta pode afetar os limites superior e inferior calculados para os dados e torná-los mais amplos. Aguarde alguns dias até que a indisponibilidade deixe de ser incluída no cálculo do limite. Se você usar regras de alerta de métrica, também poderá editar a regra de alerta para usar a opção Ignorar dados antes nas configurações avançadas.
- Se seus dados tiverem sazonalidade semanal, mas não houver histórico suficiente disponível, os limites calculados poderão resultar em limites superiores e inferiores amplos. Por exemplo, o cálculo pode tratar da mesma maneira os dias da semana e os finais de semana e criar limites amplos que nem sempre se ajustam aos dados. Esse problema deve se resolver depois que resultados suficientes do histórico de consultas de métricas ou logs estiverem disponíveis. Em seguida, o Azure Monitor detecta a sazonalidade correta e atualiza os limites calculados adequadamente.
Quando os dados exibem grandes flutuações, os limites dinâmicos podem criar um modelo amplo em torno dos valores de dados, o que pode resultar em um limite menor ou maior do que o esperado. Esse cenário pode ocorrer quando:
- A sensibilidade está definida como baixa.
- O resultado da métrica ou da consulta exibe um comportamento irregular com alta variação, que aparece como picos ou quedas nos dados.
Pense em tornar o modelo menos sensível ao escolher uma sensibilidade maior ou selecionar um valor mais longo para oPeríodo retrospectivo.
Nas regras de alerta de métrica, você também pode usar a opção Ignorar dados antes para excluir uma irregularidade recente dos dados históricos usados para criar o modelo.
Conteúdo relacionado
Se tiver algum feedback sobre limites dinâmicos, nos envie um email.