Creación de una alerta de métrica con umbrales dinámicos
Los umbrales dinámicos aplican aprendizaje automático avanzado y usan un conjunto de algoritmos y métodos para:
- Obtener información sobre el comportamiento histórico de las métricas.
- Analiza métricas a lo largo del tiempo e identificación de patrones, como patrones por hora, diarios o semanales.
- Reconocer anomalías que indiquen posibles problemas de servicio.
- Calcule los umbrales más adecuados para las métricas.
Cuando se usan umbrales dinámicos, no es necesario conocer el umbral adecuado para cada métrica. Los umbrales dinámicos calculan los umbrales más adecuados para usted.
Se recomienda configurar reglas de alerta con umbrales dinámicos en estas métricas:
- Porcentaje de CPU de máquina virtual
- Tiempo de ejecución de la solicitud HTTP de Application Insights
Los umbrales dinámicos le ayudan a:
- Crear alertas escalables para cientos de series de métricas con una regla de alertas. Si tiene menos reglas de alerta, dedicará menos tiempo a crearlas y administrarlas. Las alertas escalables son especialmente útiles para varias dimensiones o para varios recursos, como todos los recursos de una suscripción.
- Crear reglas sin tener que saber qué umbral configurar.
- Configure alertas de métricas mediante conceptos de alto nivel sin necesidad de un amplio conocimiento de dominio sobre la métrica.
- Evite umbrales ruidosos (precisión baja) o anchos (recuperación baja) que no tengan un patrón esperado.
Puedes usar umbrales dinámicos en:
- La mayoría de las métricas personalizadas y la plataforma de Azure Monitor.
- Métricas comunes de la aplicación y de la infraestructura.
- Métricas ruidosa, como la CPU de la máquina o la memoria.
- Métricas con dispersión baja, como la disponibilidad y la tasa de errores.
Puede configurar umbrales dinámicos mediante:
- Azure Portal
- La API de Azure Resource Manager totalmente automatizada.
- Plantillas de alerta de métricas.
Cálculo y versión preliminar del umbral de alerta
Cuando se crea una regla de alerta, los umbrales dinámicos usan 10 días de datos históricos para calcular patrones estacionales diarios o por hora. El gráfico que ve en la vista previa de alertas refleja esos datos.
Los umbrales dinámicos usan continuamente todos los datos históricos disponibles para aprender y realizan ajustes para ser más precisos. Después de tres semanas, los umbrales dinámicos tienen suficientes datos para identificar patrones semanales y el modelo se ajusta para incluir estacionalidad semanal.
El sistema reconoce automáticamente interrupciones prolongadas y las quita del algoritmo de aprendizaje de umbral. Si hay una interrupción prolongada, los umbrales dinámicos comprenden los datos. Detectan problemas del sistema con el mismo nivel de confidencialidad que antes de que se produjera la interrupción.
Consideraciones para usar umbrales dinámicos
- Para ayudar a garantizar un cálculo preciso del umbral, las reglas de alerta que usan umbrales dinámicos no desencadenan una alerta antes de recopilar tres días y al menos 30 muestras de datos de métricas. Los nuevos recursos o recursos que faltan datos de métricas no desencadenan una alerta hasta que haya suficientes datos disponibles.
- Los umbrales dinámicos necesitan al menos tres semanas de datos históricos para detectar estacionalidad semanal. Es posible que no se detecten algunos patrones detallados, como patrones de hora o de semana parcial.
- Si el comportamiento de una métrica ha cambiado recientemente, los cambios no se reflejan inmediatamente en los límites superior e inferior del umbral dinámico. Los límites se calculan en función de los datos de métricas de los últimos 10 días. Cuando vea los bordes del umbral dinámico para una métrica determinada, examine la tendencia de métricas de la última semana y no solo para las últimas horas o días.
- Los umbrales dinámicos son buenos para detectar desviaciones significativas, a diferencia de los problemas que evolucionan lentamente. Es probable que los cambios de comportamiento lentos no desencadenen una alerta.
Problemas conocidos con la confidencialidad del umbral dinámico
Si una regla de alerta que usa umbrales dinámicos es demasiado ruidosa o se desencadena demasiado, es posible que tenga que reducir su sensibilidad. Use una de las siguientes opciones:
- Sensibilidad del umbral: establezca la sensibilidad en Baja para que sea más tolerante a las desviaciones.
- Número de infracciones (en Configuración avanzada): configure la regla de alerta para que se desencadene solo si se produce un número determinado de desviaciones en un período de tiempo dado. Esto hará que la regla sea menos susceptible a las desviaciones transitorias.
Es posible que una regla de alerta que use umbrales dinámicos no se active o no sea lo suficientemente confidencial, aunque esté configurada con alta sensibilidad. Este escenario puede ocurrir cuando la distribución de la métrica es muy irregular. Considere la posibilidad de usar una de las soluciones siguientes:
- Pase a supervisar una métrica complementaria que sea adecuada para su escenario, si procediera. Por ejemplo, compruebe si hay cambios en la tasa de éxito, en lugar de en la tasa de errores.
- Pruebe a seleccionar un valor diferente para la Granularidad de agregación (Periodo).
- Compruebe si se ha producido un cambio drástico en el comportamiento de la métrica en los últimos 10 días, como una interrupción. Un cambio abrupto puede afectar a los umbrales superior e inferior calculados para la métrica y hacerlos más amplios. Espere unos días hasta que la interrupción ya no se incluya en el cálculo del umbral. También puede editar la regla de alerta para usar la opción Ignorar datos antes en la Configuración avanzada.
- Si los datos tienen estacionalidad semanal, pero no hay suficiente historial disponible para la métrica, los umbrales calculados pueden dar lugar a límites superiores e inferiores amplios. Por ejemplo, el cálculo puede tratar los días laborables y los fines de semana de la misma manera, y crear bordes anchos que no siempre se ajusten a los datos. Este problema se debería resolver cuando haya suficiente historial de métricas disponible. A continuación, se detecta la estacionalidad correcta y los umbrales calculados se actualizan en consecuencia.
Cuando un valor de métrica muestra grandes fluctuaciones, los umbrales dinámicos pueden crear un modelo amplio alrededor de los valores de métricas, lo que puede dar lugar a un límite inferior o superior del esperado. Este escenario puede ocurrir cuando:
- La sensibilidad está establecida en baja.
- La métrica exhibe un comportamiento irregular con una alta varianza, que se muestra como picos o pendientes en los datos.
Considere la posibilidad de hacer que el modelo sea menos sensible eligiendo una sensibilidad más alta o seleccionando un valor de periodo de retrospección mayor. También puede usar la opción Ignorar datos antes de para excluir una irregularidad reciente de los datos históricos que se usan para compilar el modelo.
Configuración de umbrales dinámicos
Para configurar umbrales dinámicos, siga el procedimiento para crear una regla de alerta. Use esta configuración en la pestaña Condición:
- En Umbral, seleccione Dinámico.
- En Tipo de agregación, se recomienda no seleccionar Máximo.
- En Operador, seleccione Mayor que a menos que el comportamiento represente el uso de la aplicación.
- En Sensibilidad de umbral, seleccione Media o Baja para reducir el ruido de las alertas.
- En Comprobar cada, seleccione la frecuencia con la que se comprueba la regla de alertas si se cumple la condición. Para minimizar el impacto empresarial de la alerta, considere la posibilidad de usar una frecuencia menor. Asegúrese de que este valor es menor o igual que el valor del periodo de retrospección.
- En Periodo de retrospección, establezca el periodo de tiempo en el que se mirará hacia atrás cada vez que se comprueben los datos. Asegúrese de que este valor es mayor o igual que el valor Comprobar cada.
- Para Opciones avanzadas, elija cuántas infracciones desencadenarán la alerta en un período de tiempo específico. Opcionalmente, establezca la fecha a partir de la cual se iniciará el aprendizaje de los datos históricos de la métrica y se calcularán los umbrales dinámicos.
Nota:
Las reglas de alertas de métricas que cree a través del portal se crean en el mismo grupo de recursos que el recurso de destino.
Gráfico para umbrales dinámicos
En el gráfico siguiente se muestra una métrica, sus límites de umbral dinámico y algunas alertas que se desencadenaron cuando el valor estaba fuera de los umbrales permitidos.
Utilice la información siguiente para interpretar el gráfico:
- Línea azul: la métrica medida a lo largo del tiempo.
- Área sombreada azul: intervalo permitido para la métrica. Si los valores de la métrica se mantienen dentro de este rango, no se activa ninguna alerta.
- Puntos azules: valores de métrica agregados. Si selecciona una parte del gráfico y pasa el ratón por encima de la línea azul, aparecerá un punto azul bajo el cursor para indicar un valor de métrica agregado individual.
- Cuadro emergente con punto azul: el valor de métrica medido (punto azul) y los valores superior e inferior del intervalo permitido.
- Punto rojo con un círculo negro: el primer valor de métrica fuera del intervalo permitido. Este valor activa una alerta de métrica y la pone en estado activo.
- Puntos rojos: otros valores medidos fuera del intervalo permitido. No activan más alertas de métricas, pero la alerta permanece en estado activo.
- Área roja: la hora en que el valor de la métrica estaba fuera del intervalo permitido. La alerta permanece en estado activo siempre que los valores medidos posteriores estén fuera del intervalo permitido, pero no se desencadenan nuevas alertas.
- Fin del área roja: se vuelve a los valores permitidos. Cuando la línea azul vuelve dentro de los valores permitidos, el área roja se detiene y la línea de valor medida se vuelve azul. El estado de la alerta métrica lanzada en el momento que indica el punto rojo con un círculo negro se establece en resuelto.
Métricas no admitidas por umbrales dinámicos
Los umbrales dinámicos admiten la mayoría de las métricas, pero las siguientes métricas no pueden usar umbrales dinámicos:
Tipo de recurso | Nombre de métrica |
---|---|
Microsoft.ClassicStorage/storageAccounts | UsedCapacity |
Microsoft.ClassicStorage/storageAccounts/blobServices | BlobCapacity |
Microsoft.ClassicStorage/storageAccounts/blobServices | BlobCount |
Microsoft.ClassicStorage/storageAccounts/blobServices | IndexCapacity |
Microsoft.ClassicStorage/storageAccounts/fileServices | FileCapacity |
Microsoft.ClassicStorage/storageAccounts/fileServices | FileCount |
Microsoft.ClassicStorage/storageAccounts/fileServices | FileShareCount |
Microsoft.ClassicStorage/storageAccounts/fileServices | FileShareSnapshotCount |
Microsoft.ClassicStorage/storageAccounts/fileServices | FileShareSnapshotSize |
Microsoft.ClassicStorage/storageAccounts/fileServices | FileShareQuota |
Microsoft.Compute/disks | Bytes por segundo de lectura de discos compuestos |
Microsoft.Compute/disks | Operaciones de lectura de disco compuesto por segundo |
Microsoft.Compute/disks | Bytes por segundo de escritura en discos compuestos |
Microsoft.Compute/disks | Operaciones de escritura en discos compuestos por segundo |
Microsoft.ContainerService/managedClusters | NodesCount |
Microsoft.ContainerService/managedClusters | PodCount |
Microsoft.ContainerService/managedClusters | CompletedJobsCount |
Microsoft.ContainerService/managedClusters | RestartingContainerCount |
Microsoft.ContainerService/managedClusters | OomKilledContainerCount |
Microsoft.Devices/IotHubs | TotalDeviceCount |
Microsoft.Devices/IotHubs | ConnectedDeviceCount |
Microsoft.Devices/IotHubs | TotalDeviceCount |
Microsoft.Devices/IotHubs | ConnectedDeviceCount |
Microsoft.DocumentDB/databaseAccounts | CassandraConnectionClosures |
Microsoft.EventHub/clusters | Size |
Microsoft.EventHub/namespaces | Size |
Microsoft.IoTCentral/IoTApps | connectedDeviceCount |
Microsoft.IoTCentral/IoTApps | provisionedDeviceCount |
Microsoft.Kubernetes/connectedClusters | NodesCount |
Microsoft.Kubernetes/connectedClusters | PodCount |
Microsoft.Kubernetes/connectedClusters | CompletedJobsCount |
Microsoft.Kubernetes/connectedClusters | RestartingContainerCount |
Microsoft.Kubernetes/connectedClusters | OomKilledContainerCount |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints | RequestsPerMinute |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments | DeploymentCapacity |
Microsoft.Maps/accounts | CreatorUsage |
Microsoft.Media/mediaservices/streamingEndpoints | EgressBandwidth |
Microsoft.Network/applicationGateways | Throughput |
Microsoft.Network/azureFirewalls | Throughput |
Microsoft.Network/expressRouteGateways | ExpressRouteGatewayPacketsPerSecond |
Microsoft.Network/expressRouteGateways | ExpressRouteGatewayNumberOfVmInVnet |
Microsoft.Network/expressRouteGateways | ExpressRouteGatewayFrequencyOfRoutesChanged |
Microsoft.Network/virtualNetworkGateways | ExpressRouteGatewayBitsPerSecond |
Microsoft.Network/virtualNetworkGateways | ExpressRouteGatewayPacketsPerSecond |
Microsoft.Network/virtualNetworkGateways | ExpressRouteGatewayNumberOfVmInVnet |
Microsoft.Network/virtualNetworkGateways | ExpressRouteGatewayFrequencyOfRoutesChanged |
Microsoft.ServiceBus/namespaces | Size |
Microsoft.ServiceBus/namespaces | error de Hadoop |
Microsoft.ServiceBus/namespaces | ActiveMessages |
Microsoft.ServiceBus/namespaces | DeadletteredMessages |
Microsoft.ServiceBus/namespaces | ScheduledMessages |
Microsoft.ServiceFabricMesh/applications | AllocatedCpu |
Microsoft.ServiceFabricMesh/applications | AllocatedMemory |
Microsoft.ServiceFabricMesh/applications | ActualCpu |
Microsoft.ServiceFabricMesh/applications | ActualMemory |
Microsoft.ServiceFabricMesh/applications | ApplicationStatus |
Microsoft.ServiceFabricMesh/applications | ServiceStatus |
Microsoft.ServiceFabricMesh/applications | ServiceReplicaStatus |
Microsoft.ServiceFabricMesh/applications | ContainerStatus |
Microsoft.ServiceFabricMesh/applications | RestartCount |
Microsoft.Storage/storageAccounts | UsedCapacity |
Microsoft.Storage/storageAccounts/blobServices | BlobCapacity |
Microsoft.Storage/storageAccounts/blobServices | BlobCount |
Microsoft.Storage/storageAccounts/blobServices | BlobProvisionedSize |
Microsoft.Storage/storageAccounts/blobServices | IndexCapacity |
Microsoft.Storage/storageAccounts/fileServices | FileCapacity |
Microsoft.Storage/storageAccounts/fileServices | FileCount |
Microsoft.Storage/storageAccounts/fileServices | FileShareCount |
Microsoft.Storage/storageAccounts/fileServices | FileShareSnapshotCount |
Microsoft.Storage/storageAccounts/fileServices | FileShareSnapshotSize |
Microsoft.Storage/storageAccounts/fileServices | FileShareCapacityQuota |
Microsoft.Storage/storageAccounts/fileServices | FileShareProvisionedIOPS |
Contenido relacionado
Si tiene comentarios sobre umbrales dinámicos, envíenos un correo electrónico.