Elección del tipo correcto de regla de alertas
En este artículo se explican los tipos de alertas de Azure Monitor que puede crear. Ayuda a comprender cuándo usar cada tipo de alerta. Para obtener más información sobre los precios, consulte la página de precios.
Los tipos de alertas son los siguientes:
- Alertas de métricas
- Alertas de búsqueda de registros
- Alertas de registros de actividad
- Alertas de detección inteligente
- Alertas de Prometheus
Tipos de alertas de Azure Monitor
Tipo de alerta | Cuándo se usa | Información de precios |
---|---|---|
Alerta de métrica | Los datos de métricas se almacenan en el sistema ya calculados. Las alertas de métrica son útiles si quiere recibir alertas sobre los datos que requieren poca o ninguna manipulación. Si los datos que quiere supervisar están disponibles en los datos de métricas, use alertas de métrica. | Cada regla de alertas de métricas se cobra en función del número de series temporales que se supervisan. |
Alerta de búsqueda de registros | Puede usar alertas de búsqueda de registros para realizar operaciones lógicas avanzadas en los datos. Si los datos que quiere supervisar están disponibles en registros o necesitan lógica avanzada, puede usar las eficaces características de Lenguaje de consulta Kusto (KQL) para la manipulación de datos mediante alertas de registro. | Cada regla de alertas de búsqueda de registros se factura según el intervalo en el que se evalúa la consulta del registro. Una evaluación de consultas más frecuente da como resultado un coste mayor. Para las alertas de búsqueda de registros configuradas para la supervisión a escala mediante la división por dimensiones, el costo también depende del número de series temporales creadas por las dimensiones resultantes de la consulta. |
Alerta de registro de actividad | Los registros de actividad proporcionan auditoría de todas las acciones que se produjeron en los recursos. Use alertas de registro de actividad para recibir alertas cuando se produzca un evento específico en un recurso, como un reinicio, un apagado o la creación o eliminación de un recurso. Las alertas de Service Health y Resource Health le avisan cuando hay un problema con uno de los servicios o recursos. | Consulte la página de preciospara obtener más información. |
Alertas de Prometheus | Las alertas de Prometheus se usan para alertar sobre métricas de Prometheus almacenadas en los servicios administrados de Azure Monitor para Prometheus. Las reglas de alerta se basan en el lenguaje de consulta de código abierto PromQL. | Las reglas de alertas de Prometheus solo se cargan en los datos consultados por las reglas. Consulte la página de preciospara obtener más información. |
Alertas de métricas
Una regla de alertas de métrica supervisa un recurso mediante la evaluación de las condiciones de las métricas de recursos a intervalos regulares. Si se cumplen las condiciones, se desencadena una alerta. Una serie temporal de métricas es una serie de valores de métricas capturados durante un período de tiempo.
Puede crear reglas mediante estas métricas:
- Métricas de la plataforma
- Métricas personalizadas
- Métricas personalizadas de Application Insights
- Registros seleccionados de un área de trabajo de Log Analytics convertida en métricas
Las reglas de alertas de métrica incluyen estas características:
- Puede usar varias condiciones en una regla de alertas para un único recurso.
- Puede agregar granularidad mediante la supervisión de varias dimensiones de métricas.
- Puede usar umbrales dinámicos que están controlados por el aprendizaje automático.
- Puede configurar si las alertas de métrica tienen estado o no. Las alertas de métrica tienen estado de forma predeterminada.
El destino de la regla de alertas de métrica puede ser:
- Un solo recurso, como una máquina virtual (VM). Para conocer los tipos de recursos admitidos, consulte Recursos admitidos para alertas de métricas en Azure Monitor.
- Varios recursos del mismo tipo en la misma región de Azure, como un grupo de recursos.
Aplicación de varias condiciones a una regla de alerta de métricas
Al crear una regla de alertas para un único recurso, puede aplicar varias condiciones. Por ejemplo, podría crear una regla de alertas para supervisar una máquina virtual de Azure y generar una alerta si el porcentaje de CPU supera el 90 % y la longitud de la cola es de más de 300 elementos. Cuando una regla de alertas tiene varias condiciones, la alerta se desencadena cuando se cumplen todas las condiciones de la regla de alertas y se resuelve cuando al menos una de las condiciones ya no se cumple durante tres comprobaciones consecutivas.
Reducción del destino mediante dimensiones
Para obtener instrucciones sobre el uso de dimensiones en reglas de alertas de métricas, vea Supervisión de varias series temporales en una sola regla de alertas de métricas.
Supervisión de la misma condición en varios recursos mediante la división por dimensiones
Para supervisar la misma condición en varios recursos de Azure, puede usar la división por dimensiones. Si utiliza la división por dimensiones puede crear alertas centradas en recursos a gran escala para una suscripción o grupo de recursos. Las alertas se dividen en alertas independientes mediante la agrupación de combinaciones. La división en una columna de identificador de recurso de Azure convierte al recurso especificado en el destino de la alerta.
También puede decidir no dividirlas cuando quiere que una condición se aplique a varios recursos del ámbito. Por ejemplo, quiere activar una alerta si al menos cinco máquinas del ámbito del grupo de recursos tienen un uso de CPU por encima del 80 %.
Supervisión de varios recursos con una regla de alerta
Puede supervisar a gran escala aplicando la misma regla de alertas de métrica a varios recursos del mismo tipo para los recursos que se encuentren en la misma región de Azure. Se envían notificaciones individuales para cada recurso supervisado.
Se admiten las métricas de plataforma para estos servicios en las siguientes nubes de Azure:
Service | Proveedor de recursos | Azure global | Government | China |
---|---|---|---|---|
Máquinas virtuales | "Microsoft.Compute/virtualMachines" | Sí | Sí | Sí |
Bases de datos de SQL Server | "Microsoft.Sql/servers/databases" | Sí | Sí | Sí |
Grupos elásticos de SQL Server | "Microsoft.Sql/servers/elasticpools" | Sí | Sí | Sí |
Grupos de capacidad de NetApp Files | "Microsoft.NetApp/netAppAccounts/capacityPools" | Sí | Sí | Sí |
Volúmenes de NetApp Files | "Microsoft.NetApp/netAppAccounts/capacityPools/volumes" | Sí | Sí | Sí |
Azure Key Vault | "Microsoft.KeyVault/vaults" | Sí | Sí | Sí |
Azure Cache for Redis | "Microsoft.Cache/redis" | Sí | Sí | Sí |
Azure Stack Edge devices | (No hay ningún proveedor de recursos específico para este recurso. Debido a cómo funcionan los dispositivos perimetrales de Stack, las métricas se recuperan de varios proveedores de recursos. Puede consultar esta documentación para obtener más detalles sobre las alertas de este recurso: Revisión de alertas en Azure Stack Edge) | Sí | Sí | Sí |
Almacenes de Recovery Services | "Microsoft.RecoveryServices/Vaults" | Sí | No | No |
Azure Database for PostgreSQL con la opción Servidor flexible | "Microsoft.DBforPostgreSQL/flexibleServers" | Sí | Sí | Sí |
Máquinas sin sistema operativo (Operator Nexus) | "Microsoft.NetworkCloud/bareMetalMachines" | Sí | Sí | Sí |
Dispositivos de almacenamiento (Operator Nexus) | "Microsoft.NetworkCloud/storageAppliances" | Sí | Sí | Sí |
Clústeres (Operator Nexus) | "Microsoft.NetworkCloud/clusters" | Sí | Sí | Sí |
Dispositivos de red (Operator Nexus) | Microsoft.NetworkCloud/l2Networks, Microsoft.NetworkCloud/l3Networks | Sí | Sí | Sí |
Reglas de recopilación de datos | "Microsoft.Insights/datacollectionrules" | Sí | Sí | Sí |
Nota
Las alertas de métricas de varios recursos no se admiten para:
- Alertas sobre métricas de invitado de máquina virtual.
- Alertas sobre las métricas de red de máquinas virtuales (Entrada de red total, Salida de red total, Flujos de entrada, Flujos de salida, Velocidad máxima de creación de flujos entrantes y Velocidad máxima de creación de flujos salientes).
El ámbito de supervisión se puede especificar con una sola regla de alertas de métrica de tres formas distintas. Por ejemplo, con las máquinas virtuales el ámbito se puede especificar como:
- Una lista de máquinas virtuales de una región de Azure en una suscripción.
- Todas las máquinas virtuales de una región de Azure en uno o varios grupos de recursos de una suscripción.
- Todas las máquinas virtuales de una región de Azure en una suscripción.
Aplicación del aprendizaje automático avanzado con umbrales dinámicos
Los umbrales dinámicos usan el aprendizaje automático avanzado para:
- Obtener información sobre el comportamiento histórico de las métricas.
- Identificar patrones y adaptarlos a los cambios que se producen en las métricas con el tiempo, como, por ejemplo, patrones de cada hora, día o semana.
- Reconocer anomalías que indiquen posibles problemas de servicio.
- Calcular el umbral más adecuado para la métrica.
El aprendizaje automático usa continuamente nuevos datos para obtener más información y hacer que el umbral sea más preciso. Como el sistema se adapta al comportamiento de las métricas con el paso del tiempo y genera alertas en función de las desviaciones de su patrón, no es necesario conocer el umbral "correcto" de cada métrica.
Los umbrales dinámicos le ayudan a:
- Crear alertas escalables para cientos de series de métricas con una regla de alertas. Si tiene menos reglas de alerta, dedica menos tiempo a crearlas y administrarlas.
- Crear reglas sin tener que saber qué umbral configurar.
- Configurar alertas de métricas mediante conceptos generales sin un amplio conocimiento del dominio sobre la métrica.
- Evitar umbrales con ruido (poca precisión) o amplios (poca coincidencia) que no tengan un patrón esperado.
- Controlar métricas con ruido (como la memoria o la CPU del equipo), así como las métricas con poca dispersión (como la disponibilidad y la tasa de error)
Vea umbrales dinámicos para obtener instrucciones detalladas sobre el uso de umbrales dinámicos en las reglas de alertas de métrica.
Alertas de búsqueda de registros
Una regla de alertas de búsqueda de registros supervisa un recurso mediante una consulta de Log Analytics para evaluar los registros de los recursos con una frecuencia establecida. Si se cumplen las condiciones, se desencadena una alerta. Dado que puede usar consultas de Log Analytics, puede realizar operaciones lógicas avanzadas en los datos y usar las eficaces características de KQL para la manipulación de los datos de registro.
El destino de la regla de alertas de búsqueda de registros puede ser:
- Un único recurso, como una máquina virtual.
- Un único contenedor de recursos, como un grupo de recursos o una suscripción.
- Varios recursos que usan una consulta entre recursos.
Las alertas de búsqueda de registros pueden medir dos cosas diferentes, que se pueden usar para distintos escenarios de supervisión:
- Filas de tabla: el número de filas devueltas se puede usar para trabajar con eventos, como registros de eventos de Windows, Syslog y excepciones de aplicación.
- Cálculo de una columna numérica: se pueden usar cálculos a partir de cualquier columna numérica para incluir cualquier número de recursos. Un ejemplo es el porcentaje de CPU.
Puede configurar si las alertas de búsqueda de registros están con estado o sin estado.
Tenga en cuenta que las alertas de búsqueda de registros con estado tienen estas limitaciones:
- pueden desencadenar hasta 300 alertas por evaluación.
- se puede tener un máximo de 5000 alertas con la condición de alerta
fired
.
Nota:
Las alertas de búsqueda de registros funcionan mejor cuando se intenta detectar datos específicos en los registros, en lugar de cuando se intenta detectar una falta de datos en los registros. Dado que los registros son datos semiestructurados, tienen intrínsecamente mayor latencia que los datos de métricas sobre información como el latido de una máquina virtual. Para evitar errores de activación cuando intente detectar una falta de datos en los registros, considere la posibilidad de usar alertas de métricas. Puede enviar datos al almacén de métricas desde los registros mediante alertas de métricas para registros.
Supervisión de varias instancias de un recurso mediante dimensiones
Puede usar dimensiones al crear reglas de alertas de búsqueda de registros para supervisar los valores de varias instancias de un recurso con una regla. Por ejemplo, puede supervisar el uso de CPU en varias instancias que ejecutan el sitio web o la aplicación. Cada instancia se supervisa individualmente. Se envían notificaciones para cada instancia.
Supervisión de la misma condición en varios recursos mediante la división por dimensiones
Para supervisar la misma condición en varios recursos de Azure, puede usar la división por dimensiones. Si utiliza la división por dimensiones puede crear alertas centradas en recursos a gran escala para una suscripción o grupo de recursos. Las alertas se dividen en alertas independientes agrupando combinaciones mediante columnas numéricas o de cadena. La división en la columna de identificador de recurso de Azure convierte el recurso especificado en el destino de la alerta.
También puede decidir no dividirlas cuando quiere que una condición se aplique a varios recursos del ámbito. Por ejemplo, quiere activar una alerta si al menos cinco máquinas del ámbito del grupo de recursos tienen un uso de CPU por encima del 80 %.
Uso de la API para reglas de alertas de búsqueda de registros
Administre nuevas reglas en las áreas de trabajo mediante scheduledQueryRules API.
Nota:
Las alertas de búsqueda de registros de Log Analytics se administraban mediante la versión heredada de la API de alertas de Log Analytics. Obtenga más información sobre cómo cambiar a la versión ScheduledQueryRules API actual.
Alertas de búsqueda de registros en la factura de Azure
Las alertas de búsqueda de registros aparecen bajo el proveedor de recursos microsoft.insights/scheduledqueryrules
con:
- Las alertas de búsqueda de registros en Application Insights se muestran con el nombre exacto del recurso junto con las propiedades del grupo de recursos y la alerta.
- Las alertas de búsqueda de registros de Log Analytics se muestran con el nombre exacto del recurso junto con las propiedades del grupo de recursos y la alerta cuando se crean mediante la API scheduledQueryRules.
- Las alertas de búsqueda de registros creadas con la API heredada de Log Analytics no son recursos de Azure con seguimiento y no disponen de nombres de recurso únicos. Estas alertas se siguen creando en
microsoft.insights/scheduledqueryrules
como recursos ocultos, que tienen la estructura de nomenclatura de recursos<WorkspaceName>|<savedSearchId>|<scheduleId>|<ActionId>
. Las alertas de búsqueda de registros de la API heredada se muestran con el nombre de recurso oculto anterior junto con las propiedades del grupo de recursos y la alerta.
Nota:
Caracteres de recursos no admitidos como <, >, %, &, , ? y / se sustituyen por un guion bajo (_) en los nombres de recursos ocultos. Este cambio de carácter también se refleja en la información de facturación.
Alertas de registros de actividad
Una alerta de registro de actividad supervisa un recurso comprobando los registros de actividad de un nuevo evento de registro de actividad que coincida con las condiciones definidas.
Es posible que quiera usar alertas de registro de actividad para estos tipos de escenarios:
- Cuando se produce una operación específica en los recursos de un grupo de recursos o una suscripción específicos. Por ejemplo, puede que quiera recibir una notificación cuando:
- Se elimina una máquina virtual de un grupo de recursos de producción.
- Se asignan roles nuevos a un usuario de la suscripción.
- Se produce un evento de Service Health. Los eventos de Service Health incluyen notificaciones de incidentes y eventos de mantenimiento que se aplican a recursos de la suscripción.
Puede crear una alerta de registro de actividad en:
- Cualquiera de las categorías de eventos del registro de actividad, distintas de los eventos de alerta.
- Cualquier evento del registro de actividad en la propiedad de nivel superior del objeto JSON.
Las regla de alertas del registro de actividad son recursos de Azure, por lo que pueden crearse con una plantilla de Azure Resource Manager. También se pueden crear, actualizar o eliminar en Azure Portal.
Una alerta de registro de actividad solo supervisa eventos de la suscripción en la que se ha creado la alerta.
Alertas de Service Health
Las alertas de Service Health son un tipo de alerta de actividad. Service Health le informa de interrupciones, actividades de mantenimiento planeado y otros avisos de mantenimiento, ya que tras la autenticación, Service Health conoce los servicios y recursos que usa en la actualidad.
La mejor forma de usar Service Health consiste en configurar sus alertas para que le envíen notificaciones a través de sus canales de comunicación preferidos cuando los problemas del servicio, el mantenimiento planeado u otros cambios pueden afectar a los servicios y regiones de Azure que utiliza.
Alertas de Resource Health
Las alertas de Resource Health son un tipo de alerta de actividad. La información general de Resource Health ayuda a diagnosticar problemas en los servicios que afectan a los recursos de Azure y a obtener soporte técnico para resolverlos. Informa sobre el mantenimiento actual y pasado de los recursos.
Resource Health se basa en las señales procedentes de distintos servicios de Azure para evaluar si el mantenimiento de un recurso es correcto. Si el mantenimiento de un recurso no es correcto, Resource Health analiza más información para determinar el origen del problema. También informa sobre las acciones que Microsoft lleva a cabo para corregir el problema e identifica las acciones que usted puede tomar para solucionarlo.
Alertas de detección inteligente
Después de configurar Application Insights para el proyecto y de que la aplicación genere una cantidad determinada de datos, la detección inteligente tarda 24 horas en aprender el comportamiento normal de la aplicación. El rendimiento de una aplicación tiene un patrón típico de comportamiento. Algunas solicitudes o llamadas de dependencia son más propensas a errores que otras y la tasa de error general puede aumentar a medida que aumenta la carga.
La detección inteligente usa aprendizaje automático para encontrar estas anomalías. La detección inteligente supervisa los datos recibidos de la aplicación y, en particular, las tasas de errores. Application Insights le avisa automáticamente casi en tiempo real si la aplicación web sufre un aumento anómalo en la frecuencia de solicitudes erróneas.
A medida que Application Insights recibe datos de la aplicación web, la detección inteligente compara el comportamiento actual con los patrones vistos a lo largo de los últimos días. Si se produce un incremento anómalo de la tasa de errores en comparación con el rendimiento previo, se desencadena un análisis.
Para ayudarle a evaluar las prioridades y a diagnosticar un problema, en los detalles de la alerta se proporciona un análisis de las características de los errores, así como datos de la aplicación relacionados. También hay vínculos en el portal de Application Insights para obtener un diagnóstico más amplio. La característica no necesita instalación ni configuración, ya que usa algoritmos de aprendizaje automático para predecir la tasa normal de errores.
Aunque las alertas de métricas indiquen que podría haber un problema, la detección inteligente inicia automáticamente el trabajo de diagnóstico. Realiza gran parte del análisis que, de otra forma, tendría que hacer usted mismo. Los resultados se le presentan claramente organizados, lo que le ayuda a llegar rápidamente a la raíz del problema.
La detección inteligente funciona para cualquier aplicación web, hospedada en la nube o en sus propios servidores, que genere datos de dependencia o de solicitudes de la aplicación.
Alertas de Prometheus
Las alertas de Prometheus se usan para supervisar los valores de métrica almacenados en los servicios administrados de Azure Monitor para Prometheus. Las reglas de alertas de Prometheus se configuran como parte de los grupos de reglas de Prometheus. Se activan cuando el resultado de una expresión de PromQL se resuelve como verdadera. Las alertas desencadenadas de Prometheus se muestran y administran como otros tipos de alertas.
Pasos siguientes
- Obtener una Introducción a las alertas.
- Cree una regla de alertas.
- Más información sobre la detección inteligente.