Tipos de alertas de Azure Monitor
En este artículo se explican los tipos de alertas de Azure Monitor que puede crear. Le ayuda a comprender cuándo usar cada tipo de alerta.
Los tipos de alertas son:
- Alertas de métricas
- Alertas de registro
- Alertas de registros de actividad
- Alertas de detección inteligente
- Alertas de Prometheus (versión preliminar)
Selección del tipo de alerta correcto
La información de esta tabla puede ayudarle a decidir cuándo usar cada tipo de alerta. Para obtener más información sobre los precios, consulte la página de precios.
Tipo de alerta | Cuándo se usa | Información de precios |
---|---|---|
Alerta de métrica | Los datos de métricas se almacenan en el sistema ya calculados. Las alertas de métrica son útiles si quiere recibir alertas sobre los datos que requieren poca o ninguna manipulación. Si los datos que quiere supervisar están disponibles en los datos de métricas, use alertas de métrica. | Cada regla de alertas de métricas se cobra en función del número de series temporales que se supervisan. |
Alerta de registro | Puede usar alertas de registro para realizar operaciones lógicas avanzadas en los datos. Si los datos que quiere supervisar están disponibles en los registros o requieren lógica avanzada, puede usar las eficaces características del lenguaje de consulta Kusto (KQL) para la manipulación de datos mediante alertas de registro. | Cada regla de alertas de registro se factura según el intervalo en el que se evalúa la consulta del registro. Una evaluación de consultas más frecuente da como resultado un coste mayor. Para las alertas de registro configuradas para la supervisión a escala, el coste también dependerá del número de series temporales que hayan creado las dimensiones resultantes de la consulta. |
Alerta de registro de actividad | Los registros de actividad proporcionan auditoría de todas las acciones que se produjeron en los recursos. Use alertas de registro de actividad para recibir alertas cuando se produzca un evento específico en un recurso, como un reinicio, un apagado o la creación o eliminación de un recurso. Las alertas de Service Health y Resource Health alertas le avisan cuando hay un problema con uno de los servicios o recursos. | Consulte la página de preciospara obtener más información. |
Alertas de Prometheus (versión preliminar) | Las alertas de Prometheus se usan principalmente para alertar sobre el rendimiento y el estado de los clústeres de Kubernetes, incluido Azure Kubernetes Service. Las reglas de alerta se basan en PromQL, que es un lenguaje de consulta de código abierto. | No hay ningún cargo por las alertas de Prometheus durante el período de versión preliminar. |
Alertas de métricas
Una regla de alertas de métrica supervisa un recurso mediante la evaluación de las condiciones de las métricas de recursos a intervalos regulares. Si se cumplen las condiciones, se desencadena una alerta. Una serie temporal de métricas es una serie de valores de métricas capturados durante un período de tiempo.
Puede crear reglas mediante estas métricas:
- Métricas de la plataforma
- Métricas personalizadas
- Métricas personalizadas de Application Insights
- Registros seleccionados de un área de trabajo de Log Analytics convertida en métricas
Las reglas de alertas de métrica incluyen estas características:
- Puede usar varias condiciones en una regla de alertas para un único recurso.
- Puede agregar granularidad mediante la supervisión de varias dimensiones de métricas.
- Puede usar umbrales dinámicos que están controlados por el aprendizaje automático.
- Puede configurar si las alertas de métrica tienen estado o no. Las alertas de métrica tienen estado de forma predeterminada.
El destino de la regla de alertas de métrica puede ser:
- Un solo recurso, como una máquina virtual (VM). Para conocer los tipos de recursos admitidos, consulte Recursos admitidos para alertas de métricas en Azure Monitor.
- Varios recursos del mismo tipo en la misma región de Azure, como un grupo de recursos.
Varias condiciones
Al crear una regla de alertas para un único recurso, puede aplicar varias condiciones. Por ejemplo, podría crear una regla de alertas para supervisar una máquina virtual de Azure y generar una alerta si el porcentaje de CPU supera el 90 % y la longitud de la cola es de más de 300 elementos. Cuando una regla de alertas tiene varias condiciones, la alerta se desencadena cuando se cumplen todas las condiciones de la regla de alertas y se resuelve cuando al menos una de las condiciones ya no se cumple durante tres comprobaciones consecutivas.
Reducción del destino mediante dimensiones
Para obtener instrucciones sobre el uso de dimensiones en reglas de alertas de métricas, consulte Supervisión de varias series temporales en una sola regla de alertas de métricas.
Creación de alertas centradas en recursos mediante la división por dimensiones
Para supervisar la misma condición en varios recursos de Azure, puede usar la división por dimensiones. Si utiliza la división por dimensiones puede crear alertas centradas en recursos a gran escala para una suscripción o grupo de recursos. Las alertas se dividen en alertas independientes mediante la agrupación de combinaciones. La división en una columna de identificador de recurso de Azure convierte el recurso especificado en el destino de la alerta.
También puede decidir no dividirlas cuando quiere que una condición se aplique a varios recursos del ámbito. Por ejemplo, quiere activar una alerta si al menos cinco máquinas del ámbito del grupo de recursos tienen un uso de CPU por encima del 80 %.
Supervisión de varios recursos
Puede supervisar a gran escala aplicando la misma regla de alertas de métrica a varios recursos del mismo tipo para los recursos que se encuentren en la misma región de Azure. Se envían notificaciones individuales para cada recurso supervisado.
Se admiten las métricas de plataforma para estos servicios en las siguientes nubes de Azure:
Servicio | Azure global | Government | China |
---|---|---|---|
Máquinas virtuales | Sí | Sí | Sí |
Bases de datos de SQL Server | Sí | Sí | Sí |
Grupos elásticos de SQL Server | Sí | Sí | Sí |
Grupos de capacidad de NetApp Files | Sí | Sí | Sí |
Volúmenes de NetApp Files | Sí | Sí | Sí |
Azure Key Vault | Sí | Sí | Sí |
Azure Cache for Redis | Sí | Sí | Sí |
Azure Stack Edge devices | Sí | Sí | Sí |
Almacenes de Recovery Services | Sí | No | No |
Azure Database for PostgreSQL con la opción Servidor flexible | Sí | Sí | Sí |
Nota
Las alertas de métricas de varios recursos no se admiten para:
- Alertas sobre métricas de invitado de máquina virtual.
- Alertas sobre las métricas de red de máquinas virtuales (Entrada de red total, Salida de red total, Flujos de entrada, Flujos de salida, Velocidad máxima de creación de flujos entrantes y Velocidad máxima de creación de flujos salientes).
El ámbito de supervisión se puede especificar con una sola regla de alertas de métrica de tres formas distintas. Por ejemplo, con las máquinas virtuales el ámbito se puede especificar como:
- Una lista de máquinas virtuales de una región de Azure en una suscripción.
- Todas las máquinas virtuales de una región de Azure en uno o varios grupos de recursos de una suscripción.
- Todas las máquinas virtuales de una región de Azure en una suscripción.
Umbrales dinámicos
Los umbrales dinámicos usan el aprendizaje automático avanzado para:
- Obtener información sobre el comportamiento histórico de las métricas.
- Identificar patrones y adaptarlos a los cambios que se producen en las métricas con el tiempo, como, por ejemplo, patrones de cada hora, día o semana.
- Reconocer anomalías que indiquen posibles problemas de servicio.
- Calcular el umbral más adecuado para la métrica.
El aprendizaje automático usa continuamente nuevos datos para obtener más información y hacer que el umbral sea más preciso. Dado que el sistema se adapta al comportamiento de las métricas con el paso del tiempo y genera alertas en función de las desviaciones de su patrón, no es necesario conocer el umbral "correcto" de cada métrica.
Los umbrales dinámicos le ayudan a:
- Crear alertas escalables para cientos de series de métricas con una regla de alertas. Si tiene menos reglas de alerta, dedica menos tiempo a crearlas y administrarlas.
- Crear reglas sin tener que saber qué umbral configurar.
- Configurar alertas de métricas mediante conceptos generales sin un amplio conocimiento del dominio sobre la métrica.
- Evitar umbrales con ruido (poca precisión) o amplios (poca coincidencia) que no tengan un patrón esperado.
- Controlar métricas con ruido (como la memoria o la CPU del equipo), así como las métricas con poca dispersión (como la disponibilidad y la tasa de error)
Consulte umbrales dinámicos para obtener instrucciones detalladas sobre el uso de umbrales dinámicos en las reglas de alertas de métrica.
Alertas de registro
Una regla de alertas de registro supervisa un recurso mediante una consulta de Log Analytics para evaluar los registros de los recursos según una frecuencia establecida. Si se cumplen las condiciones, se desencadena una alerta. Dado que puede usar consultas de Log Analytics, puede realizar operaciones lógicas avanzadas en los datos y usar las eficaces características de KQL para la manipulación de los datos de registro.
El destino de la regla de alertas de registro puede ser:
- Un único recurso, como una máquina virtual.
- Un único contenedor de recursos, como un grupo de recursos o una suscripción.
- Varios recursos que usan una consulta entre recursos.
Las alertas de registro pueden medir dos cosas diferentes, que se pueden usar para distintos escenarios de supervisión:
- Filas de tabla: el número de filas devueltas se puede usar para trabajar con eventos, como registros de eventos de Windows, Syslog y excepciones de aplicación.
- Cálculo de una columna numérica: se pueden usar cálculos a partir de cualquier columna numérica para incluir cualquier número de recursos. Un ejemplo es el porcentaje de CPU.
Puede configurar si las alertas de registro tienen estado o no. Esta funcionalidad actualmente está en su versión preliminar.
Nota
Las alertas de registro funcionan mejor cuando se intenta detectar datos específicos en los registros, en lugar de cuando se intenta detectar una falta de datos en los registros. Dado que los registros son datos semiestructurados, tienen intrínsecamente mayor latencia que los datos de métricas sobre información como el latido de una máquina virtual. Para evitar errores de activación cuando intente detectar una falta de datos en los registros, considere la posibilidad de usar alertas de métricas. Puede enviar datos al almacén de métricas desde los registros mediante alertas de métricas para registros.
Dimensiones en las reglas de alertas de registro
Puede usar dimensiones al crear reglas de alertas de registro para supervisar los valores de varias instancias de un recurso con una regla. Por ejemplo, puede supervisar el uso de CPU en varias instancias que ejecutan el sitio web o la aplicación. Cada instancia se supervisa individualmente. Se envían notificaciones para cada instancia.
División por dimensiones en las reglas de alertas de registro
Para supervisar la misma condición en varios recursos de Azure, puede usar la división por dimensiones. Si utiliza la división por dimensiones puede crear alertas centradas en recursos a gran escala para una suscripción o grupo de recursos. Las alertas se dividen en alertas independientes agrupando combinaciones mediante columnas numéricas o de cadena. La división en la columna de identificador de recurso de Azure convierte el recurso especificado en el destino de la alerta.
También puede decidir no dividirlas cuando quiere que una condición se aplique a varios recursos del ámbito. Por ejemplo, quiere activar una alerta si al menos cinco máquinas del ámbito del grupo de recursos tienen un uso de CPU por encima del 80 %.
Uso de la API
Administre nuevas reglas en las áreas de trabajo mediante scheduledQueryRules API.
Nota
Las alertas de registro de Log Analytics se administraban antes mediante la versión Alert API heredada de Log Analytics. Obtenga más información sobre cómo cambiar a la versión ScheduledQueryRules API actual.
Alertas de registro en la factura de Azure
Las alertas de registro aparecen bajo el proveedor de recursos microsoft.insights/scheduledqueryrules
con:
- Las alertas de registro en Application Insights se muestran con el nombre exacto del recurso junto con las propiedades del grupo de recursos y la alerta.
- Las alertas de registro de Log Analytics se muestran con el nombre exacto del recurso junto con las propiedades del grupo de recursos y la alerta cuando se crean mediante scheduledQueryRules API.
- Las alertas de registro creadas con la API de análisis de registros heredada no tienen un seguimiento en los recursos de Azure y no disponen de nombres de recurso únicos. Estas alertas se siguen creando en
microsoft.insights/scheduledqueryrules
como recursos ocultos, que tienen la estructura de nomenclatura de recursos<WorkspaceName>|<savedSearchId>|<scheduleId>|<ActionId>
. Las alertas de registro de la API heredada se muestran con el nombre de recurso oculto anterior junto con las propiedades del grupo de recursos y la alerta.
Nota
Caracteres de recursos no admitidos como <, >, %, &, , ? y se / sustituyen por un guion bajo (_) en los nombres de recursos ocultos. Este cambio de carácter también se refleja en la información de facturación.
Alertas de registros de actividad
Una alerta de registro de actividad supervisa un recurso comprobando los registros de actividad de un nuevo evento de registro de actividad que coincida con las condiciones definidas.
Es posible que quiera usar alertas de registro de actividad para estos tipos de escenarios:
- Cuando se produce una operación específica en los recursos de un grupo de recursos o una suscripción específicos. Por ejemplo, puede que quiera recibir una notificación cuando:
- Se elimina una máquina virtual de un grupo de recursos de producción.
- Se asignan roles nuevos a un usuario de la suscripción.
- Se produce un evento de Service Health. Los eventos de Service Health incluyen notificaciones de incidentes y eventos de mantenimiento que se aplican a recursos de la suscripción.
Puede crear una alerta de registro de actividad en:
- Cualquiera de las categorías de eventos del registro de actividad, distintas de los eventos de alerta.
- Cualquier evento del registro de actividad en la propiedad de nivel superior del objeto JSON.
Las regla de alertas del registro de actividad son recursos de Azure, por lo que pueden crearse con una plantilla de Azure Resource Manager. También se pueden crear, actualizar o eliminar en Azure Portal.
Una alerta de registro de actividad solo supervisa eventos de la suscripción en la que se ha creado la alerta.
Alertas de Service Health
Las alertas de Service Health son un tipo de alerta de actividad. Service Health le informa de interrupciones, actividades de mantenimiento planeado y otros avisos de mantenimiento, ya que tras la autenticación, Service Health conoce los servicios y recursos que usa en la actualidad.
La mejor forma de usar Service Health es configurar sus alertas para que le envíen notificaciones a través de sus canales de comunicación preferidos cuando los problemas del servicio, el mantenimiento planeado u otros cambios pueden afectar a los servicios y regiones de Azure que utiliza.
Alertas de Resource Health
Las alertas de Resource Health son un tipo de alerta de actividad. La información general de Resource Health ayuda a diagnosticar problemas en los servicios que afectan a los recursos de Azure y a obtener soporte técnico para resolverlos. Informa sobre el mantenimiento actual y pasado de los recursos.
Resource Health se basa en las señales procedentes de distintos servicios de Azure para evaluar si el mantenimiento de un recurso es correcto. Si el mantenimiento de un recurso no es correcto, Resource Health analiza más información para determinar el origen del problema. También informa sobre las acciones que Microsoft lleva a cabo para corregir el problema e identifica las acciones que usted puede tomar para solucionarlo.
Alertas de detección inteligente
Después de configurar Application Insights para su proyecto y de que la aplicación genere una cantidad determinada de datos, la detección inteligente tarda 24 horas en aprender el comportamiento normal de la aplicación. El rendimiento de una aplicación tiene un patrón típico de comportamiento. Algunas solicitudes o llamadas de dependencia son más propensas a errores que otras y la tasa de error general puede aumentar a medida que aumenta la carga.
La detección inteligente usa aprendizaje automático para encontrar estas anomalías. La detección inteligente supervisa los datos recibidos de su aplicación y, en particular, las tasas de errores. Application Insights le avisa automáticamente casi en tiempo real si la aplicación web sufre un aumento anómalo en la frecuencia de solicitudes erróneas.
A medida que Application Insights recibe datos de su aplicación web, la detección inteligente compara el comportamiento actual con los patrones vistos a lo largo de los últimos días. Si se produce un incremento anómalo de la tasa de errores en comparación con el rendimiento previo, se desencadena un análisis.
Para ayudarle a evaluar las prioridades y a diagnosticar un problema, en los detalles de la alerta se proporciona un análisis de las características de los errores, así como datos de la aplicación relacionados. También hay vínculos en el portal de Application Insights para obtener un diagnóstico más amplio. La característica no necesita instalación ni configuración, ya que usa algoritmos de aprendizaje automático para predecir la tasa normal de errores.
Aunque las alertas de métricas indiquen que podría haber un problema, la detección inteligente inicia automáticamente el trabajo de diagnóstico. Realiza gran parte del análisis que, de otra forma, tendría que hacer usted mismo. Los resultados se le presentan claramente organizados, lo que le ayuda a llegar rápidamente a la raíz del problema.
La detección inteligente funciona para cualquier aplicación web, hospedada en la nube o en sus propios servidores, que genere datos de dependencia o de solicitudes de la aplicación.
Alertas de Prometheus (versión preliminar)
Las alertas de Prometheus se basan en los valores de métrica almacenados en los servicios administrados de Azure Monitor para Prometheus. Se activan cuando el resultado de una consulta PromQL se resuelve como verdadero. Las alertas de Prometheus se muestran y administran como otros tipos de alerta cuando se activan, pero se configuran con un grupo de reglas de Prometheus. Para más información, consulte Grupos de reglas en el servicio administrado de Azure Monitor para Prometheus.
Pasos siguientes
- Obtener una Introducción a las alertas.
- Cree una regla de alertas.
- Más información sobre la detección inteligente.