Tipos de alertas de Azure Monitor

En este artículo se describen los tipos de alertas de Azure Monitor que puede crear y se le ayuda a saber cuándo hay que usar cada tipo de alerta.

Hay cuatro tipos de alertas:

Elección del tipo de alerta correcto

Esta tabla puede ayudarle a decidir cuándo usar cada tipo de alerta. Para obtener información más detallada sobre los precios, consulte la página de precios.

Tipo de alerta Casos en los que se debe usar Información de precios
Alerta de métrica Los datos de métricas se almacenan en el sistema ya calculados. Las alertas de métrica son útiles si quiere recibir alertas sobre los datos que requieren poca o ninguna manipulación. Si los datos que quiere supervisar están disponibles en los datos de métricas, se recomiendan alertas de métrica. Cada regla de alertas de métricas se cobra en función del número de series temporales que se supervisan.
Alerta de registro Las alertas de registro permiten realizar operaciones lógicas avanzadas en los datos. Si los datos que quiere supervisar están disponibles en los registros o requieren lógica avanzada, puede usar las eficaces características de KQL para la manipulación de datos mediante alertas de registro. Cada regla de alerta de registro se factura en función del intervalo en el que se evalúa la consulta de registro (una evaluación de consultas más frecuente supone mayor costo). Además, para las alertas de registro configuradas para la supervisión a escala, el costo también depende del número de series temporales que hayan creado las dimensiones resultantes de la consulta.
Alerta de registro de actividad Los registros de actividad proporcionan auditoría de todas las acciones que se produjeron en los recursos. Use alertas de registro de actividad para recibir alertas cuando se produzca un evento específico en un recurso, por ejemplo, cuando se reinicie, se apague, se cree o elimine un recurso. Las alertas de Service Health y Resource Health alertas pueden avisarle cuando haya un problema con uno de los servicios o recursos. Consulte la página de preciospara obtener más información.
Alertas de Prometheus (versión preliminar) Las alertas de Prometheus se usan principalmente para alertar sobre el rendimiento y el estado de los clústeres de Kubernetes (incluido AKS). Las reglas de alerta se basan en PromQL, que es un lenguaje de consulta de código abierto. No hay ningún cargo por las alertas de Prometheus durante el período de versión preliminar.

Alertas de métricas

Una regla de alertas de métrica supervisa un recurso mediante la evaluación de las condiciones de las métricas de recursos a intervalos regulares. Si se cumplen las condiciones, se desencadena una alerta. Una serie temporal de métricas es una serie de valores de métricas capturados durante un período de tiempo.

Puede crear reglas mediante estas métricas:

Las reglas de alertas de métrica incluyen estas características:

El destino de la regla de alertas de métrica puede ser:

  • Un único recurso, como una máquina virtual. Consulte este artículo para ver los tipos de recurso admitidos.
  • Varios recursos del mismo tipo en la misma región de Azure, como un grupo de recursos.

Varias condiciones

Al crear una regla de alertas para un único recurso, puede aplicar varias condiciones. Por ejemplo, podría crear una regla de alertas para supervisar una máquina virtual de Azure y generar una alerta si el porcentaje de CPU supera el 90 % y la longitud de la cola es de más de 300 elementos. Cuando una regla de alertas tiene varias condiciones, la alerta se desencadena cuando se cumplen todas las condiciones de la regla de alertas y se resuelve cuando al menos una de las condiciones ya no se cumple durante tres comprobaciones consecutivas.

Reducción del destino mediante dimensiones

Las dimensiones son pares nombre-valor que contienen datos adicionales sobre el valor de métrica. El uso de dimensiones permite filtrar las métricas y supervisar series temporales específicas, en lugar de supervisar el agregado de todos los valores dimensionales. Por ejemplo, la métrica Transacciones de una cuenta de almacenamiento puede tener una dimensión Nombre de API que contiene el nombre de la API a la que llama cada transacción (por ejemplo, GetBlob, DeleteBlob, PutPage). Puede elegir que se desencadene una alerta cuando haya un gran número de transacciones en cualquier nombre de API (que son los datos agregados), o bien puede usar dimensiones a fin de dividirla para que se produzca una alerta solo cuando el número de transacciones sea elevado para los nombres de API. Si usa más de una dimensión, la regla de alertas de métrica puede supervisar varios valores de dimensión de diferentes dimensiones de una métrica. La regla de alertas supervisa de forma independiente todas las combinaciones de valores de dimensión. Consulte este artículo para obtener instrucciones detalladas sobre el uso de dimensiones en las reglas de alertas de métrica.

Creación de alertas centradas en recursos mediante la división por dimensiones

Para supervisar la misma condición en varios recursos de Azure, puede usar la división por dimensiones. La división por dimensiones permite crear alertas centradas en recursos a gran escala para una suscripción o grupo de recursos. Las alertas se dividen en alertas independientes mediante la agrupación de combinaciones. La división en la columna de identificador de recurso de Azure convierte el recurso especificado en el destino de la alerta.

También puede decidir no dividirlas cuando quiere una condición aplicada a varios recursos del ámbito. Por ejemplo, si quiere activar una alerta si al menos cinco máquinas del ámbito del grupo de recursos tienen un uso de CPU por encima del 80 %.

Supervisión de varios recursos

Puede supervisar a gran escala aplicando la misma regla de alertas de métrica a varios recursos del mismo tipo para los recursos que se encuentren en la misma región de Azure. Se envían notificaciones individuales para cada recurso supervisado.

Se admiten las métricas de plataforma para estos servicios en las siguientes nubes de Azure:

Servicio Azure global Government China
Máquinas virtuales*
Bases de datos de SQL Server
Grupos elásticos de SQL Server
Grupos de capacidad de NetApp Files
Volúmenes de NetApp Files
Almacenes de claves
Azure Cache for Redis
Azure Stack Edge devices
Almacenes de Recovery Services No No
Azure Database for PostgreSQL: servidor flexible

Nota

Las alertas de métricas de varios recursos no se admiten en los escenarios siguientes:

  • Alertas sobre las métricas de invitado de las máquinas virtuales
  • Alertas sobre las métricas de red de máquinas virtuales (Entrada de red total, Salida de red total, Flujos de entrada, Flujos de salida, Velocidad máxima de creación de flujos entrantes, Velocidad máxima de creación de flujos salientes).

El ámbito de supervisión se puede especificar con una sola regla de alertas de métrica de tres formas distintas. Por ejemplo, respecto a las máquinas virtuales, el ámbito se puede especificar como:

  • una lista de máquinas virtuales (de una región de Azure) en una suscripción
  • todas las máquinas virtuales (de una región de Azure) en uno o varios grupos de recursos de una suscripción
  • todas las máquinas virtuales (de una región de Azure) en una suscripción

Umbrales dinámicos

Los umbrales dinámicos usan el aprendizaje automático avanzado (ML) para:

  • Obtener información acerca del comportamiento histórico de las métricas
  • Identificar patrones y adaptarlos a los cambios que se producen en las métricas con el tiempo, como, por ejemplo, patrones de cada hora, día o semana
  • Reconocer anomalías que indiquen posibles problemas de servicio
  • Calcular el umbral más adecuado para la métrica

Machine Learning usa continuamente nuevos datos para obtener más información y hacer que el umbral sea más preciso. Dado que el sistema se adapta al comportamiento de las métricas con el paso del tiempo y genera alertas en función de las desviaciones de su patrón, no es necesario conocer el umbral "correcto" de cada métrica.

Los umbrales dinámicos le ayudan a:

  • Crear alertas escalables para cientos de series de métricas con una regla de alertas. Si tiene menos reglas de alerta, dedica menos tiempo a crearlas y administrarlas.
  • Crear reglas sin tener que saber qué umbral configurar
  • Configurar alertas de métrica mediante conceptos de alto nivel sin un amplio conocimiento del dominio acerca de la métrica
  • Evitar umbrales con ruido (poca precisión) o amplios (poco recuerdo) que no tengan un patrón esperado
  • Controlar métricas con ruido (como la memoria o la CPU del equipo), así como las métricas con poca dispersión (como la disponibilidad y la tasa de error)

Consulte este artículo para obtener instrucciones detalladas sobre el uso de umbrales dinámicos en las reglas de alertas de métrica.

Alertas de registro

Una regla de alertas de registro supervisa un recurso mediante una consulta de Log Analytics para evaluar los registros de los recursos según una frecuencia establecida. Si se cumplen las condiciones, se desencadena una alerta. Dado que puede usar consultas de Log Analytics, puede realizar operaciones lógicas avanzadas en los datos y usar las eficaces características de KQL para la manipulación de los datos de registro.

El destino de la regla de alertas de registro puede ser:

  • Un único recurso, como una máquina virtual.
  • Un único contenedor de recursos, como un grupo de recursos o una suscripción.
  • Varios recursos, mediante el uso de una consulta entre recursos.

Las alertas de registro pueden medir dos cosas diferentes, que se pueden usar para distintos escenarios de supervisión:

  • Filas de tabla: el número de filas devueltas se puede usar para trabajar con eventos como registros de eventos de Windows, syslog y excepciones de aplicación.
  • Cálculo de una columna numérica: se pueden usar cálculos a partir de cualquier columna numérica para incluir cualquier número de recursos. Por ejemplo, porcentaje de CPU.

Puede configurar si las alertas de registro tienen estado o no (actualmente en versión preliminar).

Nota:

Las alertas de registro funcionan mejor cuando intenta detectar datos específicos en los registros, en lugar de cuando intenta detectar una falta de datos en los registros. Dado que los registros son datos semiestructurados, tienen intrínsecamente mayor latencia que los datos de métricas sobre información como el latido de una máquina virtual. Para evitar errores de activación cuando intente detectar una falta de datos en los registros, considere la posibilidad de usar alertas de métrica. Puede enviar datos al almacén de métricas desde los registros mediante alertas de métricas para registros.

Dimensiones en las reglas de alertas de registro

Puede usar dimensiones al crear reglas de alertas de registro para supervisar los valores de varias instancias de un recurso con una regla. Por ejemplo, puede supervisar el uso de CPU en varias instancias que ejecutan el sitio web o la aplicación. Cada una de las instancias se supervisa individualmente y se envían notificaciones para las mismas.

División por dimensiones en las reglas de alertas de registro

Para supervisar la misma condición en varios recursos de Azure, puede usar la división por dimensiones. La división por dimensiones permite crear alertas centradas en recursos a gran escala para una suscripción o grupo de recursos. Las alertas se dividen en alertas independientes agrupando combinaciones mediante columnas numéricas o de cadena. La división en la columna de identificador de recurso de Azure convierte el recurso especificado en el destino de la alerta. También puede decidir no dividirlas cuando quiere una condición aplicada a varios recursos del ámbito. Por ejemplo, si quiere activar una alerta si al menos cinco máquinas del ámbito del grupo de recursos tienen un uso de CPU por encima del 80 %.

Uso de la API

Administre nuevas reglas en las áreas de trabajo mediante scheduledQueryRules API.

Nota

Las alertas de registro de Log Analytics se administraban antes mediante la versión Alert API heredada de Log Analytics. Obtenga más información sobre cómo cambiar a la versión ScheduledQueryRules API actual.

Alertas de registro en la factura de Azure

Las alertas de registro aparecen bajo el proveedor de recursos microsoft.insights/scheduledqueryrules con:

  • Las alertas de registro en Application Insights se muestran con el nombre exacto del recurso junto con las propiedades del grupo de recursos y la alerta.
  • Las alertas de registro de Log Analytics se muestran con el nombre exacto del recurso junto con las propiedades del grupo de recursos y la alerta, cuando se crean mediante scheduledQueryRules API.
  • Las alertas de registro creadas con la API heredada de Log Analytics no son recursos de Azure con seguimiento y no tienen nombres de recurso únicos. Estas alertas se siguen creando en microsoft.insights/scheduledqueryrules como recursos ocultos, que tienen la estructura de nomenclatura de recursos <WorkspaceName>|<savedSearchId>|<scheduleId>|<ActionId>. Las alertas de registro de la API heredada se muestran con el nombre de recurso oculto anterior junto con las propiedades del grupo de recursos y la alerta.

Nota

Los caracteres de recursos no admitidos como <, >, %, &, , ?, / se reemplazan por _ en los nombres de recursos ocultos, lo que también se reflejará en la información de facturación.

Alertas de registros de actividad

Una alerta de registro de actividad supervisa un recurso comprobando los registros de actividad de un nuevo evento de registro de actividad que coincida con las condiciones definidas.

Es posible que quiera usar alertas de registro de actividad para estos tipos de escenarios:

  • Cuando se produce una operación específica en los recursos de un grupo de recursos o una suscripción específicos. Por ejemplo, puede que quieras recibir una notificación cuando:
    • Se elimine cualquier máquina virtual de un grupo de recursos de producción.
    • Se asigne cualquier rol nuevo a un usuario de la suscripción.
  • Se produce un evento de mantenimiento del servicio. Los eventos de mantenimiento del servicio incluyen las notificaciones de incidentes y eventos de mantenimiento que se aplican a recursos de la suscripción.

Puede crear una alerta de registro de actividad en:

  • Cualquiera de las categorías de eventos del registro de actividad, distintas de los eventos de alerta.
  • Cualquier evento del registro de actividad en la propiedad de nivel superior del objeto JSON.

Las regla de alertas del registro de actividad son recursos de Azure, por lo que pueden crearse con una plantilla de Azure Resource Manager. También se pueden crear, actualizar o eliminar en Azure Portal.

Una alerta de registro de actividad solo supervisa eventos de la suscripción en la que se ha creado la alerta.

Alertas de Service Health

Las alertas de Service Health son un tipo de alerta de actividad. Service Health le informa de interrupciones, actividades de mantenimiento planeado y otros avisos de mantenimiento, ya que tras la autenticación, Service Health conoce los servicios y recursos que usa en la actualidad.

La mejor forma de usar Service Health es configurar sus alertas para que le envíen notificaciones a través de sus canales de comunicación preferidos cuando los problemas del servicio, el mantenimiento planeado u otros cambios puedan afectar a los servicios y regiones de Azure que utilice.

Alertas de Resource Health

Las alertas de Resource Health son un tipo de alerta de actividad. La información general de Resource Health ayuda a diagnosticar problemas en los servicios que afectan a los recursos de Azure y a obtener soporte técnico para resolverlos. Informa sobre el mantenimiento actual y pasado de los recursos. Resource Health se basa en las señales procedentes de distintos servicios de Azure para evaluar si el mantenimiento de un recurso es correcto. Si el mantenimiento de un recurso no es correcto, Resource Health analiza información adicional para determinar el origen del problema. También informa sobre las acciones que Microsoft lleva a cabo para corregir el problema e identifica las medidas que usted puede tomar para solucionarlo.

Alertas de detección inteligente

Después de configurar Application Insights para su proyecto, si la aplicación genera una cantidad mínima determinada de datos, la detección inteligente tarda 24 horas en aprender el comportamiento normal de la aplicación. El rendimiento de una aplicación tiene un patrón típico de comportamiento. Algunas solicitudes o llamadas de dependencia son más propensas a errores que otras; y la tasa de error general puede aumentar a medida que aumenta la carga. La detección inteligente usa aprendizaje automático para encontrar estas anomalías. La detección inteligente supervisa los datos recibidos de su aplicación y, en particular, las tasas de errores. Application Insights le avisa automáticamente casi en tiempo real si la aplicación web sufre un aumento anómalo en la frecuencia de solicitudes erróneas.

A medida que Application Insights recibe datos de su aplicación web, la detección inteligente compara el comportamiento actual con los patrones vistos a lo largo de los últimos días. Si se produce un incremento anómalo de la tasa de errores en comparación con el rendimiento previo, se desencadena un análisis. Para ayudarle a evaluar las prioridades y a diagnosticar el problema, en los detalles de la alerta se proporciona un análisis de las características de los errores, así como datos de la aplicación relacionados. También hay vínculos en el portal de Application Insights para obtener un diagnóstico más amplio. La característica no necesita ninguna instalación o configuración, ya que usa algoritmos de aprendizaje automático para predecir la tasa normal de errores.

Aunque las alertas de métrica te indican que puede haber un problema, la detección inteligente inicia el trabajo de diagnóstico y realiza gran parte del análisis que, de otra forma, tendría que hacer usted mismo. Los resultados se le presentan claramente organizados, lo que le ayuda a llegar rápidamente a la raíz del problema.

La detección inteligente funciona para cualquier aplicación web, hospedada en la nube o en sus propios servidores, que genere datos de dependencia o de solicitudes de la aplicación.

Alertas de Prometheus (versión preliminar)

Las alertas de Prometheus se basan en los valores de métrica almacenados en los servicios administrados de Azure Monitor para Prometheus. Se activan cuando los resultados de una consulta PromQL se resuelven como verdaderos. Las alertas de Prometheus se muestran y administran como otros tipos de alerta cuando se activan, pero se configuran con un grupo de reglas de Prometheus. Para más información, consulte Grupos de reglas en el servicio administrado de Azure Monitor para Prometheus.

Pasos siguientes