Partager via


Résoudre des problèmes liés aux alertes de métrique Azure Monitor

Cet article aborde les questions fréquentes sur les alertes de métrique dans Azure Monitor et explique comment résoudre les problèmes.

Azure Monitor vous avertit de façon proactive lorsque des conditions significatives sont détectées dans vos données de surveillance. Elles permettent d’identifier et de résoudre les problèmes avant que les utilisateurs de votre système ne les remarquent. Pour plus d’informations sur les alertes, consultez Vue d’ensemble des alertes dans Microsoft Azure.

Une alerte de métrique ne s’est pas déclenchée alors que cela aurait dû être le cas

Si vous pensez qu’une alerte de métrique aurait dû se déclencher, mais que rien ne s’est produit et qu’elle n’est pas listée dans le portail Azure, effectuez les étapes suivantes :

  1. Passez en revue la configuration de la règle d’alerte de métrique.

    • Vérifiez que les valeurs spécifiées dans les champs Type d'agrégation, Granularité d'agrégation (période) sont configurées comme prévu. Le type d’agrégation détermine la façon dont les valeurs de métriques sont agrégées. Pour en savoir plus, consultez Explication de l’agrégation et de l’affichage des métriques Azure Monitor. Le paramètre Précision d’agrégation (période) spécifie jusqu’où l’évaluation doit remonter pour agréger les valeurs de métriques à chaque exécution de la règle d’alerte.

    • Vérifiez que les paramètres Valeur de seuil et Sensibilité sont configurés comme prévu.

    • Pour une règle d’alerte qui utilise des seuils dynamiques, vérifiez si les paramètres avancés sont configurés. Le nombre de violations peut filtrer les alertes et Ignorer les données avant peut affecter la façon dont les seuils sont calculés.

      Notes

      Les seuils dynamiques nécessitent au moins 3 jours et 30 échantillons de métriques avant de devenir actifs.

  2. Vérifiez si l’alerte s’est déclenchée, mais n’a pas envoyé de notification.

    Passez en revue la liste des alertes déclenchées pour essayer de localiser l’alerte déclenchée. Si l'alerte figure dans la liste, mais que vous rencontrez des problèmes avec certaines de ses actions ou notifications, consultez Résolution des problèmes relatives aux alertes Azure Monitor.

  3. Vérifiez si l’alerte est déjà active.

    Vérifiez si une alerte a déjà été déclenchée sur la série chronologique de métrique pour laquelle vous vous attendiez à recevoir une alerte. Les alertes de métriques sont avec état. Cela qui signifie qu’une fois qu’une alerte est déclenchée sur une série chronologique de métrique spécifique, des alertes supplémentaires sur cette série chronologique ne sont pas déclenchées tant que le problème n’est plus observé. Ce choix de conception réduit le bruit. L'alerte est automatiquement résolue lorsque la condition d'alerte n'est pas remplie au bout de trois évaluations consécutives.

  4. Vérifiez les dimensions utilisées.

    Si vous avez sélectionné des valeurs de dimension pour une métrique, la règle d’alerte surveille chaque série chronologique de métrique (comme défini par la combinaison de valeurs de dimension) pour détecter un dépassement de seuil. Pour superviser également la série chronologique de métrique agrégée (sans aucune dimension sélectionnée), configurez une autre règle d'alerte sur la métrique sans sélectionner de dimensions.

  5. Vérifiez la précision d’agrégation et la granularité temporelle.

    Si vous utilisez des graphiques de métriques, vérifiez que :

    • La valeur d'Agrégation sélectionnée dans le graphique de métriques est identique à la valeur de Type d'agrégation de votre règle d'alerte.
    • La valeur de Granularité temporelle sélectionnée est identique à la valeur de Granularité d'agrégation (période) de votre règle d'alerte, et qu'elle n'est pas définie sur Automatique.
  6. Vérifiez si la première période d’évaluation d’une série chronologique ne figure pas dans la règle d’alerte.

    Vous pouvez réduire le risque de manquer la première évaluation de la série chronologique ajoutée en veillant à choisir une Précision d’agrégation (période) supérieure à la Fréquence d’évaluation dans les cas suivants :

    • Quand une nouvelle combinaison de valeurs de dimension est ajoutée à une règle d’alerte de métrique qui surveille plusieurs dimensions.
    • Quand une nouvelle ressource est ajoutée à l’étendue d’une règle d’alerte de métrique qui surveille plusieurs ressources.
    • Quand la métrique est émise après une période de plus de 24 heures pendant laquelle elle n’a pas été émise, la règle d’alerte de métrique surveille une métrique qui n’est pas émise en continu (métrique éparse).

L’alerte de métrique n’est pas déclenchée chaque fois que la condition est remplie

Par défaut, un état est attribué aux alertes de métrique.donc aucune alerte supplémentaire n'est déclenchée si une alerte est déjà déclenchée sur une série chronologique spécifique. Pour créer une règle d’alerte de métrique spécifique et recevoir une alerte pour chaque évaluation dans laquelle la condition d’alerte est remplie, procédez de l’une des façons suivantes :

  • Si vous créez la règle d’alerte par programmation, par exemple via Azure Resource Manager, PowerShell, REST ou Azure CLI, définissez la propriété autoMitigate sur False.

  • Si vous créez la règle d’alerte dans le portail Azure, désactivez l’option Résoudre automatiquement les alertes, sous la section Détails des règles d’alerte. La fréquence des notifications pour les alertes de métriques sans état varie en fonction de la fréquence configurée de la règle d’alerte :

  • Fréquence d’alerte inférieure à 5 minutes : tant que la condition continue d’être remplie, une notification est envoyée à une fréquence comprise entre une et six minutes.

  • Fréquence d’alerte supérieure à 5 minutes : tant que la condition continue d’être remplie, une notification est envoyée à une fréquence comprise entre la valeur configurée et le double de la valeur. Par exemple, pour une règle d’alerte avec une fréquence de 15 minutes, une notification est envoyée à une fréquence comprise entre 15 et 30 minutes.

Notes

La création d’une règle d’alerte de métrique sans état empêche la résolution des alertes déclenchées. Ainsi, même après que la condition n’est plus remplie, les alertes déclenchées restent dans un état déclenché jusqu’à la période de rétention de 30 jours.

Une règle d’alerte de métrique avec un seuil dynamique ne se déclenche pas suffisamment

Vous trouverez sans doute une règle d’alerte qui utilise des seuils dynamiques mais qui ne se déclenche pas suffisamment ou n’est pas assez sensible, même si elle est configurée avec une sensibilité élevée. Ce cas peut se produire lorsque la répartition de la métrique est très irrégulière. Nous vous recommandons d’utiliser l’une des solutions suivantes pour résoudre le problème :

  • Passez à la surveillance d’une mesure complémentaire adaptée à votre scénario, le cas échéant. Par exemple, recherchez les modifications du taux de réussite, plutôt que le taux d’échec.
  • Essayez de sélectionner une valeur granularité d’agrégation (période) différente.
  • Vérifiez si le comportement de la métrique a subi une modification radicale, comme une panne, au cours des 10 derniers jours. Une modification soudaine peut avoir un impact sur les seuils supérieur et inférieur calculés pour la mesure et les rendre plus larges. Attendez quelques jours jusqu’à ce que la panne ne soit plus prise en compte dans le calcul des seuils. Vous pouvez également modifier la règle d’alerte pour utiliser l’option Ignorer les données avant dans Paramètres avancés.
  • Si vos données comportent un caractère saisonnier hebdomadaire, mais que l’historique n’est pas suffisant pour la métrique, les seuils calculés peuvent entraîner des limites supérieures et inférieures. Par exemple, le calcul peut traiter les jours de semaine et les week-ends de la même façon, et créer des bordures larges qui ne correspondent pas toujours aux données. Ce problème doit se résoudre une fois que l’historique des métriques est suffisant. Ensuite, la saisonnalité correcte est détectée, puis les seuils calculés se mettent à jour en conséquence.

Une alerte de métrique s’est déclenchée alors qu’elle n’aurait pas dû

Si vous pensez que votre alerte de métrique a été déclenchée à tort, la procédure ci-dessous peut vous aider à résoudre le problème.

  1. Passez en revue la liste des alertes déclenchées pour localiser l'alerte déclenchée. Sélectionnez une alerte pour afficher ses détails. Consultez les informations fournies sous Pourquoi cette alerte a-t-elle été déclenchée ? pour voir le graphique des métriques, la Valeur métrique et la Valeur seuil au moment où l'alerte a été déclenchée.

    Remarque

    Si vous utilisez des seuils dynamiques et pensez que les seuils utilisés ne sont pas corrects, envoyez un smiley mécontent en guise de commentaire. Ce commentaire affecte la recherche algorithmique de l'apprentissage automatique et contribuera à améliorer les détections futures.

  2. Si vous avez sélectionné plusieurs valeurs de dimension pour une métrique, l’alerte est déclenchée lorsqu’une métrique de la série chronologique (comme défini par la combinaison de valeurs de dimension) dépassera le seuil. Pour plus d’informations sur l’utilisation de dimensions dans les alertes de métrique, consultez Limiter la cible avec des dimensions.

  3. Vérifiez la configuration de la règle d'alerte pour vous assurer qu'elle est correcte :

    • Vérifiez que les valeurs spécifiées dans les champs Type d'agrégation, Granularité d'agrégation (période) ainsi que Valeur de seuil ou Sensibilité sont configurées comme prévu.
    • Pour une règle d'alerte qui utilise des seuils dynamiques, vérifiez si certains paramètres avancés sont configurés, car l'option Nombre de violations peut filtrer les alertes et l'option Ignorer les données avant peut avoir une incidence sur le calcul des seuils.

    Notes

    Les seuils dynamiques nécessitent au moins 3 jours et 30 échantillons de métriques avant de devenir actifs.

  4. Si vous utilisez des graphiques de métriques, vérifiez que :

    • La valeur d'Agrégation sélectionnée dans le graphique de métriques est identique à la valeur de Type d'agrégation de votre règle d'alerte.
    • La valeur de Granularité temporelle sélectionnée est identique à la valeur de Granularité d'agrégation (période) de votre règle d'alerte, et qu'elle n'est pas définie sur Automatique.
  5. Si l’alerte se déclenche alors que d'autres alertes (non résolues) surveillant les mêmes critères se sont déjà déclenchées, vérifiez si la règle d'alerte a été configurée pour ne pas résoudre les alertes automatiquement. Cela signifie que la règle d’alerte est sans état, qu’elle ne résout pas automatiquement les alertes déclenchées et qu’elle n’exige pas qu’une alerte déclenchée soit résolue avant de se déclencher à nouveau sur la même série chronologique. Pour vérifier si la règle d’alerte est configurée pour ne pas résoudre automatiquement :

    • Modifiez une règle d’alerte dans le portail Azure. Vérifiez si la case à cocher Résoudre automatiquement les alertes sous la section Détails de la règle d’alerte est désactivée.
    • Passez en revue le script utilisé pour déployer la règle d’alerte ou récupérer la définition de la règle d’alerte. Vérifiez si la propriété autoMitigate est définie sur false.

Une règle d’alerte de métrique avec des seuils dynamiques se déclenche trop ou est trop bruyante

Si une règle d’alerte qui utilise des seuils dynamiques est trop bruyante ou se déclenche trop, vous devrez peut-être réduire la sensibilité de votre règle d’alerte avec des seuils dynamiques. Utilisez l’une des options suivantes :

  • Seuil de sensibilité : Réglez la sensibilité sur Faible afin d'être plus tolérant aux écarts.
  • Nombre de violations (sous Paramètres avancés) : configurez la règle d’alerte pour qu’elle se déclenche uniquement si plusieurs écarts se produisent dans un laps de temps donné. Cela rend la règle moins vulnérable aux écarts temporaires.

Une règle d’alerte de métrique avec des seuils dynamiques affiche des valeurs qui sont en dehors de la plage de valeurs attendues

Lorsqu’une valeur de métrique présente des fluctuations importantes, les seuils dynamiques peuvent créer un modèle large autour des valeurs de métriques, ce qui peut entraîner une limite inférieure ou supérieure à celle attendue. Ce scénario peut se produire quand :

  • La sensibilité est définie sur faible.

  • La métrique présente un comportement irrégulier avec une forte variance, une apparence de pics ou de creux dans les données.

    Nous vous recommandons de rendre le modèle moins sensible en choisissant une sensibilité plus élevée ou en sélectionnant une période de recherche arrière plus grande. Vous pouvez également utiliser l’option Ignorer les données avant d’exclure une irrégularité récente des données historiques utilisées pour générer le modèle.

Problèmes de configuration des règles d’alerte de métrique

Métrique introuvable pour déclencher l'alerte

Si vous souhaitez alerter sur une métrique spécifique, mais que vous ne pouvez pas la voir lorsque vous créez une règle d’alerte, vérifiez pour déterminer :

Impossible de trouver la métrique sur laquelle porte l’alerte – métriques d’invités de machines virtuelles

Pour le bon fonctionnement des alertes relatives aux métriques du système d’exploitation invité de machines virtuelles (par exemple, la mémoire, l’espace disque), assurez-vous d’avoir installé l’agent requis pour collecter ces données dans Azure Monitor Metrics pour :

Pour plus d’informations sur la collecte de données à partir du système d’exploitation invité d’une machine virtuelle, voir ce site web.

Notes

Si vous avez configuré les métriques invitées pour qu'elles soient envoyées à un espace de travail Log Analytics, ces métriques apparaissent sous la ressource de l'espace de travail Log Analytics. Elles commencent à afficher les données uniquement après la création d'une règle d'alerte qui les supervise. Pour ce faire, suivez les étapes permettant de configurer une alerte de métrique pour les journaux.

La surveillance d’une métrique invitée pour plusieurs machines virtuelles avec une seule règle d’alerte n’est actuellement pas prise en charge par les alertes de métrique. Toutefois, vous pouvez utiliser une règle d’alerte de journal. Pour ce faire, assurez-vous que les métriques invitées sont collectées dans un espace de travail Log Analytics et créez une règle d’alerte de journal sur cet espace de travail.

Dimension de métrique introuvable pour déclencher l'alerte

Si vous souhaitez alerter sur des valeurs de dimension spécifiques d’une métrique, mais que vous ne trouvez pas ces valeurs :

  • L’affichage des valeurs de dimension sous la liste Valeurs de dimension peut prendre quelques minutes.
  • Les valeurs de dimension affichées se basent sur les données de métriques collectées au cours du dernier jour.
  • Si la valeur de dimension n’est pas encore émise ou n’est pas affichée, vous pouvez utiliser l’option Ajouter une valeur personnalisée pour ajouter une valeur de dimension personnalisée.
  • Si vous souhaitez déclencher une alerte sur l'ensemble des valeurs possibles d'une dimension (y compris les valeurs futures), choisissez l’option Sélectionner toutes les valeurs actuelles et futures.
  • Les dimensions de métriques personnalisées des ressources Application Insights sont désactivées par défaut. Pour activer la collecte de dimensions pour ces métriques personnalisées, consultez Métriques basées sur les journaux et pré-agrégées dans Application Insights.

Vous souhaitez configurer une règle d’alerte sur une métrique personnalisée qui n’est pas encore émise

Lors de la création d’une règle d’alerte de métrique, le nom de la métrique est validé par rapport à l’API de définitions de métriques pour s’assurer qu’elle existe. Dans certains cas, vous pouvez être amené à créer une règle d’alerte sur une métrique personnalisée avant qu’elle soit émise. Un exemple consiste à utiliser un modèle Resource Manager pour créer une ressource Application Insights qui émettra une métrique personnalisée, en même temps qu’une règle d’alerte qui surveille cette métrique.

Pour éviter un échec de déploiement lorsque vous essayez de valider les définitions de la métrique personnalisée, utilisez le paramètre skipMetricValidation dans la section criteria de la règle d’alerte. Ce paramètre entraîne la non-validation des métriques. Consultez l’exemple suivant pour savoir comment utiliser ce paramètre dans un modèle Resource Manager. Pour plus d’informations, consultez les exemples de modèles Resource Manager complets pour la création de règles d’alerte de métrique.

"criteria": {
    "odata.type": "Microsoft.Azure.Monitor.SingleResourceMultipleMetricCriteria",
        "allOf": [
            {
                "name" : "condition1",
                "metricName": "myCustomMetric",
                "metricNamespace": "myCustomMetricNamespace",
                "dimensions":[],
                "operator": "GreaterThan",
                "threshold" : 10,
                "timeAggregation": "Average",
                "skipMetricValidation": true
            }
        ]
    }

Notes

L’utilisation du paramètre skipMetricValidation peut également être requise lors de la définition d’une règle d’alerte sur une métrique personnalisée existante qui n’a pas été émise en plusieurs jours.

Avertissements et erreurs lors de la configuration de règles d’alerte de métrique

Avertissement : les seuils dynamiques ne sont actuellement pas disponibles pour cette métrique

Les seuils dynamiques sont pris en charge pour la plupart des métriques, mais pas pour toutes. Pour obtenir la liste des métriques, reportez-vous à Métriques non prises en charge par les seuils dynamiques.

Erreur : la métrique n’est pas disponible pour l’étendue sélectionnée. Cela peut se produire si la métrique s’applique uniquement à une version ou à une référence SKU spécifique

Passez en revue la description de la métrique dans Métriques prises en charge avec Azure Monitor pour déterminer si elle est uniquement disponible dans des versions ou éditions spécifiques de la ressource ou ce type spécifique.

Par exemple, dans Ressources SQL Database ou Services de fichiers et de stockage, il existe des métriques spécifiques uniquement prises en charge sur des versions spécifiques de la ressource.

Erreur : il n’y a aucun signal disponible à afficher. Essayez de modifier l’étendue de cette règle d’alerte

Cette erreur indique un problème avec le périmètre de la règle d’alerte. Cela peut se produire lors de la modification d’une règle d’alerte ciblant un type de ressource qui prend en charge la configuration multi-ressource (comme une machine virtuelle ou une base de données SQL), et en essayant d’ajouter une autre ressource du même type, mais d’une région différente. L’alerte sur plusieurs ressources du même type provenant de différentes régions n’est pas prise en charge dans les alertes de métriques.

Les limites de service pour les règles d’alerte de métrique sont trop petites

Le nombre autorisé de règles d’alerte de métrique par abonnement est soumis à des limites de service.

Consultez Vérifier le nombre de règles d’alerte de métrique en cours d’utilisation pour voir le nombre de règles d’alerte de métrique actuellement utilisées.

Si vous avez atteint la limite de service, les étapes suivantes peuvent vous aider à résoudre le problème :

  1. Essayez de supprimer ou de désactiver les règles d'alerte de métrique qui ne sont plus utilisées.
  2. Utilisez plutôt des règles d’alerte de métrique qui supervisent plusieurs ressources. Avec cette fonctionnalité, une même règle d'alerte peut superviser plusieurs ressources en utilisant une seule règle d'alerte comptabilisée dans le quota. Pour plus d’informations sur cette fonctionnalité et sur les types de ressources pris en charge, consultez Alertes de métrique.
  3. Si vous avez besoin d'augmenter la limite de quota, ouvrez une demande de support et fournissez les informations suivantes :
    • ID d'abonnement pour lesquels la limite de quota doit être relevée.
    • Type de ressource pour l’augmentation de quota. Sélectionnez Alertes de métrique.
    • Limite de quota demandée.

Étapes suivantes

Pour obtenir des informations de dépannage générales sur les alertes et les notifications, consultez Résolution des problèmes relatifs aux alertes Azure Monitor.