Recommandations pour la collecte des données de performances
S’applique à cette recommandation de liste de contrôle d’efficacité des performances d’Azure Well-Architected Framework :
PE :04 | collecte les données de performances. Les composants et les flux de charge de travail doivent fournir des métriques et des journaux automatiques, continus et significatifs. Collectez des données à différents niveaux de la charge de travail, telles que l’application, la plateforme, les données et les niveaux du système d’exploitation. |
---|
La collecte de données de performance est le processus de collecte de métriques et de journaux qui fournissent des informations sur la performance d'une charge de travail. Ces données incluent des valeurs numériques, appelées métriques. Les métriques décrivent l’état du système à un moment donné. Il inclut également les journaux qui contiennent différents types de données organisés en enregistrements.
En collectant des données de performances, vous pouvez surveiller et analyser les performances d’une charge de travail. Vous pouvez utiliser ces informations pour identifier les goulots d'étranglement, résoudre les problèmes, optimiser l'allocation des ressources et prendre des décisions fondées sur des données afin d'améliorer les performances globales de la charge de travail.
Sans insights pilotés par les données, vous ne connaissez peut-être pas les problèmes de performances sous-jacents ou les opportunités d’optimisation. Les résultats potentiels incluent des temps de réponse plus lents, une diminution du débit, une utilisation accrue des ressources et, finalement, une expérience utilisateur non optimale. En outre, le manque de données de performances rend difficile le diagnostic et la résolution des problèmes en temps opportun, ce qui entraîne un temps d’arrêt prolongé et une productivité réduite.
Définitions
Terme | Définition |
---|---|
Journaux d’activité | Journaux qui effectuent le suivi des opérations de gestion sur les ressources, telles que la suppression d’une ressource. |
Journaux d’activité d’application | Journaux qui suivent les informations sur les événements, erreurs et autres activités d’application, tels que les échecs de connexion et de connexion de base de données. |
Outil D’analyse des performances des applications (APM) | Outil qui surveille et signale les performances d’une application. |
Instrumentation du code | Capture directe ou indirecte des métriques de performances du point de vue du code de l’application. Les métriques capturées incluent les métriques de flux, l’utilisation des ressources et les métriques spécifiques au langage ou au runtime. |
Traçage distribué | Collecte et corrélation des métriques entre les composants de charge de travail distribués. |
Récepteur de métriques | Destination de stockage pour vos métriques qui met en corrélation les données de série chronologique à des fins d’analyse. |
Journaux de plateforme | Données de diagnostic et d’audit qui incluent les journaux de ressources, les journaux d’activité et les journaux d’audit. |
Métriques de plateforme | Valeurs numériques qui enregistrent les performances de la charge de travail à un moment donné. |
Journaux d’activité de ressources | Données générées par un système. Il fournit des informations sur l’état du système. |
Erreurs Rx/Tx | Nombre d’erreurs de réception et de transmission d’erreurs sur une interface réseau. |
Journalisation structurée | Définition d’un format explicite pour journaliser les messages, généralement en tant que paires clé-valeur. |
Stratégies de conception
L’optimisation des performances nécessite des données pour mesurer les performances actuelles d’une charge de travail ou d’un flux par rapport à ses objectifs de performances. Vous devez collecter la quantité et la diversité de données appropriées pour mesurer les performances du code et l’infrastructure par rapport aux cibles de performances. Assurez-vous que chaque composant et flux au sein de la charge de travail génère automatiquement des métriques et des journaux continus et significatifs. Vous devez sourcer ces données à partir de différents niveaux comme l’application, la plateforme, le stockage et le système d’exploitation. La collecte complète des données de performances permet une compréhension holistique des performances, ce qui permet une identification précise des inefficacités et des voies d’amélioration.
Centraliser la collecte des données de performances
La centralisation des mesures de performance et des journaux consiste à collecter des mesures de performance et des journaux provenant de différentes sources et à les stocker dans un emplacement central. Créez un récepteur central de métriques et un récepteur central de journaux. Cette centralisation facilite l'accès, l'analyse et la surveillance des mesures de performance et des journaux dans les différents systèmes et composants. En centralisant les métriques et les journaux, vous bénéficiez d’une visibilité sur les performances de votre charge de travail. Choisissez une plateforme ou un outil approprié qui peut agréger et stocker les métriques et journaux de performances des charges de travail.
Compromis : comprendre le coût de la collecte des métriques et des journaux. En général, plus vous collectez de métriques et de journaux, plus le coût est élevé.
Données de performances de segment
La segmentation des données de performance consiste à organiser et à classer les mesures et les journaux en fonction de leur origine, de leur objectif ou de leur environnement. Par exemple, vous devez séparer les données de production des données de non-production ou faire la distinction entre les cibles de performances et les métriques métier. La segmentation des données permet d'optimiser des environnements spécifiques, de faciliter le dépannage et de limiter les imprécisions dans le contrôle des performances. En conservant une distinction claire entre différents types de données, vous pouvez capturer, analyser et répondre aux métriques pertinentes de manière plus efficace et mieux aligner l’intégrité de la charge de travail avec les objectifs de charge de travail. Pour segmenter les données de performances, tenez compte des recommandations suivantes :
Séparez les données de production et les données hors production. En séparant les données par environnement, vous pouvez garantir la supervision et l’optimisation prioritaires de chaque environnement. Dans les environnements de production, vous pouvez mieux identifier et résoudre les problèmes de performances qui affectent directement les utilisateurs et les opérations métier. Dans les environnements hors production, la séparation des données facilite la résolution des problèmes et le réglage précis pendant la phase de test avant de déployer en production.
Utilisez un jeu de données dans chaque environnement. N’utilisez pas un ensemble de données pour les cibles de performances et un autre ensemble de données pour les alertes liées aux cibles de performances. L’utilisation de différents ensembles de données entraîne des alertes inexactes qui sapent l’efficacité de la surveillance des performances.
Séparez les objectifs de performances et les métriques métier. Les équipes d’exploitation et de développement utilisent des cibles de performances pour surveiller l’intégrité de la charge de travail et répondre aux objectifs métier. Les métriques métier sont liées aux objectifs métier ou aux rapports clients. Capturez les métriques métier dans un flux de données distinct, même si les données se chevauchent directement. La séparation vous offre la possibilité de capturer les données appropriées et d’analyser les données indépendamment.
Définir des stratégies de rétention
Les stratégies de conservation déterminent la durée pendant laquelle les données relatives aux performances doivent être conservées. La mise en place de ces politiques permet de gérer efficacement le stockage et de s'assurer que seules les données nécessaires sont accessibles à des fins d'analyse. Ces stratégies permettent d’améliorer les performances et de respecter les normes de conformité. Vous devez configurer des stratégies de rétention pour les données de journal et de métriques pour permettre une résolution des problèmes et une surveillance efficaces dans tous les environnements. Par exemple, les journaux et les métriques doivent être conservés pendant plus de temps dans un environnement de production que dans l’environnement de test. La période de rétention doit correspondre aux exigences et aux réglementations de conformité de votre organisation. Déterminez la durée de conservation des données à des fins d’analyse et d’audit. Archivez les données dont vous n’avez pas besoin pour une analyse immédiate.
Collecter les données de performances des applications
La collecte des données d’application implique la surveillance et l’analyse des métriques de performances d’une application, telles que le débit, la latence et les temps d’achèvement, principalement collectés par le biais du code d’instrumentation. Les données de performances des applications fournissent des insights précieux sur l’intégrité et les performances d’une application. En analysant et en analysant les données de performances, vous pouvez identifier et résoudre les problèmes, optimiser les performances des applications et prendre des décisions éclairées pour votre application.
Code d’instrument
L’instrumentation fait référence au processus d’incorporation d’extraits de code ou d’intégration d’outils dans un code d’application. L’objectif de l’instrumentation est de capturer les données de performances pendant l’exécution de l’application. Il est essentiel de collecter des métriques qui mettent en évidence les opérations critiques de l’application. Concentrez-vous sur les métriques telles que le débit, la latence et le temps d’achèvement. Il est important de différencier les opérations liées à l’entreprise et les opérations qui ne le sont pas. Pour les données relatives aux opérations métier, assurez-vous que ses métadonnées sont structurées de manière à permettre un suivi et un stockage distincts. La principale raison de l’instrumentation du code consiste à collecter des données sur la façon dont l’application gère sa charge de travail. Cela fournit les avantages suivants :
Identification des goulots d’étranglement des performances : en suivant les métriques telles que l’utilisation du processeur et la mémoire, vous pouvez identifier les goulots d’étranglement et optimiser le code en conséquence.
Évaluation du comportement du système sous une charge : vous pouvez voir comment l’application s’exécute sous différentes charges de travail et scénarios de stress. Ces données peuvent vous aider à identifier les problèmes liés à l’extensibilité, à la concurrence et à l’utilisation des ressources.
Suivi de l’intégrité et de la disponibilité des applications : étant donné que les indicateurs de performances clés sont surveillés en temps réel, vous pouvez obtenir des alertes sur les problèmes potentiels qui affectent les performances et la disponibilité de l’application.
Améliorer l’expérience utilisateur : vous pouvez obtenir des insights sur la façon dont les utilisateurs interagissent avec l’application. Utilisez ces informations pour optimiser l’expérience utilisateur et identifier les domaines d’amélioration.
Planifier la capacité et allouer des ressources : les données de performances collectées par l’instrumentation peuvent fournir des informations précieuses sur les besoins en ressources d’une application. Ces informations peuvent informer vos décisions sur la planification de la capacité et l’allocation de ressources.
Lorsque vous instrumentez le code pour l’analyse des performances, tenez compte des stratégies suivantes :
Utilisez les outils APM : les outils APM peuvent collecter et analyser les données de performances, notamment les métriques, les traces et les journaux. Les outils APM offrent des fonctionnalités telles que l’instrumentation au niveau du code, le suivi des transactions et le profilage des performances.
Utilisez des infrastructures de journalisation et de suivi : les infrastructures de journalisation et de suivi sont des outils ou des bibliothèques que les développeurs intègrent à leurs applications pour faciliter la journalisation et le suivi. Ces frameworks fournissent des fonctions pour générer des journaux, des demandes de trace, et parfois même mettre en forme ou transporter les données générées. En incorporant des infrastructures de journalisation et de suivi dans la base de code, les développeurs peuvent capturer des données pertinentes pendant l’exécution. Les données peuvent inclure des informations sur le chemin d’exécution, les E/S et les performances.
Instrumentation personnalisée : les développeurs peuvent ajouter du code personnalisé pour collecter des métriques de performances uniques à leur application et à leur charge de travail. L’instrumentation personnalisée peut mesurer les runtimes, suivre l’utilisation des ressources ou capturer des événements spécifiques. Écrire une instrumentation de code personnalisée uniquement lorsque les métriques de plateforme sont insuffisantes. Dans certaines situations, la ressource de plateforme peut mesurer les perspectives agrégées ou même granulaires de votre application. Pesez la question de savoir s’il faut dupliquer cet effort en utilisant du code personnalisé contre des compromis de code excessifs ou une dépendance sur une fonctionnalité de plateforme.
Capturez les temps de transaction. La capture des temps de transaction concerne la mesure des heures de bout en bout pour les fonctions techniques clés dans le cadre de la surveillance des performances. Les métriques au niveau de l’application doivent inclure des temps de transaction de bout en bout. Ces temps de transaction doivent couvrir les fonctions techniques clés telles que les requêtes de base de données, les temps de réponse pour les appels d’API externes et les taux d’échec des étapes de traitement.
Utilisez des normes de télémétrie. Envisagez d’utiliser des bibliothèques d’instrumentation d’outils APM et des outils conçus autour d’une norme de télémétrie, comme OpenTelemetry.
Activer le suivi distribué
Le suivi distribué est une technique utilisée pour suivre et surveiller les requêtes au fur et à mesure qu’elles transitent par un système distribué. Il vous permet de suivre le chemin d’une requête au fur et à mesure qu’elle se déplace sur plusieurs services et composants, fournissant des insights précieux sur les performances et l’efficacité de votre charge de travail. Le suivi distribué est important pour l’efficacité des performances, car il permet d’identifier les goulots d’étranglement, les problèmes de latence et les zones d’optimisation au sein d’un système distribué. Vous pouvez identifier l’endroit où des retards ou des inefficacités se produisent et prendre les mesures appropriées pour améliorer les performances en visualisant le flux d’une requête. Procédez comme suit pour activer le suivi distribué :
Commencez par instrumenter vos applications et services pour générer des données de trace. Utilisez des bibliothèques ou des frameworks qui prennent en charge le suivi distribué, comme OpenTelemetry.
Vérifiez que les informations de trace sont propagées entre les limites de service. Vous devez généralement transmettre un ID de trace unique et d’autres informations contextuelles avec chaque requête.
Configurez un système centralisé de collecte de traces. Ce système collecte et stocke les données de trace générées par vos applications et services.
Utilisez les données de trace collectées pour visualiser le flux de bout en bout des requêtes et analyser les caractéristiques de performances de votre système distribué.
Collecter les journaux des applications
Lorsque vous instrumentez du code, l’une des sorties principales doit être des journaux d’application. La journalisation vous aide à comprendre comment l’application s’exécute dans différents environnements. Les journaux d’application enregistrent les conditions qui produisent des événements d’application. Collectez les journaux d’application dans tous les environnements d’application. Les entrées de journal correspondantes dans l’application doivent capturer un ID de corrélation pour leurs transactions respectives. L’ID de corrélation doit mettre en corrélation les événements du journal des applications entre les flux d’application critiques, tels que la connexion utilisateur. Utilisez cette corrélation pour évaluer l’intégrité des scénarios clés dans le contexte des cibles et des exigences non fonctionnelles.
Vous devez utiliser la journalisation structurée. La journalisation structurée accélère l’analyse et l’analyse des journaux. Il facilite l’indexation, la requête et le rapport des journaux sans complexité. Ajoutez et utilisez une bibliothèque de journalisation structurée dans votre code d’application. Parfois, les entrées de journal peuvent vous aider à mettre en corrélation les données que vous n’avez pas pu mettre en corrélation par d’autres moyens.
Collecter les données de performances des ressources
En collectant des données de performances des ressources, vous pouvez obtenir des insights sur l’intégrité et le comportement de votre charge de travail. Les données de performances des ressources fournissent des informations sur l’utilisation des ressources, qui sont essentielles à la planification de la capacité. Ces données fournissent également des insights sur l’intégrité d’une charge de travail et peuvent vous aider à détecter les problèmes et à résoudre les problèmes. Tenez compte des recommandations suivantes :
Collecter des métriques et des journaux pour chaque ressource. Chaque service Azure a un ensemble de métriques propres aux fonctionnalités de la ressource. Ces mesures vous aident à comprendre l’intégrité et les performances de la ressource. Ajoutez un paramètre de diagnostic pour chaque ressource pour envoyer des métriques à un emplacement auquel votre équipe de charge de travail peut accéder à mesure qu’elle crée des alertes et des tableaux de bord. Les données de métrique sont disponibles pour l’accès à court terme. Pour l’accès à long terme ou pour l’accès à partir d’un système qui se trouve en dehors d’Azure Monitor, envoyez les données de métrique à votre récepteur unifié à l’emplacement d’accès.
Utilisez les outils de plateforme. Rassemblez l’inspiration des solutions de supervision intégrées et intégrées, telles qu’Azure Monitor Insights. Cet outil simplifie les opérations de performances. Envisagez d’utiliser des outils de plateforme lorsque vous sélectionnez une plateforme et investissez dans des outils personnalisés ou des rapports.
Surveillez le trafic réseau. La surveillance du trafic réseau permet de suivre et d’analyser le flux et les modèles de données au fur et à mesure qu’elles se déplacent sur les voies réseau. Collectez l’analytique du trafic et surveillez le trafic qui traverse les limites du sous-réseau. Votre objectif est d’analyser et optimiser les performances réseau.
Collecter des données de base de données et de stockage
De nombreux systèmes de base de données et de stockage fournissent leurs propres outils de surveillance. Ces outils collectent des données de performances spécifiques à ces systèmes. Les systèmes de base de données et de stockage génèrent souvent des journaux qui contiennent des événements et des indicateurs liés aux performances. Collectez des données sur les bases de données et les performances de stockage afin d'identifier les goulots d'étranglement, de diagnostiquer les problèmes et de prendre des décisions éclairées pour améliorer les performances globales et la fiabilité de votre charge de travail. Envisagez de collecter les types de données de performances suivants :
Débit : le débit mesure la quantité de données lues ou écrites dans le système de stockage sur une période donnée. Les données de débit indiquent les fonctionnalités de transfert de données.
Latence : la latence mesure la durée d’activité des opérations de stockage. Les données de latence indiquent la réactivité du système de stockage.
IOPS (opérations d’E/S par seconde) : données sur le nombre d’opérations de lecture ou d’écriture que le système de stockage peut effectuer en seconde. Les données d’E/S par seconde indiquent le débit et la réactivité du système de stockage.
Utilisation de la capacité : l’utilisation de la capacité est la quantité de capacité utilisée et la quantité disponible. Les données d’utilisation de capacité aident les organisations à planifier les besoins de stockage futurs.
Pour les bases de données, vous devez également collecter des métriques spécifiques à la base de données :
Performances des requêtes : données sur le temps d’exécution, l’utilisation des ressources et l’efficacité des requêtes de base de données. Les requêtes de base de données lentes ou inefficaces peuvent ralentir considérablement une charge de travail. Recherchez les requêtes lentes et qui s’exécutent fréquemment.
Performances des transactions : données sur les performances des transactions de base de données, telles que la durée des transactions, la concurrence et la contention de verrou.
Performances de l’index : données sur les performances des index de base de données, telles que la fragmentation des index, les statistiques d’utilisation et l’optimisation des requêtes.
Utilisation des ressources : données qui incluent l’UC, la mémoire, l’espace disque, les E/S et la bande passante réseau.
Métriques de connexion : métriques qui suivent le nombre de connexions actives, abandonnées et ayant échoué. Des taux d’échec élevés peuvent indiquer des problèmes réseau ou indiquer que la base de données a atteint son nombre maximal de connexions.
Taux de transactions : nombre de transactions qu’une base de données exécute par seconde. Une modification des taux de transaction peut indiquer des problèmes de performances.
Taux d’erreur : données qui indiquent les performances d’une base de données. Des taux d’erreur élevés peuvent indiquer un problème de performances. Collecter et analyser les erreurs de base de données.
Collecter les données du système d’exploitation
Une solution PaaS (Platform as a Service) élimine la nécessité de collecter les données de performances du système d’exploitation. Toutefois, si votre charge de travail s’exécute sur des machines virtuelles (infrastructure en tant que service), vous devez collecter des données de performances sur le système d’exploitation. Vous devez comprendre la demande sur votre système d’exploitation et votre machine virtuelle. Exemples fréquents de compteurs de performances du système d’exploitation. Par exemple, vous pouvez échantillonner les compteurs de performances toutes les minutes.
Au minimum, collectez des données sur les domaines de performances suivants.
Zone de performances | Processus ou fonction |
---|---|
UC | - Utilisation du processeur (mode utilisateur ou mode privilégié) - Longueur de la file d’attente du processeur (nombre de processus en attente de temps processeur) |
Process | - Traiter le nombre de threads - Nombre de handles de processus |
Mémoire | - Mémoire validée - Mémoire disponible - Pages par seconde - Échanger l’utilisation de l’espace |
Disque | - Lecture du disque - Écritures de disque - Débit du disque - Utilisation de l’espace disque |
Network (Réseau) | - Débit de l’interface réseau - Erreurs Rx/Tx de l’interface réseau |
Valider et analyser les données
Vos données de performances doivent s’aligner sur les cibles de performances. Les données doivent représenter les performances de charge de travail ou de flux de manière complète et précise, car elles sont liées aux cibles de performances. Par exemple, le temps de réponse d’un service web a une cible de performances de 500 ms. Créez une routine pour analyser les données, car les évaluations fréquentes permettent la détection et l’atténuation précoces des problèmes de performances.
Créer des alertes. Il est utile d’avoir des alertes exploitables, ce qui permet l’identification rapide et la correction des problèmes de performances. Ces alertes doivent indiquer clairement le seuil de performances enfreint, l’effet commercial potentiel et les composants impliqués. Commencez par définir une alerte courante et recommandée. Au fil du temps, vous pouvez modifier ces critères en fonction de vos besoins spécifiques. L’objectif principal de ces alertes doit être de prévoir des baisses de performances potentielles avant qu’elles ne se transforment en problèmes importants. Si vous ne pouvez pas définir d’alerte pour une dépendance externe, envisagez d’élaborer une méthode pour collecter des mesures indirectes, comme la durée d’un appel de dépendance.
Définissez les limites de collecte de données. Déterminez et définissez des limites logiques sur le volume de données que vous collectez et sa durée de rétention. La télémétrie peut parfois produire des quantités écrasantes de données. Il est essentiel de se concentrer sur la capture uniquement des indicateurs de performances les plus essentiels ou d’avoir un système efficace en place pour extraire des insights significatifs de vos données de performances.
Facilitation Azure
Centralisation, segmentation et conservation des données de performances : Azure Monitor collecte et agrège les données de chaque couche et composant de votre charge de travail sur plusieurs abonnements et locataires Azure et non-Azure. Il stocke les données dans une plateforme de données commune à des fins de consommation par un ensemble commun d’outils qui peuvent mettre en corrélation, analyser, visualiser et/ou répondre aux données.
Vous avez besoin d’au moins un espace de travail Log Analytics pour activer les journaux Azure Monitor. Vous pouvez utiliser un seul espace de travail pour toute votre collecte de données. Vous pouvez également créer plusieurs espaces de travail en fonction des exigences pour segmenter les données de performances. Il vous permet également de définir des stratégies de rétention.
Collecte des données de performances d’application : Application Insights est une fonctionnalité d’Azure Monitor qui vous permet de surveiller les performances et la disponibilité de votre application. Il fournit des insights au niveau de l’application en collectant des données de télémétrie telles que les taux de requête, les temps de réponse et les détails des exceptions. Vous pouvez activer Application Insights pour votre application et la configurer pour collecter les données de performances nécessaires. Application Insights prend également en charge le suivi distribué. Configurez le suivi distribué pour tous les flux. Pour générer des flux de transactions de bout en bout, mettez en corrélation les événements provenant de différents composants ou niveaux d’application.
Les compteurs de performances constituent un moyen puissant de surveiller les performances de votre application. Azure fournit différents compteurs de performances que vous pouvez utiliser pour collecter des données sur l’utilisation du processeur, l’utilisation de la mémoire, les E/S de disque, le trafic réseau, etc. Si vous configurez votre application pour émettre des données de compteur de performances, Azure Monitor collecte et stocke les données à des fins d’analyse.
Collecte des données de performances des ressources : la plupart des services Azure génèrent des journaux et des métriques de plateforme qui fournissent des informations de diagnostic et d’audit. En activant les paramètres de diagnostic, vous pouvez spécifier les journaux de plateforme et les métriques à collecter et stocker. À des fins de corrélation, activez les diagnostics pour tous les services pris en charge, puis envoyez les journaux à la même destination que les journaux d’activité de votre application.
Collecte des données de performances de base de données et de stockage : Azure Monitor vous permet de collecter des données de performances pour les bases de données dans Azure. Vous pouvez activer la surveillance pour Azure SQL Database, Azure Database pour MySQL, Azure Database pour PostgreSQL et d’autres services de base de données. Azure Monitor fournit des métriques et des journaux pour surveiller les performances de la base de données, notamment l’utilisation du processeur, l’utilisation de la mémoire et les performances des requêtes. Pour être informé des problèmes, vous pouvez configurer des alertes en fonction des seuils de performances.
Azure propose des recommandations de performances pour les bases de données, telles que SQL Server sur Azure Machines Virtuelles. Ces recommandations vous aident à optimiser les performances de vos charges de travail de base de données. Ils incluent des suggestions pour collecter des compteurs de performances, capturer des statistiques d’attente et collecter des données de performances pendant les heures de pointe.
Stockage Azure Analytics vous permet de collecter des données de performances pour Stockage Azure services tels que Le Stockage Blob, Le Stockage Table et le Stockage File d’attente. Vous pouvez activer la journalisation et les métriques de vos comptes de stockage pour surveiller les indicateurs de performances clés, tels que le nombre d’opérations de lecture/écriture, le débit et la latence.
Collecte des données de performances du système d’exploitation : l’extension Diagnostics Azure vous permet de collecter des données de performances détaillées à partir de vos machines virtuelles, notamment le processeur, la mémoire, les E/S de disque et le trafic réseau. Ces données peuvent être envoyées à Azure Monitor ou à d’autres services de stockage pour l’analyse et les alertes.
Validation et analyse des données de performances : dans Azure Monitor, vous pouvez utiliser les journaux Azure Monitor pour collecter, analyser et visualiser les données de journal à partir de vos applications et systèmes. Vous pouvez configurer les journaux Azure Monitor pour ingérer des journaux d’activité à partir de votre application, y compris les journaux d’activité au niveau de l’application et les journaux d’infrastructure. En agrégeant les journaux, vous pouvez interroger des événements inter-requêtes et obtenir des insights sur les performances de votre application. Pour plus d’informations, consultez calculs et options de coût des journaux Azure Monitor et Tarification pour Azure Monitor.
Dans Azure Monitor, vous pouvez définir des règles d’alerte pour surveiller des métriques de performances spécifiques et déclencher des alertes basées sur des conditions prédéfinies. Par exemple, vous pouvez créer une règle d’alerte pour vous avertir lorsque l’utilisation du processeur dépasse un certain seuil ou lorsque le temps de réponse dépasse une limite spécifiée. Configurez la règle d’alerte pour envoyer des notifications aux destinataires souhaités.
Lorsque vous créez une règle d’alerte, vous pouvez définir les critères qui déterminent quand une alerte doit être déclenchée. Vous pouvez définir des seuils, des méthodes d’agrégation, des fenêtres de temps et la fréquence d’évaluation. Définissez les critères en fonction de vos exigences de supervision des performances. Outre l’envoi de notifications, vous pouvez spécifier des actions à entreprendre lorsqu’une alerte est déclenchée. Les actions peuvent inclure l’envoi d’e-mails, l’appel de webhooks ou l’exécution de fonctions Azure. Choisissez les actions appropriées pour répondre au scénario d’alerte spécifique.
Exemples
- Application web des services d’application redondant interzone hautement disponibles de référence
- Surveiller une application de microservices dans Azure Kubernetes Service (AKS)
- Surveillance d’entreprise avec Azure Monitor
Liens connexes
Liste de contrôle d’efficacité des performances
Reportez-vous à l’ensemble complet de recommandations.