Partager via


Recommandations pour répondre aux problèmes liés aux performances en direct

S’applique à cette recommandation de la liste de contrôle d’efficacité des performances bien conçues : Power Platform

PE:09 Répondre aux problématiques de performance en direct. Planifiez la manière de résoudre les problèmes de performance en intégrant des lignes de communication et des responsabilités claires. Lorsqu’une situation problématique survient, utilisez ce que vous avez appris pour identifier des mesures préventives et les intégrer à votre charge de travail. Mettre en œuvre des méthodes pour revenir plus rapidement à la normale lorsque des situations similaires se produisent.

Ce guide décrit les meilleures pratiques pour répondre aux problèmes de performance en direct. Les problèmes de performance en direct font référence aux défis et aux goulots d’étranglement en temps réel qui peuvent entraver le fonctionnement optimal d’une charge de travail. La résolution rapide de ces problèmes facilite non seulement la détection et la correction immédiates des problèmes de performances, mais garantit également que la charge de travail répond systématiquement à ses critères de performance. Ne pas les résoudre peut entraîner des complications, notamment des ralentissements, des pannes et une absence de réactivité du système, et dégrader l’expérience utilisateur. Ils peuvent également empêcher les utilisateurs d’accomplir leurs tâches efficacement et, par conséquent, ternir la réputation de l’organisation.

Définitions

Terme Définition
Corrélation des données Aligner les journaux, les métriques et les événements de différentes parties de votre charge de travail pour identifier les causes sous-jacentes.
Analyse des causes profondes Un processus permettant d’identifier les facteurs sous-jacents responsables d’un problème.
Auto-guérison La capacité de réparer automatiquement les problèmes sans intervention humaine.
Auto-prévention Implémentations au sein d’une charge de travail pour éviter les problèmes et les échecs potentiels.

Stratégies de conception clés

Lorsque vous rencontrez un problème de performance en direct, vous devez être préparé avec les bonnes données et un plan pour répondre au problème. Ce plan doit inclure des lignes de communication et des responsabilités claires. L’objectif principal est d’identifier si les problèmes de performances sont temporaires ou isolés, d’identifier la cause profonde du problème de performances et de mettre en œuvre des solutions qui facilitent un retour rapide aux opérations normales et fournissent des informations sur l’incident. L’intégration de mesures préventives dans votre flux de travail est une stratégie essentielle. L’objectif est soit d’empêcher que le même problème ne se reproduise, soit de réduire ses effets sur les performances s’il n’est pas évitable.

Préparez-vous aux problèmes

Le réponse idéal pour les problèmes de performances du site en direct est précis et rapide. La précision et la rapidité dans la correction des performances nécessitent une préparation. Pour répondre efficacement aux problèmes de performances en direct, il est essentiel de surveiller les indicateurs de performance clés, d’identifier la cause première des problèmes et de mettre en œuvre des solutions ou des optimisations appropriées. Pour suivre ces étapes, vous devrez peut-être analyser les journaux de charge de travail, effectuer des tests de performances et optimiser le code ou les configurations.

Les exemples suivants décrivent quelques domaines critiques de préparation :

  • Avoir des diagrammes d’architecture précis. Vos diagrammes d’architecture doivent inclure tous les composants et montrer comment ils interagissent. La représentation visuelle peut aider à identifier les goulots d’étranglement et les points de défaillance uniques pouvant entraîner une dégradation des performances ou une indisponibilité. Idéalement, vous devez détecter et éliminer ces problèmes avant qu’ils ne causent des problèmes, mais avoir un diagramme à jour peut vous aider à identifier les problèmes dans les moments de stress élevé.

  • Vérifier l’accès aux données. Les données et les journaux des processus de surveillance sont essentiels pour répondre aux problèmes de performances en temps réel et effectuer des analyses des causes profondes. Mais il est important de maintenir l’intégrité et la confidentialité des données. Répondre aux problèmes de performances des sites en direct nécessite souvent l’accès à des données sous-jacentes qui pourraient normalement ne pas être accessibles. Vous devez vous assurer que le personnel a accès aux données dont il a besoin en cas de problème. Mais vous ne devez accorder qu’un accès limité dans le temps et doté des privilèges les plus faibles, et vous devez limiter cet accès au personnel autorisé.

  • Définir des alertes automatiques. Les alertes peuvent vous aider à identifier et à résoudre les problèmes dès qu’ils surviennent. Les alertes doivent générer des notifications lorsque les performances de la charge de travail s’écartent des valeurs de référence des performances. Au fil du temps, vous devez modifier les configurations d’alerte pour éviter de générer trop ou trop peu de notifications. Les solutions de surveillance que vous utilisez doivent collecter suffisamment de données pour générer des alertes. Ces alertes doivent être accompagnées d’objectifs de performance et de lignes de base établies. Vous devez éviter de générer des alertes sur des problèmes qui ne sont pas pertinents par rapport à vos objectifs. Les exemples d’alertes incluent les dégradations des temps de réponse réponse, les performances des appels d’API ou des plug-ins et les chargements de pages. Dataverse

Créer un plan de triage

La création d’un plan de triage implique l’élaboration d’une approche structurée pour identifier, escalader, analyser, hiérarchiser et communiquer les problèmes de performances sur site. Un plan de triage est une stratégie permettant de répondre aux problèmes liés aux performances en direct. Il garantit que les perturbations de performance sont traitées rapidement et efficacement, avec des rôles et des procédures clairs. La plupart des problèmes de performances ne justifient pas de protocoles de reprise après sinistre, mais ils peuvent suffisamment affecter les fonctionnalités de la charge de travail pour nécessiter une planification de tri. Un plan de triage bien documenté garantit que tous les membres de l’équipe sont alignés et peuvent agir rapidement, minimisant ainsi l’impact sur les utilisateurs et les charges de travail. Un plan de triage doit inclure les éléments suivants :

  • Identification et suivi : Mettre en œuvre un système permettant d’identifier et de suivre les problèmes de performance en temps réel. Vous devriez avoir une liste des coordonnées des personnes capables de prendre des décisions ou de transmettre des problèmes à des niveaux supérieurs. Le plan doit également identifier les rôles et les responsabilités. Il faut documenter quels comptes ont accès aux informations protégées et pendant combien de temps.

  • Processus d’escalade : définissez un processus d’escalade clair pour garantir que les problèmes de performances sont transmis aux équipes ou aux individus appropriés en temps opportun. La définition du processus doit inclure des informations de contact et des directives pour la transmission des problèmes.

  • Analyse des causes profondes : développez un processus permettant de réaliser une analyse des causes profondes afin d’identifier la cause sous-jacente de chaque problème de performance. Le processus doit impliquer l’analyse des journaux et des mesures de performance et la réalisation de tests de diagnostic pour identifier la source de chaque problème.

  • Priorisation : établir un cadre de priorisation pour déterminer la gravité des problèmes de performances et les hiérarchiser en fonction de leur effet sur la charge de travail et les utilisateurs.

  • Communication : Créez un plan de communication pour tenir les parties prenantes informées de l’état des problèmes de performance et de l’avancement de leur résolution. Envisagez des mises à jour régulières, des rapports d’état et des canaux de communication clairs.

  • Documentation : Documentez le plan de triage, y compris toutes ses étapes, processus et meilleures pratiques. Cette documentation doit être facilement accessible aux membres de l’équipe impliqués dans la réponse aux problèmes de performance.

Développer des méthodes pour identifier et résoudre les problèmes

La résolution des problèmes de performances en direct implique l’identification et le traitement de tous les facteurs pouvant entraîner une dégradation des performances ou des inefficacités dans une charge de travail en direct. Les données que vous collectez lors de la surveillance sont précieuses pour enquêter sur les incidents liés aux performances et les résoudre. Ces données fournissent un enregistrement historique des mesures de performance. Lorsque vous disposez de données de surveillance, vous pouvez analyser les causes profondes et identifier les facteurs contributifs. Vous devez utiliser toutes les données de surveillance pertinentes pour comprendre et résoudre chaque problème de performances. Surveillez le nombre de pics transitoires que vous détectez et définissez les seuils aligner en conséquence.

Utiliser l’analyse des causes profondes

L’analyse des causes profondes nécessite des tests d’hypothèses. Après avoir examiné les données de surveillance, vous devez répertorier les causes potentielles du problème de performances et les tester.

Pour effectuer une analyse des causes profondes d’un problème de performance en direct, suivez ces étapes :

  • Recueillir des informations. Recueillez autant d’informations que possible sur le problème de performance. Les exemples incluent les messages d’erreur, les journaux, les mesures de performances et toute autre donnée pertinente. Incluez également des informations sur les utilisateurs qui ont signalé le problème, telles que leur appareil, leur réseau et leur emplacement.

  • Définir le problème. Définissez clairement le problème en identifiant les symptômes et l’effet que le problème a sur la charge de travail ou les utilisateurs.

  • Recherchez les causes potentielles. Affinez la portée de l’analyse en identifiant le composant ou le domaine spécifique de la charge de travail où le problème de performance se produit. Identifiez les causes potentielles du problème de performances en fonction des informations recueillies. Ce processus peut impliquer l’analyse du code, des paramètres de configuration, de l’infrastructure ou des dépendances externes.

  • Corréler les données. Plongez plus profondément dans les données collectées pour identifier les modèles, les anomalies ou les corrélations qui pourraient contribuer au problème de performances. La corrélation des données est essentielle pour identifier les problèmes de performances et leurs causes. Cela peut impliquer l’examen des journaux, l’analyse des mesures de performance et la réalisation de tests.

  • Tester les hypothèses. Formulez des hypothèses basées sur les causes potentielles que vous identifiez. Réalisez des tests pour valider ou réfuter vos hypothèses. Vous devriez utiliser un test environnement pour voir si vous pouvez reproduire l’erreur.

  • Mettre en œuvre des solutions. Une fois que vous avez identifié une cause profonde, développez et mettez en œuvre des solutions pour résoudre le problème de performances.

  • Surveiller et valider. Après avoir implémenté les solutions, surveillez en permanence la charge de travail pour vous assurer que le problème de performances est résolu. Validez l’efficacité des solutions en surveillant les indicateurs de performance et les commentaires des utilisateurs.

Compromis : Les étapes d’une analyse des causes profondes, telles que l’identification des causes possibles, le test des hypothèses et la documentation de l’analyse, peuvent prendre du temps. Pour corréler les problèmes de performances, vous devez également collecter et stocker des données. Le temps et l’infrastructure requis peuvent ajouter une charge de travail considérable aux équipes d’exploitation et augmenter les coûts de la charge de travail.

Risque : Si vous effectuez une analyse des causes profondes sans mesures de sécurité appropriées, vous risquez d’exposer des informations sensibles lorsque vous donnez accès aux journaux et aux données.

Engagez-vous Microsoft Soutenir

Contactez le support technique pour obtenir de l’aide concernant les problèmes de performances persistants. Microsoft Microsoft Les représentants du support disposent non seulement de l’expertise, des outils, des ressources et de l’expérience nécessaires pour résoudre les problèmes, mais ils peuvent également être au courant de tout problème de performances ou de panne mondiale actuelle qui pourrait affecter votre charge de travail. Votre contrat d’assistance détermine le niveau d’assistance fourni.

Il est souvent préférable de travailler en parallèle avec Microsoft Support. Par exemple, envisagez une stratégie dans laquelle certains membres de l’équipe collaborent avec le support, tandis que d’autres continuent de trier et de résoudre les problèmes de performances. Microsoft

Il est important de mettre les coordonnées du support à la disposition de l’équipe. Gardez à l’esprit que Microsoft le support peut également avoir besoin d’accéder aux données pour s’engager efficacement dans la résolution des problèmes.

Pour plus d’informations, consultez Obtenir de l’aide et du support dans Power Platform.

Apprendre des résultats

Après avoir résolu un problème de performances d’un site en direct, vous devez examiner ce qui s’est passé. L’objectif est d’apprendre des problèmes de performance, et pas seulement d’identifier les problèmes. La meilleure façon d’apprendre est de se documenter. Documentez chaque problème et expliquez comment le résoudre. Si un fournisseur vous a aidé, travaillez avec lui pour améliorer votre documentation, former votre équipe et modifier votre charge de travail en conséquence.

La documentation doit indiquer comment éviter que chaque problème ne se reproduise. En plus de la documentation, vous pouvez créer des alertes affinées qui vous aident à réagir rapidement aux indicateurs de problèmes de performances.

Facilitation de Power Platform

Power Platform et Azure fournissent plusieurs outils pour vous aider à répondre aux problèmes de performances en direct :

  • Azure Monitor est une solution de surveillance complète qui fournit des informations sur les performances et l’intégrité de vos applications et de votre infrastructure. Azure Monitor propose des fonctionnalités telles que des métriques, des journaux, des alertes et des tableaux de bord pour vous aider à surveiller et à diagnostiquer les problèmes de performances. Power Platform les applications et l’automatisation peuvent s’intégrer à Azure Monitor à l’aide de la fonctionnalité Application Insights . La télémétrie standard ainsi que les événements de trace personnalisés peuvent être enregistrés et analysés.

  • Application Insights est un service de gestion des performances des applications (APM) qui aide les développeurs et les professionnels DevOps à surveiller les applications en direct. Il détecte automatiquement les anomalies de performances, collecte les journaux et les événements au niveau de l’application et fournit des outils d’analyse pour diagnostiquer les problèmes. Power Platform s’intègre à Application Insights.

  • Log Analytics est un service qui collecte et analyse les données de journal provenant de diverses sources, notamment des applications, des machines virtuelles et des ressources Azure. Lorsque vous utilisez Log Analytics, vous pouvez interroger et analyser les données de journal pour obtenir des informations sur les performances et le comportement de vos applications. Envisagez d’utiliser Log Analytics si votre charge de travail utilise des ressources Azure.

  • Solution Checker effectue une analyse statique approfondie de vos solutions par rapport à un ensemble de règles de bonnes pratiques et identifie les modèles problématiques. Résolvez tous les problèmes liés aux performances avant de déployer la solution en production pour éviter les problèmes de performances sur le site en direct.

Liste de contrôle Efficacité des performances

Référez-vous à l’ensemble complet des recommandations.