Diagnostiquer des scénarios courants avec Service Fabric

Article
06/01/2023

Cet article décrit les scénarios courants que les utilisateurs ont rencontrés dans le domaine du monitoring et des diagnostics avec Service Fabric. Les scénarios présentés couvrent les 3 couches de Service Fabric : Application, Cluster et Infrastructure. Chaque solution utilise Application Insights et les journaux Azure Monitor, ainsi que des outils de monitoring Azure, pour chaque scénario. Les étapes de chaque solution offrent aux utilisateurs une introduction à l’utilisation d’Application Insights et de journaux Azure Monitor dans le contexte de Service Fabric.

Notes

Cet article a récemment été mis à jour pour utiliser le terme journaux d’activité Azure Monitor au lieu de Log Analytics. Les données de journal sont toujours stockées dans un espace de travail Log Analytics, et elles sont toujours collectées et analysées par le même service Log Analytics. Nous mettons la terminologie à jour pour mieux refléter le rôle des journaux d’activité dans Azure Monitor. Pour plus d'informations, consultez Modifications de la terminologie d'Azure Monitor.

Prérequis et recommandations

Les solutions de cet article utilisent les outils suivants. Nous vous recommandons de les installer et de les configurer :

Comment voir les exceptions non gérées dans mon application ?

Accédez à votre ressource Application Insights avec laquelle est configurée votre application.
Cliquez sur Rechercher en haut à gauche. Cliquez ensuite sur Filtrer dans le panneau suivant.
Vous voyez un grand nombre de types d’événements (traces, demandes, événements personnalisés). Choisissez « Exception » comme filtre.

En cliquant sur une exception dans la liste, vous pouvez voir plus de détails, notamment le contexte du service si vous utilisez le kit SDK de Service Fabric Application Insights.

Comment voir les appels HTTP qui ont été utilisés dans mes services ?

Dans la même ressource Application Insights, vous pouvez filtrer sur « demandes » au lieu des exceptions et voir ainsi toutes les demandes effectuées.
Si vous utilisez le kit SDK Service Fabric Application Insights, vous pouvez voir une représentation visuelle de vos services connectés les uns aux autres et le nombre de demandes ayant réussi et échoué. Sur la gauche, cliquez sur « Cartographie d’application ».

Pour plus d’informations sur la cartographie d’application, consultez la documentation sur la cartographie d’application.

Comment créer une alerte quand un nœud est en baisse ?

Les événements de nœud sont suivis par votre cluster Service Fabric. Accédez à la ressource de la solution Service Fabric Analytics nommée ServiceFabric(NameofResourceGroup).
Cliquez sur le graphe en bas du panneau intitulé « Résumé ».
Ici, vous avez un grand nombre de graphes et de vignettes affichant diverses métriques. Cliquez sur l’un des graphes, ce qui vous dirigera vers la recherche dans les journaux. Ici, vous pouvez créer des requêtes sur des événements de cluster ou des compteurs de performances.
Entrez la requête suivante. Ces ID d’événement se trouvent dans la référence des événements de nœud
```
ServiceFabricOperationalEvent
| where EventID >= 25622 and EventID <= 25626
```
Cliquez sur « Nouvelle règle d’alerte » en haut. À partir de maintenant, chaque fois qu’un événement arrive en fonction de cette requête, vous recevez une alerte dans le mode de communication de votre choix.

Comment être averti de restaurations de mise à niveau d’application ?

Dans la même fenêtre de recherche dans les journaux qu’avant, entrez la requête suivante pour les restaurations de mise à niveau. Ces ID d’événements se trouvent sous la référence des événements d’application
```
ServiceFabricOperationalEvent
| where EventID == 29623 or EventID == 29624
```
Cliquez sur « Nouvelle règle d’alerte » en haut. À partir de maintenant, chaque fois qu’un événement arrive en fonction de cette requête, vous recevez une alerte.

Comment voir les métriques de conteneur ?

Dans la même vue où se trouvent tous les graphes, vous pouvez voir quelques vignettes pour les performances de vos conteneurs. Vous avez besoin de l’Agent Log Analytics et de la solution de supervision de conteneurs pour que ces vignettes soient renseignées.

Métriques des conteneurs Log Analytics

Notes

Pour utiliser les données de télémétrie à l’intérieur de votre conteneur, vous devez ajouter le package nuget Application Insights pour les conteneurs.

Comment suivre les compteurs de performances ?

Une fois que vous avez ajouté l’Agent Log Analytics à votre cluster, vous devez ajouter les compteurs de performances spécifiques que vous voulez suivre. Accédez à la page de l’espace de travail Log Analytics dans le portail. Dans la page de la solution, l’onglet de l’espace de travail se trouve dans le menu de gauche.
Une fois que vous êtes dans la page de l’espace de travail, cliquez sur « Paramètres avancés » dans le même menu de gauche.
Cliquez sur Données > Compteurs de performances Windows (Données > Compteurs de performances Linux pour les machines Linux) pour démarrer la collecte des compteurs spécifiques de vos nœuds via l’Agent Log Analytics. Voici des exemples du format des compteurs à ajouter
- .NET CLR Memory(<ProcessNameHere>)\\# Total committed Bytes
- Processor(_Total)\\% Processor Time
  
  Dans le guide de démarrage rapide, VotingData et VotingWeb sont les noms des processus utilisés ; voici à quoi devrait ressembler le suivi de ces compteurs
- .NET CLR Memory(VotingData)\\# Total committed Bytes
- .NET CLR Memory(VotingWeb)\\# Total committed Bytes
Ils vous permettent de voir comment votre infrastructure gère vos charges de travail et de définir des alertes pertinentes en fonction de l’utilisation des ressources. Par exemple, vous souhaiterez probablement définir une alerte si l’utilisation totale du processeur est supérieure à 90 % ou inférieure à 5 %. Le nom de compteur que vous utiliseriez pour cela serait « % temps processeur ». Vous pourriez alors créer une règle d’alerte pour la requête suivante :
```
Perf | where CounterName == "% Processor Time" and InstanceName == "_Total" | where CounterValue >= 90 or CounterValue <= 5.
```

Comment suivre les performances de mes événements Reliable Services et Actors ?

Pour le suivi des performances des événements Reliable Services ou Actors dans vos applications, vous devez aussi collecter les compteurs Service Fabric Actor, Actor Method, Service et Service Method. Voici des exemples de compteurs de performances des services et des acteurs fiables à collecter

Notes

Pour le moment, l’agent Log Analytics ne peut pas collecter les compteurs de performance de Service Fabric. Cependant, ces derniers peuvent être collectés par d’autres solutions de diagnostic

Service Fabric Service(*)\\Average milliseconds per request
Service Fabric Service Method(*)\\Invocations/Sec
Service Fabric Actor(*)\\Average milliseconds per request
Service Fabric Actor Method(*)\\Invocations/Sec

Consultez ces liens pour obtenir la liste complète des compteurs de performances sur Reliable Services et Actors

Étapes suivantes

Rechercher des erreurs d’activation du package de code commun
Configurer des alertes dans AI pour être averti des changements de performances ou d’utilisation
La détection intelligente dans Application Insights effectue une analyse proactive de la télémétrie envoyée à AI pour vous avertir d’éventuels problèmes de performances
Découvrez plus en détail la création d’alertes dans les journaux Azure Monitor pour faciliter la détection et les diagnostics.
Pour les clusters locaux, les journaux Azure Monitor proposent une passerelle (proxy de transfert HTTP) qui peut être utilisée pour envoyer des données aux journaux Azure Monitor. Pour plus d’informations à ce sujet, consultez Connexion d’ordinateurs aux journaux Azure Monitor sans accès Internet à l’aide de la passerelle Log Analytics
Familiarisez-vous avec les fonctionnalités de requête et de recherche dans les journaux proposées par Journaux Azure Monitor
Pour obtenir une présentation plus détaillée des journaux Azure Monitor et de ce qu’ils proposent, lisez Présentation des journaux Azure Monitor.

Partage via

Diagnostiquer des scénarios courants avec Service Fabric

Prérequis et recommandations

Comment voir les exceptions non gérées dans mon application ?

Comment voir les appels HTTP qui ont été utilisés dans mes services ?

Comment créer une alerte quand un nœud est en baisse ?

Comment être averti de restaurations de mise à niveau d’application ?

Comment voir les métriques de conteneur ?

Comment suivre les compteurs de performances ?

Comment suivre les performances de mes événements Reliable Services et Actors ?

Étapes suivantes

Commentaires

Commentaires

Ressources supplémentaires