Partager via


Observabilité d’Azure Operator Nexus

L’infrastructure d’observabilité d’Operator Nexus fournit des insights opérationnels sur vos instances locales. L’infrastructure prend en charge la journalisation, la supervision et les alertes (LMA), l’analytique et la visualisation des données et des métriques opérationnelles (plateforme et charges de travail).

Capture d’écran de l’infrastructure LMA (journalisation, supervision et alertes Operator Nexus).

Figure : Infrastructure de journalisation, de supervision et d’alerte (LMA) d’Operator Nexus

Les principaux points forts de l’infrastructure d’observabilité d’Operator Nexus sont les suivants :

  • Collecte de données centralisée : la solution d’observabilité d’Operator Nexus est basée sur la collecte de toutes les données dans un emplacement central. À cet emplacement, vous pouvez observer les données de supervision de toutes vos instances locales.
  • Outils bien définis et testés: la solution s’appuie sur Azure Monitor qui collecte, analyse et agit sur les données de télémétrie à partir de vos instances cloud et locales.
  • Facile à apprendre et à utiliser : la solution vous permet d’analyser et de déboguer facilement des problèmes avec la possibilité de rechercher les données dans toutes vos instances cloud et locales.
  • Outils de visualisation : vous créez des tableaux de bord et des classeurs personnalisés en fonction de vos besoins.
  • Outils d’alerte intégrés : vous créez des alertes basées sur des seuils personnalisés. Vous pouvez créer et réutiliser des modèles d’alerte sur toutes vos instances.

Cet article vous aide à comprendre l’infrastructure d’observabilité d’Operator Nexus qui se compose d’une pile de composants :

  • Azure Monitor collecte et agrège les données de journalisation à partir des composants Operator Nexus
  • Azure Log Analytics Workspace (LAW) collecte et agrège les données de journalisation à partir de plusieurs abonnements et locataires Azure
  • L’analyse, la visualisation et les alertes sont effectuées sur les données de journal agrégées.

Surveillance de la plateforme

Operator Nexus vous procure une visibilité sur les performances de vos déploiements qui se composent de ressources d’infrastructure. Vous avez besoin que les journaux et les métriques soient collectés et analysés à partir de ces ressources de plateforme. Vous obtenez de précieux insights à partir de la collecte centralisée et de l’agrégation des données de toutes les sources, par rapport aux données non agrégées.

Ces journaux et métriques permettent d’observer l’état de la plateforme. Vous pouvez voir les performances et analyser ce qui ne va pas. Vous pouvez analyser ce qui a provoqué la situation. La visualisation vous aide à configurer les alertes requises et les conditions associées. Par exemple, vous pouvez configurer les alertes à générer lorsque les ressources se comportent anormalement ou lorsque des seuils sont atteints. Vous pouvez utiliser les journaux collectés et l’analyse pour déboguer les problèmes dans l’environnement.

Données de supervision

L’observabilité d’Operator Nexus vous permet de collecter le même type de données que d’autres ressources Azure. Les données collectées à partir de chacune de vos instances peuvent être consultées dans votre LAW.

Vous pouvez en savoir plus sur la supervision des ressources Azure ici.

Collecte et routage

L’observabilité d’Operator Nexus vous permet de collecter des données pour chaque ressource d’infrastructure. L’ensemble des composants d’infrastructure comprend :

  • Une infrastructure réseau qui inclut des CE, des TOR, des NPB, des commutateurs de gestion et le serveur terminal.
  • Le calcul qui inclut les serveurs nus.
  • Un plan de contrôle Undercloud (cluster Kubernetes responsable du déploiement et de la gestion du cycle de vie de la plateforme globale).

La collecte de données de journal à partir de ces couches est activée par défaut lors de la création de votre instance Operator Nexus. Ces journaux collectés sont acheminés vers votre LAW Azure Monitor.

Vous pouvez également collecter des données à partir des couches de locataire créées pour l’exécution de fonctions de réseau conteneurisées et virtualisées. Les données de journal qui peuvent être collectées incluent :

  • Collecte de syslog à partir de machines virtuelles (utilisée pour les charges de travail VNF ou CNF).
  • Collecte de journaux d’activité à partir de clusters Kubernetes et des applications déployées sur ceux-ci.

Vous devez activer la collecte des journaux à partir des clusters Kubernetes client et des machines virtuelles. Vous devez suivre les étapes pour déployer les agents de supervision Azure. Les données seraient collectées dans votre Azure LAW.

Stockage des journaux Operator Nexus

Les données des journaux Azure Monitor sont stockées dans des tables, chacune ayant son propre ensemble de propriétés uniques.

Tous les journaux de ressources dans Azure Monitor ont les mêmes champs suivis de champs spécifiques au service. Consultez le schéma commun.

Les journaux d’activité de la plateforme Operator Nexus sont stockés dans les tableaux suivants :

Table Description
syslog Événements Syslog sur des ordinateurs Linux à l’aide de l’agent Log Analytics
ContainerInventory Détails et état actuel de chaque conteneur.
ContainerLog Lignes de journal collectées à partir des flux stdout et stderr pour les conteneurs
ContainerNodeInventory Détails des nœuds qui servent d’hôtes de conteneur.
InsightMetrics Métriques collectées à partir du serveur, des K8 et des conteneurs.
KubeEvents Événements Kubernetes et leurs propriétés.
KubeMonAgentEvents Événements enregistrés par l’agent Kubernetes Azure Monitor pour les erreurs et les avertissements.
KubeNodeInventory Détails des nœuds qui font partie du cluster Kubernetes
KubePodInventory Pods Kubernetes et leurs propriétés
KubePVInventory Volumes persistants Kubernetes et leurs propriétés.
KubeServices Services Kubernetes et leurs propriétés
Heartbeat Enregistrements consignés par les agents Log Analytics une fois par minute pour indiquer l’intégrité de l’agent

Métriques Operator Nexus

La table « InsightMetrics » de la section Journaux contient les métriques collectées à partir de machines nues et du cluster Kubernetes Undercloud. En outre, quelques métriques sélectionnées collectées à partir de l’Undercloud peuvent être consultées en ouvrant l’onglet Mesures dans le menu Azure Monitor.

Capture d’écran de la sélection Mesures d’Azure Monitor.

Figure : Sélection de Mesures dans Azure Monitor

Consultez Analyser les métriques avec l’Explorateur de métriques Azure Monitor pour plus d’informations sur l’utilisation de cet outil.

Workbooks

Les classeurs combinent du texte, des requêtes de journal, des métriques et des paramètres pour l’analyse des données et la création de plusieurs types de visualisations enrichies. Vous pouvez utiliser l’exemple de modèles de classeur Azure Resource Manager pour la journalisation et la supervision Operator Nexus pour déployer des classeurs Azure au sein de votre Azure LAW.

Alertes

Vous pouvez utiliser l’exemple de modèles d’alarme Azure Resource Manager pour les règles d’alerte Operator Nexus. Vous devez spécifier des seuils et des conditions pour les alertes. Vous pouvez ensuite déployer ces modèles d’alerte sur votre environnement local.

Espace de travail Log Analytics

Un espace de travail Log Analytics (LAW) est un environnement unique pour journaliser les données d’Azure Monitor et d’autres services Azure. Chaque espace de travail possède son propre référentiel de données et sa propre configuration, mais peut combiner des données provenant de plusieurs services. Chaque espace de travail se compose de plusieurs tables de données.

Vous pouvez créer un LAW unique pour collecter toutes les données pertinentes ou plusieurs espaces de travail en fonction des exigences de l’opérateur.