Stratégie de supervision pour les modèles de déploiement cloud

Cet article fait partie d’une série du guide de supervision du cloud.

Une fois que vous avez déterminé votre stratégie de supervision du cloud (y compris les modèles de déploiement cloud que vous allez utiliser), vous devez tenir compte des stratégies de supervision.

Les modèles de déploiement cloud classiques à surveiller sont le cloud public lorsque vous réalisez des déploiements le cloud Azure global, le cloud hybride lorsque vous disposez à la fois de ressources cloud locales et publiques, et le cloud privé lorsque vous exploitez un cloud privé (comme Azure Stack).

Lorsque vous implémentez une stratégie de supervision d’un modèle de déploiement cloud, évaluez les points suivants :

  • Engagements existants : déterminez si vous avez contracté un engagement envers une plateforme de supervision d’entreprise, comme System Center Operations Manager. Vous pouvez avoir déjà signé des engagements auprès d’autres plateformes, lesquels sont intégrés à vos processus d’exploitation informatique, à vos connaissances et à votre expertise, et dont le changement serait par conséquent plus coûteux.
  • Besoins de supervision : déterminez si vous surveillez les charges de travail et l’infrastructure exclusivement en local, en local et dans le cloud public, ou seulement dans le cloud.
  • Modernisation des opérations informatiques : déterminez si votre stratégie de supervision prévoit la modernisation des opérations informatiques, ainsi que l’adoption de nos services et solutions de supervision du cloud.
  • Systèmes critiques : déterminez si vous disposez de systèmes en air-gap ou isolés physiquement. Identifiez si vous utilisez des systèmes hébergés dans un cloud privé ou sur du matériel physique à surveiller.

Les stratégies décrites dans ce document offrent une perspective de surveillance complète et orientée service. Elles permettent de prendre en charge la surveillance des éléments suivants :

  • Infrastructure : charges de travail de calcul, de stockage et de serveur.
  • Applications : utilisateur final, exceptions et clients.
  • Mise en réseau : ressources réseau.

La surveillance doit reposer sur la connaissance des informations que les opérateurs et les propriétaires d’applications doivent visualiser. Sur la base de ces informations, vous pouvez décider quelles données collecter et choisir les outils appropriés. Si l’environnement inclut plusieurs services, chacun d’entre eux doit être évalué séparément. Outre la surveillance de la base de référence de gestion, la surveillance spécifique à la charge de travail doit être activée.

Supervision du cloud Azure

Azure Monitor est une solution complète qui vous permet de collecter des signaux de vos environnements Azure et locaux, de les analyser et d’agir en conséquence. Azure Monitor propose de nombreuses fonctionnalités, y compris, sans s’y limiter, la supervision du réseau, SCOM Managed Instance, VM Insights et Application Insights.

Le tableau suivant résume l'approche recommandée pour superviser chaque couche de la pile :

Couche Ressource Étendue Méthode
Monitoring des applications Application web exécutée sur .NET, .NET Core, Java, JavaScript ou Node.js sur une machine virtuelle Azure, Azure App Service, Azure Service Fabric, Azure Functions et Azure Cloud Services. Monitorer une application web en ligne pour automatiquement détecter les anomalies de performances, identifier les exceptions et les problèmes du code, et collecter l’analytique du comportement des utilisateurs. Application Insights, une fonctionnalité d’Azure Monitor.
Ressources Azure Par exemple, un site Web Azure, un coffre de clés Azure ou des groupes de sécurité réseau. Ou encore, des services de base de données Azure (comme SQL ou MySQL). Supervision de la disponibilité, des performances et du fonctionnement.
  • Active la journalisation des diagnostics pour la diffusion en continu des données vers les journaux Azure Monitor.
  • Activez Azure Monitor Insights pour utiliser des vues de supervision organisées pour des ressources Azure spécifiques.
  • Composants des systèmes d’exploitation invités Par exemple, des serveurs Windows, des conteneurs ou des serveurs Linux Capacité, disponibilité, performances, journaux, événements et services
  • Active la journalisation des diagnostics pour la diffusion en continu des données vers les journaux Azure Monitor.
  • Activez Azure Monitor Insights pour utiliser des vues de supervision organisées pour des ressources Azure spécifiques.
  • Réseau Communication entre la machine virtuelle, et un ou plusieurs points de terminaison. Monitore l’accessibilité, la latence et les changements de topologie réseau qui se produisent entre la machine virtuelle et le point de terminaison. Azure Monitor Network Insights et solutions de supervision du réseau Azure.
    Abonnement Azure Azure Service Health et intégrité des ressources de base du point de vue du service Azure.
  • Actions d’administration effectuées sur un service ou une ressource.
  • L’état d’intégrité d’un service Azure est dégradé ou indisponible.
  • Problèmes d’intégrité détectés avec une ressource Azure du point de vue du service Azure.
  • Opérations effectuées avec la mise à l’échelle automatique Azure indiquant un échec ou une exception.
  • Opérations effectuées avec Azure Policy indiquant qu’une action autorisée ou refusée s’est produite.
  • Enregistrement des alertes générées par Microsoft Defender pour le cloud.
  • Fourni dans le journal d’activité pour la supervision et les alertes avec Azure Monitor.
    Client Azure Microsoft Entra ID Journaux d’audit et d’ouverture de session de Microsoft Entra. Activez la journalisation des diagnostics et configurez le streaming vers les journaux Azure Monitor.
    Sécurité Tous les types de ressources Audit de la sécurité
  • Intégrer Microsoft Sentinel
  • Microsoft Defender pour le cloud.
  • Supervision d’un cloud hybride

    Microsoft propose plusieurs plateformes de supervision qui prennent en charge ce modèle cloud. Les décideurs informatiques peuvent donc avoir besoin d’éclaircissements à l’heure de choisir la plateforme la mieux adaptée pour atteindre leurs objectifs métiers et opérationnels.

    Cette section compare plusieurs facteurs de plateforme et d’infrastructure pour Azure Monitor, System Center Operations Manager (Operations Manager) et System Center Operations Manager Managed Instance (SCOM Managed Instance).

    Condition requise Azure Monitor
    (sans les fonctionnalités Azure Monitor SCOM Managed Instance)
    Operations Manager Instance managée SCOM
    Environnement cible général La plupart des ressources informatiques sont des ressources PaaS Azure.

    Les clients suivent une stratégie claire pour moderniser les opérations informatiques et migrer vers Azure.
    Clients disposant de ressources limitées ou inexistantes dans Azure. Supervision axée sur les centres de données locaux. La supervision Azure peut être obtenue avec les packs d’administration pour Azure et Microsoft 365. Clients disposant à la fois d’un centre de données local et de ressources dans Azure.

    Client souhaitant conserver leur engagement envers System Center Operations Manager (ou une autre plateforme de supervision d’entreprise), car la plateforme est intégrée à ses processus, ses connaissances et son expertise en matière d’opérations informatiques, ou parce que certaines fonctionnalités ne sont pas encore disponibles dans Azure Monitor.
    Exigences de l’infrastructure Non Oui

    Nécessite au minimum un serveur d’administration et une instance SQL Server hébergeant la base de données opérationnelle et la base de données de l’entrepôt de données Reporting.

    La complexité s'accentue lorsque la haute disponibilité et la récupération d'urgence sont requises, de même qu'en présence de machines réparties sur plusieurs sites, de systèmes non fiables et d'autres considérations de conception complexes.
    Oui, avec des limitations
    Nécessite, au minimum, une connectivité au domaine Active Directory avec disponibilité d’Azure SQL Managed.
    Connectivité limitée : aucun accès à Internet ou réseau isolé Non Oui Non
    Connectivité limitée : accès contrôlé à Internet Oui Oui Oui
    Connectivité limitée : déconnexions fréquentes Oui Oui Oui
    Analyse du fonctionnement configurable Oui, avec Application Insights Oui Oui
    Test de disponibilité des applications web (réseau isolé) Oui, avec des limitations

    Azure Monitor a une prise en charge limitée dans ce domaine et nécessite des exceptions de pare-feu personnalisées.
    Oui Oui, avec des limitations

    SCOM Managed Instance prend en charge cette fonctionnalité à partir d’agents ou de pools de ressources de serveur d’administration.
    Test de disponibilité des applications web (distribuées dans le monde entier) Non Oui Non
    Superviser les charges de travail de machine virtuelle Oui, avec des limitations

    Peut collecter les journaux d’erreurs IIS et SQL Server, les événements Windows et les compteurs de performances. Requiert la création de visualisations, d’alertes et de requêtes personnalisées. Voir l’article Bien démarrer avec les requêtes de journal dans Azure Monitor.
    Oui.

    Prend en charge le monitoring de la plupart des charges de travail de serveur avec les packs d’administration disponibles. Nécessite l’agent Windows Log Analytics ou l’agent Operations Manager sur la machine virtuelle, qui rend compte au groupe d’administration sur le réseau d’entreprise.
    Oui.

    Prend en charge la supervision de la plupart des charges de travail serveur avec les packs d’administration disponibles. Nécessite l’agent Operations Manager sur la machine virtuelle, qui rapporte à l’instance managée.
    Superviser Azure IaaS Oui Oui.

    Prend en charge la supervision de la majeure partie de l’infrastructure du réseau d’entreprise. Suit l’état de disponibilité, les métriques et les alertes pour les machines virtuelles Azure, SQL et le stockage via le pack d’administration Azure.
    Oui.

    Prend en charge le monitoring de la majeure partie de l’infrastructure. Suit l’état de disponibilité, les métriques et les alertes pour les machines virtuelles Azure, SQL et le stockage via le pack d’administration Azure.
    Superviser Azure PaaS Oui Oui, avec des limitations
    En fonction de ce qui est pris en charge dans les packs d’administration Azure et Microsoft 365. Pour plus d’informations sur le pack d’administration Azure, consultez Télécharger le pack d’administration Microsoft System Center Operations Manager pour Microsoft Azure(uniquement disponible en anglais pour le moment).
    Oui, avec des limitations

    En fonction de ce qui est pris en charge dans le pack d’administration Azure. Pour plus d’informations sur le pack d’administration Azure, consultez Télécharger le pack d’administration Microsoft System Center Operations Manager pour Microsoft Azure(uniquement disponible en anglais pour le moment).
    Supervision des services Azure Oui Oui.

    Bien qu'aucune supervision native de l'intégrité des services Azure ne soit aujourd'hui fournie via un pack d'administration, vous pouvez créer des workflows personnalisés pour interroger les alertes d'intégrité des services. Utilisez l’API REST Azure pour recevoir des alertes via vos notifications existantes.
    Oui.

    Bien qu'aucune supervision native de l'intégrité des services Azure ne soit aujourd'hui fournie via un pack d'administration, vous pouvez créer des workflows personnalisés pour interroger les alertes d'intégrité des services. Utilisez l’API REST Azure pour recevoir des alertes via vos notifications existantes.
    Supervision des applications web modernes Oui No Non
    Supervision des applications web héritées Oui, avec des limitations Il varie selon le kit de développement logiciel (SDK).

    Prend en charge la supervision des versions antérieures des applications web .NET et Java.
    Oui, avec des limitations Oui, avec des limitations
    Superviser des conteneurs Azure Kubernetes Service Oui Oui, avec le pack d’administration des partenaires Microsoft. Oui, avec le pack d’administration des partenaires Microsoft.
    Superviser des conteneurs Docker ou Windows Oui No Non
    Analyse des performances réseau Oui.

    Prend en charge la supervision du réseau avec Azure Monitor Network Insights.

    Prend en charge la supervision SNMP par serveur proxy SNMP.
    Oui.

    Prend en charge les vérifications de disponibilité et collecte des statistiques de base sur les périphériques réseau en utilisant le protocole SNMP (Simple Network Management Protocol) du réseau d'entreprise.

    Prend en charge la connectivité réseau de base.
    Oui.

    Prend en charge les vérifications de disponibilité et collecte des statistiques de base sur les périphériques réseau en utilisant le protocole SNMP (Simple Network Management Protocol) du réseau d'entreprise.

    Prend en charge la connectivité réseau de base.
    Analyse de données interactive Oui Non.

    S’appuie sur des rapports prédéfinis ou personnalisés de SQL Server Reporting Services, des solutions de visualisation de tiers ou une implémentation de Power BI personnalisée. L’entrepôt de données Operations Manager présente des limitations de performances et de mise à l’échelle. S’intègre avec les journaux Azure Monitor comme alternative aux exigences d’agrégation de données. L'intégration s'effectue en configurant le connecteur Log Analytics.
    Oui, avec des limitations

    S’appuie sur l’implémentation de Power BI ou de solutions de visualisation tierces.
    Diagnostics de bout en bout, analyse de la cause racine et résolution des problèmes en temps opportun Oui.

    L’utilisation de scripts personnalisés peut être nécessaire ou être intégrée à d’autres services (comme Azure Automation).
    Oui.

    L’utilisation de scripts personnalisés peut être nécessaire ou être intégrée à d’autres services (comme Azure Automation ou System Center Orchestrator).
    Oui.

    L’utilisation de scripts personnalisés peut être nécessaire ou être intégrée à d’autres services (comme Azure Automation ou System Center Orchestrator).
    Visualisations interactives Oui Oui, avec des limitations

    Fournit des tableaux de bord essentiels avec la console Web HTML5 ou une expérience avancée de solutions partenaires.
    Oui, avec des limitations

    Fournit des tableaux de bord essentiels avec la console Web HTML5 ou une expérience avancée de solutions partenaires.
    Intégration avec les outils IT ou DevOps Oui Oui, avec des limitations Oui, avec des limitations

    Considérations relatives à la supervision hybride

    Voici quelques considérations relatives à la supervision hybride.

    Compromis liés à l’utilisation exclusive d’Operations Manager

    • L’analyse ad hoc des données n’est pas disponible : les données de supervision dans Operations Manager sont généralement analysées en utilisant des vues prédéfinies fournies par des packs d’administration accessibles dans la console, des rapports SQL Server Reporting Services (SSRS) ou des vues personnalisées créées par les utilisateurs finaux. L’analyse ad hoc des données n’est pas prête à l’emploi.

    • Le reporting est peu flexible et relativement complexe : l’entrepôt de données qui assure la conservation à long terme des données de supervision n’évolue pas ou ne fonctionne pas bien. Et des connaissances en matière de rédaction d'instructions T-SQL, de développement de solution Power BI ou d'utilisation de solutions tierces sont nécessaires pour satisfaire les exigences des différents membres du service informatique.

    • Génération des alertes : la fonctionnalité d’alerte Operations Manager ne prend pas en charge les expressions complexes ou n’inclut pas la logique de corrélation. Pour réduire le bruit, les alertes sont regroupées afin de mettre leurs relations en évidence et d’identifier leurs causes.

    Avantages liés à l’utilisation d’Operations Manager avec Azure Monitor
    • Amélioration de l’analytique, des performances et de la rétention : Azure Monitor complète la base de données de l’entrepôt de données Operations Manager en collectant des données de performances et de journalisation importantes. Azure Monitor offre une meilleure analyse, de meilleures performances (lors de l’interrogation de gros volumes de données) et une meilleure conservation des données par rapport à l’entrepôt de données Operations Manager.

    • Requêtes complexes et visualisation des données : vous pouvez créer des requêtes plus complexes et sophistiquées avec le langage de requête Kusto (KQL). Vous pouvez exécuter des requêtes sur plusieurs téraoctets de données en quelques secondes. Vous pouvez transformer rapidement vos données en graphiques en secteurs, en graphiques temporels et dans de nombreuses autres visualisations. Pour analyser ces données, vous n’avez plus besoin d’utiliser des rapports Operations Manager basés sur SQL Server Reporting Services, des requêtes SQL personnalisées ou d’autres solutions de contournement.

    • Alertes : vous pouvez améliorer l’expérience d’alerte en implémentant la solution Azure Monitor Alert Management. Les alertes générées dans le groupe d’administration Operations Manager peuvent être transférées vers l’espace de travail Log Analytics d’Azure Monitor. Vous pouvez configurer l’abonnement responsable du transfert des alertes d’Operations Manager aux journaux Azure Monitor pour transférer uniquement des alertes spécifiques. Par exemple, vous pouvez transférer uniquement les alertes qui répondent à vos critères d’interrogation en support de la gestion des problèmes pour les tendances et l’examen de la cause racine des défaillances ou des problèmes, dans un emplacement unique. Vous pouvez aussi mettre en corrélation d’autres données de journal à partir d’Application Insights ou d’autres sources, pour obtenir des insights qui contribuent à améliorer l’expérience utilisateur, augmenter la durée de bon fonctionnement et réduire le temps de résolution des incidents.

    • Superviser le paysage : vous pouvez utiliser Azure Monitor pour superviser l’infrastructure et les applications natives Cloud à partir d’une architecture simple ou multiniveau dans Azure et Operations Manager pour superviser l’infrastructure locale. Cette supervision comprend une ou plusieurs machines virtuelles, plusieurs machines virtuelles placées dans un groupe à haute disponibilité ou un groupe de machines virtuelles identiques, ou une application conteneurisée déployée sur Azure Kubernetes Service (AKS) et exécutée sur des conteneurs Windows Server ou Linux.

      Si vous avez besoin d’un monitoring complet des charges de travail Microsoft ou tierces qui s’exécutent sur vos machines virtuelles Azure et que vous avez des scénarios avancés qui ne peuvent pas être évalués uniquement sur la base des données de journal ou de performances, utilisez System Center Operations Manager. Ses packs d’administration offrent une logique avancée, qui comprend un modèle de service et d’intégrité pour déterminer l’intégrité opérationnelle de la charge de travail.

    • Supervision de la connectivité réseau entre les machines virtuelles Azure et les machines virtuelles locales : la fonctionnalité de mappage Azure VM Insights vous permet de superviser les métriques de connectivité standard à partir des connexions réseau entre les machines virtuelles Azure et les machines virtuelles locales. Ces métriques incluent le temps de réponse, le nombre de requêtes par minute, le débit du trafic et les liens. Vous pouvez identifier les connexions ayant échoué, résoudre les problèmes, effectuer la validation de la migration et l’analyse de la sécurité et vérifier l’architecture globale du service. La fonctionnalité de mappage peut découvrir automatiquement les composants d’application sur les systèmes Windows et Linux, et mapper la communication entre les services. Cette automatisation vous permet d'identifier les connexions et les dépendances que vous n'aviez pas prises en compte, de planifier et de valider la migration vers Azure, et de réduire au minimum les spéculations lors de la résolution des incidents.

    • Supervision de la connectivité réseau entre les environnements : Network Performance Monitor vous permet de superviser la connectivité réseau entre les systèmes suivants :

      • Votre réseau d’entreprise et Azure.

      • Les applications multicouches stratégiques et les microservices.

      • Les emplacements des utilisateurs et les applications web (HTTP/HTTPS).

        Cette stratégie offre une visibilité de la couche réseau, sans SNMP. Dans une carte topologique interactive, elle peut également présenter la topologie tronçon par tronçon des routes entre le point de terminaison source et le point de terminaison de destination. Il vaut mieux essayer d’obtenir le même résultat avec le monitoring réseau dans Operations Manager ou avec d’autres outils de monitoring réseau actuellement utilisés dans votre environnement.

    Avantages liés à l’utilisation d’Azure Monitor

    Examinez vos exigences de monitoring et d’alertes, la configuration des outils de monitoring existants, et les charges de travail qui migrent vers le cloud. Une fois votre plan finalisé, configurez Azure Monitor.

    • Supervision de l’infrastructure et des applications hybrides : supervisez l’infrastructure et les applications hybrides, à partir d’une architecture simple ou multiniveau dans laquelle les composants sont hébergés entre Azure, d’autres fournisseurs de services cloud et votre réseau d’entreprise. Les composants peuvent inclure une ou plusieurs machines virtuelles, plusieurs machines virtuelles placées dans un groupe à haute disponibilité ou un groupe de machines virtuelles identiques, ou une application conteneurisée déployée sur Azure Kubernetes Service (AKS) et exécutée sur des conteneurs Windows Server ou Linux.

    • Supervision des ressources locales avec Azure Arc : utilisez Azure Arc pour préparer tous les serveurs locaux, machines virtuelles, clusters Kubernetes et bases de données de votre environnement à des fins de gestion, comme s’ils s’exécutaient dans Azure. Azure Arc propose des fonctionnalités d’inventaire, de gestion, de gouvernance et de sécurité qui sont cohérentes par rapport aux fonctionnalités de gestion et aux services Azure que vous connaissez déjà.

    • Détection et diagnostic des problèmes entre l’infrastructure et les applications : activez Azure VM Insights, Azure Container Insights et Application Insights pour détecter et diagnostiquer les problèmes entre l’infrastructure et les applications. Pour une analyse plus approfondie et une corrélation des données collectées à partir des différents composants ou dépendances prenant en charge l’application, vous devez utiliser les journaux Azure Monitor.

    • Création d’alertes intelligentes : concevez des alertes intelligentes qui s’appliquent à un ensemble principal d’applications et de composants de service, afin de réduire le bruit d’alerte avec des seuils dynamiques pour les signaux complexes. Utilisez l’agrégation d’alertes basée sur les algorithmes Machine Learning pour identifier rapidement le problème.

    • Bibliothèque de connaissances : définissez une bibliothèque de requêtes et de tableaux de bord pour répondre aux exigences des différents membres du service informatique. Vous pouvez y accéder depuis Azure Monitor (par exemple) et obtenir rapidement les informations dont vous avez besoin pour votre activité quotidienne.

    • Définition d’une base de référence de supervision : définissez des standards et des méthodes pour activer la supervision des différentes ressources hybrides et cloud, une base de référence de supervision pour chaque ressource et des seuils d’alerte.

    • Configuration de l’accès minimal requis : configurez le contrôle d’accès en fonction du rôle Azure (RBAC Azure) pour accorder aux utilisateurs et aux groupes l’accès strictement nécessaire pour surveiller les données des ressources qu’ils gèrent.

    Supervision d’un cloud privé

    De nombreux clients choisissent Azure Stack pour leurs clouds privés. Vous pouvez utiliser System Center Operations Manager pour effectuer une supervision complète d’Azure Stack. Plus précisément, vous pouvez superviser les charges de travail qui s’exécutent dans le locataire, au niveau des ressources, sur les machines virtuelles et dans l’infrastructure physique qui héberge Azure Stack (serveurs physiques et commutateurs réseau, par exemple).

    Considérations relatives à la supervision du cloud privé

    • Superviser l’intégrité et les alertes : pour en savoir plus sur les fonctionnalités de supervision de l’infrastructure incluses qui vous permettent d’afficher l’intégrité et les alertes pour une région Azure Stack Hub, consultez Surveiller l’intégrité et les alertes dans Azure Stack Hub.

    • Utiliser Azure Monitor sur Azure Stack Hub : pour obtenir une expérience intégrée avec Azure Monitor et obtenir des métriques et des journaux d’infrastructure de niveau de base pour la plupart des services, utilisez Azure Monitor sur Azure Stack Hub.

    • Utiliser les packs d’administration Azure Stack : si vous avez déjà investi dans Operations Manager, utilisez le pack d’administration Azure Stack pour superviser la disponibilité et l’état d’intégrité des déploiements Azure Stack (notamment les régions, les fournisseurs de ressources, les mises à jour, les exécutions de mises à jour, les unités d’échelle, les nœuds d’unité, les rôles d’infrastructure et leurs instances). Ce pack d’administration utilise les API REST du fournisseur de ressources d’intégrité et de mise à jour pour communiquer avec Azure Stack. Pour monitorer des serveurs physiques et des unités de stockage, utilisez le pack d’administration des fournisseurs OEM (par exemple, fourni par Lenovo, HPE ou Dell).

    • Superviser les commutateurs réseau : Operations Manager peut superviser les commutateurs réseau en mode natif pour collecter des statistiques de base à l’aide du protocole SNMP. Le pack d’administration Azure peut monitorer les charges de travail de locataire en suivant deux étapes de base. Configurez l’abonnement que vous voulez superviser, puis ajoutez les moniteurs pour cet abonnement.

    Étapes suivantes