Surveiller Site Recovery

Cet article explique comment surveiller Azure Site Recovery à l’aide de la surveillance intégrée de Site Recovery. Vous pouvez surveiller les aspects suivants :

  • Intégrité et état des machines répliquées par Site Recovery
  • État de test de basculement des machines
  • Problèmes et erreurs affectant la configuration et la réplication
  • Composants d’infrastructure tels que des serveurs locaux

Avant de commencer

Avant de commencer, vous pouvez consulter les questions courantes concernant la surveillance.

Surveiller sur le tableau de bord

  1. Dans le coffre, sélectionnez Vue d’ensemble. Le tableau de bord Recovery Services regroupe toutes les informations de surveillance pour le coffre dans un emplacement unique. Il comprend des pages pour les services Site Recovery et Sauvegarde Azure, entre lesquels vous pouvez basculer.

    Capture d’écran montrant le tableau de bord de Site Recovery.

  2. À partir du tableau de bord, faites défiler vers le bas dans différentes zones.

    Capture d’écran montrant les zones du tableau de bord où vous pouvez descendre dans la hiérarchie.

  3. Dans Éléments répliqués, sélectionnez Afficher tout pour voir tous les serveurs dans le coffre.

  4. Sélectionnez les informations d’état de chaque section pour faire défiler vers le bas.

  5. Sous Affichage de l’infrastructure, triez les informations de surveillance par type de machines que vous répliquez.

Surveiller les éléments répliqués

Dans Éléments répliqués, surveillez l’intégrité de toutes les machines dans le coffre pour lesquelles la réplication est activée.

State Détails
Healthy La réplication s’exécute normalement. Aucun symptôme d’erreur ou d’avertissement n’est détecté.
Avertissement Un ou plusieurs symptômes d’avertissement qui peuvent avoir un impact sur la réplication sont détectés.
Critique Un ou plusieurs symptômes d’erreur de réplication critique ont été détectés.

Ces erreurs indiquent que la réplication est soit bloquée, soit évolue moins vite que le rythme de modification des données.
Non applicable Serveurs ne devant pas être répliqués pour le moment. Cela peut inclure des machines qui ont été basculées.

Surveiller les tests de basculement

Dans Réussite du test de basculement, surveillez l’état du basculement des ordinateurs figurant dans le coffre.

  • Nous vous recommandons d’exécuter un test de basculement sur les machines répliquées au moins une fois tous les six mois. Cela vous permet de vérifier que le basculement fonctionne comme prévu, sans interrompre votre environnement de production.
  • Un test de basculement est considéré comme réussi uniquement une fois que le basculement et le nettoyage après basculement sont terminés.
State Détails
Test recommandé Machines qui n’ont pas fait l’objet d’un test de basculement depuis l’activation de la protection.
Effectué Machines avec un ou plusieurs tests de basculement réussis.
Non applicable Machines actuellement non éligibles à un test de basculement. Par exemple, pour les machines ayant basculé, une réplication initiale/un test de basculement/un basculement est en cours.

Surveiller les problèmes de configuration

Dans Problèmes de configuration, surveillez tous les problèmes susceptibles d’avoir une incidence sur votre capacité à opérer correctement le basculement.

  • Les problèmes de configuration (autres que la disponibilité des mises à jour logicielles) sont détectés par une validation périodique qui s’exécute toutes les 12 heures par défaut. Vous pouvez forcer l’exécution immédiate de l’opération de validation en sélectionnant l’icône d’actualisation en regard de l’intitulé de la section Problèmes de configuration.
  • Sélectionnez les liens pour obtenir plus d’informations. Pour les problèmes affectant des machines spécifiques, dans la colonne Configurations cibles, sélectionnez Doit être surveillé. Les détails incluent des recommandations de correction.
State Détails
Configurations manquantes Un paramètre nécessaire est manquant, par exemple un réseau de récupération ou un groupe de ressources.
Ressources manquantes Une ressource spécifiée est introuvable ou n’est pas disponible dans l’abonnement. Par exemple, la ressource a été supprimée ou migrée. Les ressources surveillées incluent le groupe de ressources cible, le sous-réseau/réseau virtuel cible, le compte de stockage cible/des journaux, le groupe à haute disponibilité cible et l’adresse IP cible.
Quota d’abonnement Le quota de ressources disponibles dans l’abonnement est comparé au solde requis pour faire basculer toutes les machines dans le coffre.

Si les ressources sont insuffisantes, un solde de quota insuffisant est signalé.

Pour les quotas, le système surveille le nombre de cœurs de machine virtuelle, le nombre de cœurs de famille de machines virtuelles et le nombre de cartes d’interface réseau.
Mises à jour logicielles La disponibilité des nouvelles mises à jour logicielles et des informations sur les versions logicielles arrivant à expiration.

Surveiller les erreurs

Dans Résumé des erreurs, surveillez les symptômes d’erreurs actives susceptibles d’avoir une incidence sur la réplication des serveurs dans le coffre, ainsi que le nombre de machines concernées.

  • Les erreurs ayant un impact sur les composants d’infrastructure locaux sont affichées au début de la section. Par exemple, la non-réception d’une pulsation en provenance du fournisseur Azure Site Recovery sur le serveur de configuration local, ou l’hôte Hyper-V.
  • Les erreurs de réplication ayant un impact sur les serveurs répliqués apparaissent ensuite.
  • Le tableau est trié par ordre décroissant de la gravité des erreurs, puis par ordre décroissant du nombre de machines concernées.
  • Le nombre de serveurs concernés est une information qui permet de comprendre si un même problème sous-jacent peut avoir une incidence sur plusieurs machines. Par exemple, un problème réseau peut avoir une incidence sur toutes les machines répliquant sur Azure.
  • Plusieurs erreurs de réplication peuvent se produire sur un seul serveur. Dans ce cas, chaque erreur inclut ce serveur dans la liste de ses serveurs affectés. Une fois le problème est résolu, les paramètres de réplication sont optimisés et l’erreur est résolue à partir de la machine.

Surveiller l’infrastructure

DansAffichage de l’infrastructure, surveillez les composants d’infrastructure impliqués dans la réplication, ainsi que l’intégrité de la connectivité entre les serveurs et les services Azure.

  • Une ligne verte indique que la connexion est opérationnelle.

  • Une ligne rouge sur laquelle est superposée une icône d’erreur indique l’existence d’une ou de plusieurs erreurs qui affectent la connectivité.

  • Placez le pointeur de la souris sur l’icône d’erreur pour afficher l’erreur et le nombre d’entités affectées, puis sélectionnez l’icône pour voir une liste filtrée d’entités affectées.

    Capture d’écran montrant la vue d’infrastructure Site Recovery (coffre).

Conseils relatifs à la surveillance de l’infrastructure

  • Assurez-vous que les composants d’infrastructure locaux (serveur de configuration, serveurs de traitement, serveurs VMM, hôtes Hyper-V, machines virtuelles VMware) exécutent les dernières versions du fournisseur et/ou des agents Site Recovery.

  • Pour utiliser toutes les fonctionnalités de la vue d’infrastructure, vous devez exécuter le Correctif cumulatif 22 pour ces composants.

  • Pour utiliser la vue d’infrastructure, sélectionnez le scénario de réplication approprié dans votre environnement. Vous pouvez effectuer un zoom avant pour obtenir plus d’informations. Le tableau suivant affiche les scénarios qui sont représentés.

    Scénario State Vue disponible ?
    Réplication entre des sites locaux Tous les états Non
    Réplication de machines virtuelles Azure entre les régions Azure Réplication activée/réplication initiale en cours Oui
    Réplication de machines virtuelles Azure entre les régions Azure Basculement/restauration automatique Non
    Réplication VMware vers Azure Réplication activée/réplication initiale en cours Oui
    Réplication VMware vers Azure Basculement/restauration automatique Non
    Réplication Hyper-V vers Azure Basculement/restauration automatique Non
  • Pour afficher la vue d’infrastructure pour une seule machine en cours de réplication, dans le menu du coffre, sélectionnez Éléments répliqués, puis sélectionnez un serveur.

Surveiller les plans de récupération

Dans Plans de récupération, surveillez le nombre de plans, créer des plans et modifiez des plans existants.

Surveiller des travaux

La section Travaux affiche l’état des opérations Site Recovery.

  • La plupart des opérations dans Azure Site Recovery s’exécutent de façon asynchrone, avec la création d’un travail de suivi qui est utilisé pour suivre l’état d’avancement de chaque opération.
  • L’objet de travail dispose de toutes les informations nécessaires pour suivre l’état et la progression des opérations.

Pour surveiller les travaux, procédez comme suit :

  1. Dans le tableau de bord > section Travaux, vous pouvez voir un récapitulatif des travaux effectués, en cours d’exécution ou en attente d’entrée au cours des dernières 24 heures. Vous pouvez sélectionner n’importe quel état pour obtenir plus d’informations sur les travaux correspondants.

  2. Sélectionnez Afficher tout pour afficher tous les travaux des dernières 24 heures.

    Remarque

    Vous pouvez également accéder aux informations sur les travaux à partir du menu du coffre >Travaux Site Recovery.

  3. La liste Travaux Site Recovery affiche tous les travaux. Dans le menu supérieur, vous pouvez afficher les détails d’erreur pour un travail spécifique, filtrer la liste des travaux selon des critères spécifiques et exporter les détails d’un travail sélectionné vers Excel.

  4. Vous pouvez explorer un travail en le sélectionnant.

Surveillance des machines virtuelles

  1. Dans Éléments répliqués, obtenez la liste des machines répliquées.

    Capture d’écran montrant la vue de liste des éléments Site Recovery répliqués.

  2. Vous pouvez afficher et filtrer les informations. Dans le menu d’action supérieur, vous pouvez effectuer des actions pour une machine donnée, y compris exécuter un test de basculement ou afficher des erreurs spécifiques.

  3. Sélectionnez Colonnes pour afficher des colonnes supplémentaires, par exemple pour afficher le RPO, les problèmes de configuration cible et les erreurs de réplication.

  4. Sélectionnez Filtre pour afficher les informations en fonction de paramètres spécifiques telles que l’intégrité de la réplication, ou une stratégie de réplication particulière.

  5. Sélectionnez le bouton droit sur une machine pour y lancer des opérations telles qu’un test de basculement, ou pour afficher les détails des erreurs qui lui sont associées.

  6. Sélectionnez une machine pour en afficher les détails. Les détails sont les suivants :

    • Informations de réplication : état et intégrité actuels de la machine.
    • RPO (objectif de point de récupération) : RPO actuel de la machine virtuelle et heure du dernier calcul du RPO.
    • Point de récupération : derniers points de récupération disponibles pour la machine.
    • Disponibilité du basculement : indique si un test de basculement a été exécuté pour la machine, la version de l’agent en cours d’exécution sur la machine (pour les machines exécutant le service Mobilité) et les éventuels problèmes de configuration.
    • Erreurs : liste des symptômes d’erreur de réplication actuellement observés sur la machine, ainsi que les causes/actions possibles.
    • Événements : liste chronologique des événements récents ayant un impact sur la machine. La colonne Détails de l’erreur indique les erreurs actuellement observables sur la machine, tandis que la colonne Événements est un enregistrement historique des problèmes qui ont eu un impact sur la machine.
    • Vue d’infrastructure : affiche l’état de l’infrastructure pour le scénario de réplication des machines vers Azure.

    Capture d’écran montrant la vue de liste des éléments de machines virtuelles Site Recovery.

S’abonner aux notifications par courrier électronique

Vous pouvez vous abonner pour recevoir des notifications par courrier électronique pour ces événements critiques :

  • État critique de la machine répliquée.
  • Aucune connectivité entre les composants d’infrastructure locaux et le service Site Recovery. La connectivité entre Site Recovery et les serveurs locaux enregistrés dans un coffre est détectée à l’aide d’un mécanisme de pulsation.
  • Échecs de basculement.

Pour vous abonner, procédez comme suit :

Dans la section >Supervision du coffre, cliquez sur Événements Site Recovery.

  1. Sélectionnez Notifications par e-mail.

  2. Sous Notifications par e-mail, activez les notifications et spécifiez le destinataire des notifications. Vous pouvez choisir d’envoyer les notifications à tous les administrateurs de l’abonnement ou à des adresses e-mail spécifiques.

    Capture d’écran montrant la vue Notifications par e-mail.

Alertes Azure Monitor intégrées pour Azure Site Recovery (préversion)

Azure Site Recovery fournit également des alertes par défaut via Azure Monitor, ce qui vous permet d’avoir une expérience cohérente pour la gestion des alertes dans différents services Azure. Vous pouvez router les alertes d’Azure Monitor vers n’importe quel canal de notification pris en charge par Azure Monitor, par exemple, e-mail, ITSM, webhook, application logique, etc. Vous pouvez également utiliser d’autres fonctionnalités de gestion des alertes offertes par Azure Monitor, par exemple la suppression des notifications pendant une fenêtre de maintenance planifiée.

Activez les alertes Azure Monitor intégrées

Pour activer les alertes Azure Monitor intégrées pour Azure Site Recovery, pour un abonnement particulier, accédez aux fonctionnalités en préversion dans le portail Azure et inscrivez l’indicateur de fonctionnalité EnableAzureSiteRecoveryAlertsToAzureMonitor pour l’abonnement sélectionné.

Remarque

  • Nous vous recommandons d’attendre 24 heures, le temps que l’inscription prenne effet, avant de tester la fonctionnalité.
  • Si le coffre Recovery Services est créé avant l’inscription de l’abonnement, l’abonnement doit être réinscrit.

Capture d’écran montrant l’indicateur de fonctionnalité pour s’inscrire à la fonctionnalité d’alerte.

Scénarios d’alertes

Une fois que vous avez enregistré cette fonctionnalité, Azure Site Recovery envoie une alerte par défaut (exposée via Azure Monitor) chaque fois que l’un des événements critiques suivants se produit :

  • Activez les alertes d’échec de récupération d’urgence pour la réplication Azure VM, Hyper-V et VMware.
  • Alertes critiques d’intégrité de la réplication pour la réplication de machines virtuelles Azure, Hyper-V et VMware.
  • Alertes d’expiration de la version de l’agent Azure Site Recovery pour la machine virtuelle Azure et la réplication Hyper-V.
  • L’agent Azure Site Recovery n’est pas accessible pour la réplication Hyper-V.
  • Alertes d’échec de basculement pour la réplication de machine virtuelle Azure, Hyper-V et VMware.
  • Alertes d’expiration de certification automatique pour la réplication de machine virtuelle Azure.

Pour tester le fonctionnement des alertes d’une machine virtuelle de test à l’aide d’Azure Site Recovery, vous pouvez désactiver l’accès réseau public pour le compte de stockage du cache afin qu’une alerte critique d’intégrité de la réplication soit générée. Les alertes sont générées par défaut, sans qu’il soit besoin de configurer une règle. Toutefois, pour activer les notifications (par exemple, les notifications par e-mail) pour ces alertes générées, vous devez créer une règle de traitement des alertes, comme décrit dans les sections suivantes.

Afficher les alertes Azure Site Recovery générées dans Azure Monitor

Une fois les alertes générées, vous pouvez les afficher et les gérer à partir du portail Azure Monitor. Suivez ces étapes :

  1. Dans le Portail Azure, accédez à Azure Monitor>Alertes.
  2. Définissez le filtre sur Monitor Service = Azure Site Recovery pour afficher des alertes spécifiques à Azure Site Recovery. Vous pouvez également personnaliser les valeurs d’autres filtres pour voir les alertes d’un intervalle de temps spécifique jusqu’à 30 jours ou pour les coffres, les abonnements, la gravité et l’état d’alerte (réponse de l’utilisateur).
  3. Sélectionnez une alerte qui vous intéresse pour afficher d’autres détails. Par exemple, la machine virtuelle affectée, les causes possibles, l’action recommandée, etc.
  4. Une fois l’événement atténué, vous pouvez faire passer son état à Fermé ou Reconnu.

Capture d’écran montrant l’affichage des alertes via Azure Monitor dans le portail.

Afficher les alertes Azure Site Recovery générées dans le coffre Recovery Services

Procédez comme suit pour afficher les alertes générées pour un coffre particulier via l’expérience du coffre :

  1. Sur le portail Azure, accédez au coffre Recovery Services que vous utilisez.
  2. Sélectionnez la section Alertes et recherchez par filtre Monitor Service = Monitor Azure Site Recovery pour afficher les alertes spécifiques à Azure Site Recovery. Vous pouvez personnaliser les valeurs des autres filtres pour afficher les alertes d’un intervalle de temps spécifique jusqu’à 30 jours, pour les coffres, les abonnements, la gravité et l’état d’alerte (réponse de l’utilisateur).
  3. Sélectionnez une alerte qui vous intéresse pour afficher des détails supplémentaires tels que la machine virtuelle affectée, les causes possibles, l’action recommandée, etc.
  4. Une fois l’événement atténué, vous pouvez faire passer son état à Fermé ou Reconnu.

Capture d’écran montrant les alertes via le coffre Recovery Services dans le portail.

Configurer les notifications par e-mail pour les alertes

Pour configurer les notifications par e-mail des alertes Azure Monitor intégrées pour Azure Site Recovery, vous devez créer une règle de traitement des alertes dans Azure Monitor. La règle de traitement des alertes spécifie les alertes qui doivent être envoyées à un canal de notification particulier (groupe d’actions).

Procédez comme suit pour créer une règle de traitement des alertes :

  1. Accédez à Azure Monitor>Alertes et sélectionnez Règles de traitement des alertes dans le volet supérieur.

    Capture d’écran montrant l’option des règles de traitement des alertes dans Azure Monitor.

  2. Sélectionnez Créer.

    Capture d’écran montrant la création d’une règle de traitement des alertes.

  3. Sous Étendue>Sélectionnez l’étendue de la règle de traitement des alertes. Vous pouvez appliquer la règle pour toutes les ressources au sein d’un abonnement. D’autres personnalisations peuvent être apportées à l’étendue en appliquant des filtres. Par exemple, la génération de notification en cas d’alerte d’une certaine gravité.

    Capture d’écran montrant l’étendue de sélection pour la règle de traitement des alertes.

  4. Dans les Paramètres de règle, sélectionnez Appliquer un groupe d’actions et créer un groupe d’actions (ou utilisez-en un déjà existant). C’est la destination vers laquelle la notification d’une alerte doit être envoyée. Par exemple, une adresse e-mail.

    Capture d’écran montrant l’option Créer un groupe d’actions.

  5. Pour la création d’un groupe d’actions, sous l’onglet Informations de base, sélectionnez le nom du groupe d’actions, l’abonnement et le groupe de ressources sous lequel il doit être créé.

    Capture d’écran montrant les notifications Configurer en créant un groupe d’actions.

  6. Sous l’onglet Notifications, sélectionnez la destination de l’Email/ SMS /Push/ Vocal de notification, puis entrez l’ID de messagerie du destinataire et d’autres détails si nécessaire.

    Capture d’écran montrant l’option sélectionner le canal de notification requis.

  7. Sélectionnez Vérifier + créer>Créer pour déployer le groupe d’actions. La création du groupe d’actions vous ramène à la création de la règle de traitement des alertes.

    Remarque

    Le groupe d’actions créé s’affiche dans la page Paramètres de règle.

  8. Dans l’onglet Planification, sélectionnez Toujours.

    Capture d’écran montrant les options de planification pour la règle de traitement des alertes.

  9. Sous l’onglet Détails, spécifiez l’abonnement, le groupe de ressources et le nom de la règle de traitement des alertes en cours de création.

    Capture d’écran montrant l’enregistrement de la règle de traitement des alertes dans n’importe quel abonnement.

  10. Ajoutez des balises si nécessaire, puis sélectionnez Vérifier+Créer>Créer. La règle de traitement des alertes sera active dans quelques minutes.

Configurer des notifications sur des canaux autres que l’email

Avec les groupes d’actions Azure Monitor, vous pouvez acheminer des alertes vers d’autres canaux de notification tels que des webhooks, des applications logiques, des fonctions, etc. En savoir plus sur les groupes d’actions pris en charge dans Azure Monitor.

Configurer des notifications par le biais d’interfaces de programmation

Vous pouvez utiliser les interfaces suivantes prises en charge par Azure Monitor pour gérer les groupes d’actions et les règles de traitement des alertes :

Supprimer les notifications pendant une fenêtre de maintenance planifiée

Il peut y avoir des scénarios comme les fenêtres de maintenance pendant lesquelles les opérations Azure Site Recovery sont censées échouer. Si vous avez besoin de supprimer des notifications pendant ces périodes, vous pouvez configurer une règle de traitement des alertes de suppression à exécuter pendant une période spécifique.

Pour créer une règle de traitement des alertes de suppression, utilisez le même processus suivi pour créer une règle de traitement d’alerte basée sur des notifications décrit dans la section précédente, à ces différences près :

  1. Sous Paramètres de règle, sélectionnez Supprimer les notifications. S’il existe à la fois une règle de traitement des alertes de suppression et une règle de traitement des alertes de groupe d’actions appliquée sur la même étendue, la règle de suppression est prioritaire.

    Capture d’écran montrant l’activation de la suppression des notifications.

  2. Sous Planification, entrez la fenêtre de temps pour laquelle vous souhaitez que les alertes soient supprimées.

    Capture d’écran montrant la fenêtre de planification de l’heure pour la suppression des notifications.

Tarification

Avec les alertes Azure Monitor intégrées, les alertes d’opérations critiques ou d’échecs sont générées par défaut. Vous pouvez afficher ces alertes dans le portail ou via des interfaces non-portail sans frais supplémentaires. Toutefois, le routage de ces alertes vers un canal de notification (par exemple, une adresse de messagerie) induit un coût mineur pour les notifications au-delà du niveau gratuit (de 1000 e-mails par mois). En savoir plus sur la tarification Azure Monitor.

Étapes suivantes

Découvrez la surveillance de Site Recovery avec Azure Monitor.