Récupération d’urgence avec l’outil Azure Application Consistent Snapshot Tool

Article
06/01/2023

Cet article explique comment effectuer une reprise d’activité avec l’outil Azure Application Consistent Snapshot Tool, que vous pouvez utiliser avec Azure NetApp Files.

Important

Cette opération s’applique uniquement aux systèmes Azure (grande instance).

Introduction

La plateforme Azure (grande instance) peut également disposer d’un site de reprise d’activité configuré pour accueillir la réplication des instantanés de volume de stockage. Si les instantanés ont été correctement configurés, il est possible d’effectuer une reprise d’activité sur ce site. Ce document est destiné à vous aider à effectuer une reprise d’activité pour cette configuration.

Prérequis de la configuration d’une reprise d’activité

Vous devez vérifier la conformité des prérequis suivants avant de planifier le basculement de reprise d’activité.

Vous disposez d’un nœud DR provisionné sur le site DR. Il existe deux options pour un scénario DR. Le scénario DR normal et le scénario DR polyvalent.
La réplication du stockage fonctionne. L’équipe des opérations Microsoft effectue la configuration de la réplication du stockage au moment du provisionnement automatique de la reprise d’activité DR. Vous pouvez superviser la réplication du stockage à l’aide de la commande azacsnap -c details --details replication sur le site DR.
Vous avez créé et configuré des instantanés de stockage sur le site principal.
Une instance HANA est installée sur le site DR pour le site principal. Elle utilise le même SID que celui de l’instance du site principal.
Vous avez lu et compris la procédure de basculement DR décrite dans Haute disponibilité et reprise d’activité de SAP HANA - Grandes instances sur Azure
Vous avez créé et configuré des instantanés de stockage sur le site DR.
Un fichier config (par exemple, DR.json) a été créé avec les volumes de stockage DR et les informations associées sur le serveur DR.
Vous avez effectué les étapes nécessaires sur le site DR pour :
- Activer la communication avec le stockage.
- Activer la communication avec SAP HANA.

Configurer une récupération d'urgence

Microsoft prend en charge la réplication au niveau du stockage pour la reprise d’activité DR. Il existe deux types de configuration de reprise d’activité DR.

La reprise d’activité normale et la reprise d’activité polyvalente. Dans le scénario DR normal, vous disposez d’une instance dédiée sur le site DR pour le basculement. Dans le scénario DR polyvalent, vous disposez d’une autre instance HANA pour l’AQ ou le développement, qui s’exécute dans l’unité de grande instance HANA sur le site DR. Toutefois, vous disposez également d’une instance HANA préinstallée, dormante, qui comporte un SID identique à celui de l’instance HANA dont vous souhaitez effectuer le basculement vers l’unité de grande instance HANA. L’équipe des opérations Microsoft configure l’environnement à votre place, notamment la réplication du stockage en fonction de l’entrée fournie dans le formulaire de demande de service au moment de l’intégration.

Important

Vérifiez que tous les prérequis sont remplis pour la configuration de la reprise d’activité DR.

Superviser la réplication des données du site principal au site DR

L’équipe des opérations Microsoft gère et supervise déjà le lien DR entre le site principal et le site DR. Vous pouvez superviser la réplication des données entre votre serveur primaire et le serveur DR à l’aide de la commande d’instantané azacsnap -c details --details replication.

Effectuer un basculement vers le site DR

Exécutez la commande de basculement sur le site DR (azacsnap -c restore --restore revertvolume).

Important

La commande azacsnap -c restore --restore revertvolume interrompt la réplication du stockage entre le site de production et le site DR. Vous devez contacter l’équipe des opérations Microsoft pour reconfigurer la réplication. Une fois la réplication réactivée, toutes les données du stockage DR pour ce SID sont initialisées. La commande qui effectue le basculement met à disposition le dernier instantané de stockage répliqué. Si vous devez restaurer un instantané plus ancien, ouvrez une demande de support pour que l’équipe des opérations puisse vous aider à fournir un instantané antérieur restauré sur le site DR.

Voici globalement les étapes à suivre pour le basculement DR :

Vous devez arrêter l’instance HANA sur le site principal. Cette action est nécessaire uniquement si vous effectuez réellement le basculement vers le site DR pour éviter les incohérences de données.
Arrêtez l’instance HANA sur le nœud DR pour le SID de production.
Exécutez la commande azacsnap -c restore --restore revertvolume sur le nœud DR avec le SID à récupérer
- La commande rompt le lien de réplication du stockage entre le site principal et le site DR
- La commande restaure uniquement le volume /data et le volume /logbackups mais PAS le volume /shared. Toutefois, elle utilise le volume /shared existant pour le SID sur le site DR.
- Montez le volume /data et le volume /logbackups en veillant à les ajouter au fichier fstab
Restaurez l’instantané HANA SYSTEMDB. HANA Studio vous montre uniquement le dernier instantané HANA disponible sous l’instantané de stockage restauré dans le cadre de l’exécution de la commande azacsnap -c restore --restore revertvolume.
Récupérez la base de données de locataire.
Démarrez l’instance HANA sur le site DR pour le SID de production (exemple : H80 dans ce cas).
Effectuez des tests.

Exemple de reprise d’activité

Cette sous-section décrit les étapes détaillées d’un basculement vers le site de reprise d’activité.

Étape 1 : Obtenir les détails du volume du nœud DR

Exécutez la commande df –h pour lister les systèmes de fichiers et les volumes associés auxquels se référer après le basculement.

df -h

Filesystem Size Used Avail Use% Mounted on
devtmpfs 378G 8.0K 378G 1% /dev
tmpfs 569G 0 569G 0%
/dev/shm
tmpfs 378G 18M 378G 1% /run
tmpfs 378G 0 378G 0%
/sys/fs/cgroup
/dev/mapper/3600a098038304445622b4b584c575a66-part2 47G 20G 28G 42% /
/dev/mapper/3600a098038304445622b4b584c575a66-part1 979M 57M 856M 7% /boot
172.18.20.241:/hana_log_h80_mnt00003_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00001_t020_vol 512G 5.5G 507G 2% /hana/log/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00003_t020_vol 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00002_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00002_t020_vol 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00001_t020_vol 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_shared_h80_t020_vol/usr_sap_node1 2.7T 11G 2.7T 1% /usr/sap/H80
tmpfs 76G 0 76G 0% /run/user/0
172.18.20.241:/hana_shared_h80_t020_vol 2.7T 11G 2.7T 1% /hana/shared
172.18.20.241:/hana_data_h80_mnt00001_t020_xdp 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00002_t020_xdp 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00003_t020_xdp 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_backups_h80_t020_xdp 512G 15G 498G 3% /hana/logbackups/H80_T250

Étape 2 : Arrêter HANA sur le site principal

Si vous effectuez un basculement complet des charges de travail de production, et s’il est possible de se connecter au site de production principal, arrêtez la ou les instances de SAP HANA dont le basculement est effectué vers le site DR.

Ainsi, si vous êtes connecté en tant qu’utilisateur root, l’exemple suivant montre comment arrêter SAP HANA. Remplacez <sid> par votre ID de sécurité SAP HANA.

su - <sid>adm
HDB stop

Étape 3 : Arrêter HANA sur le site DR

Il est important d’arrêter SAP HANA sur le site DR avant de restaurer les volumes.

Ainsi, si vous êtes connecté en tant qu’utilisateur root, l’exemple suivant montre comment arrêter SAP HANA. Remplacez <sid> par votre ID de sécurité SAP HANA.

su - <sid>adm
HDB stop

Important

Vérifiez que les instances HANA sur le site DR sont hors connexion avant de restaurer des volumes.

Étape 4 : Restaurer les volumes

azacsnap -c restore --restore revertvolume --dbsid H80

Sortie de la commande de basculement DR.

azacsnap --configfile DR.json -c restore --restore revertvolume --dbsid H80

* This program is designed for those customers who have previously installed the
  Production HANA instance in the Disaster Recovery Location either as a
  stand-alone instance or as part of a multi-purpose environment.
* This program should be executed from the Disaster Recovery location otherwise
  unintended consequences may result.
* This program is intended to allow the customer to complete a Disaster Recovery
  failover.
* Any other restore points must be handled by Microsoft Operations.
* All volumes ('data' and 'other') are reverted to their most recent snapshot.
* The SnapMirror replication relationship between Prod and DR will be broken.

  CAUTION: a failback will be required after running this command and failback
   might not be a quick process and will require multiple steps in coordination
   with Microsoft Operations.

Do you wish to continue? (y/n) [n]: y
Checking state of HLI volumes for SID 'H80'
Configured volumes (Data and Other) are not quiesced for revert, will retry in 00:00:10 seconds
Volumes All Ok to Revert = True
Reverting volume 'hana_data_h80_mnt00001_t020_xdp' to snapshot 'H80_HANA_DATA_30MIN.2020-09-16_0330.0'
DR.json Data Volume #1 'hana_data_h80_mnt00001_t020_xdp' assigning to mountpoint 'mnt00001'
Reverting volume 'hana_log_backups_h80_t020_xdp01' to snapshot 'H80_HANA_LOGS_3MIN_X9.2020-09-16_0339.recent'
DR.json Other Volume #1 'hana_log_backups_h80_t020_xdp01' assigning to mountpoint '01'
HLI Volume revert completed for SID 'H80'
Displaying Mount Points by Volume as follows:
10.50.251.34:/hana_data_h80_mnt00001_t020_xdp  /hana/data/H80/mnt00001 nfs  rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
10.50.251.36:/hana_log_backups_h80_t020_xdp01  /hana/log_backups/H80/01 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
*********************  HANA DR Restore Steps  **********************************
* Please complete the following steps to recover your HANA database:           *
* 1. Ensure ALL the target mount points exist to mount the snapshot clones.    *
*    e.g. mkdir /hana/logbackups/H99_SOURCE                                    *
* 2. Add Mount Point Details from 'Displaying Mount Points by Volume' as       *
*    output above into /etc/fstab of DR Server.                                *
* 3. Mount newly added filesystems.                                            *
* 4. Perform HANA Snapshot Recovery using HANA Studio.                         *
********************************************************************************

Remarque

Vous devez suivre les étapes à la fin de l’affichage de la console pour préparer le stockage à un basculement DR.

Étape 5 : Démonter les systèmes de fichiers inutiles

Exécutez la commande umount pour démonter les systèmes de fichiers/volumes qui ne sont pas nécessaires.

umount <Mount point>

Démontez les points de montage des données et des sauvegardes de fichiers journaux. Vous pouvez avoir plusieurs points de montage de données dans le scénario de scale-out.

Étape 6 : Configurer les points de montage

Modifiez le fichier /etc/fstab pour commenter les entrées de données et de sauvegardes des fichiers journaux pour le SID principal (dans cet exemple, SID=H80), puis ajoutez les nouvelles entrées de point de montage créées à partir des volumes DR du site principal. Les nouvelles entrées de point de montage sont fournies dans la sortie de la commande.

Commentez les points de montage existants exécutés sur le site DR avec le caractère # :

#172.18.20.241:/hana_data_h80_mnt00001_t020_vol /hana/data/H80/mnt00001 nfs     rw,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
#172.18.20.241:/hana_log_backups_h80_t020 /hana/logbackups/H80 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0

Ajoutez les lignes suivantes à /etc/fstab

cette sortie doit être la même que celle de la commande

10.50.251.34:/hana_data_h80_mnt00001_t020_xdp  /hana/data/H80/mnt00001 nfs  rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
10.50.251.36:/hana_log_backups_h80_t020_xdp01  /hana/log_backups/H80/01 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0

Étape 7 : Monter les volumes de récupération

Exécutez la commande mount –a pour monter tous les points de montage.

mount -a

À présent, si vous exécutez df –h vous devez voir les volumes *_dp montés.

df -h

Filesystem Size Used Avail Use% Mounted on
devtmpfs 378G 8.0K 378G 1% /dev
tmpfs 569G 0 569G 0% /dev/shm
tmpfs 378G 18M 378G 1% /run
tmpfs 378G 0 378G 0% /sys/fs/cgroup
/dev/mapper/3600a098038304445622b4b584c575a66-part2 47G 20G 28G 42% /
/dev/mapper/3600a098038304445622b4b584c575a66-part1 979M 57M 856M 7% /boot
172.18.20.241:/hana_log_h80_mnt00003_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00001_t020_vol 512G 5.5G 507G 2% /hana/log/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00003_t020_vol 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00002_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00002_t020_vol 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00001_t020_vol 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_shared_h80_t020_vol/usr_sap_node1 2.7T 11G 2.7T 1% /usr/sap/H80
tmpfs 76G 0 76G 0% /run/user/0
172.18.20.241:/hana_shared_h80_t020_vol 2.7T 11G 2.7T 1% /hana/shared
172.18.20.241:/hana_data_h80_mnt00001_t020_xdp 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00002_t020_xdp 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00003_t020_xdp 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_backups_h80_t020_xdp 512G 15G 498G 3% /hana/logbackups/H80_T250

Étape 8 : Récupérer SYSTEMDB

À partir d’HANA Studio, cliquez avec le bouton droit sur instance de SYSTEMDB, choisissez « Backup and Recovery » (Sauvegarde et récupération), puis « Recover System Database » (Récupérer la base de données système)

Consultez le guide pour récupérer une base de données à partir d’un instantané, en particulier SYSTEMDB.

Étape 9 : Récupérer la base de données de locataire

À partir d’HANA Studio, cliquez avec le bouton droit sur instance de SYSTEMDB, choisissez « Backup and Recovery » (Sauvegarde et récupération), puis « Recover Tenant Database » (Récupérer la base de données de locataire).

Consultez le guide pour récupérer une base de données à partir d’un instantané, en particulier la ou les bases de données de locataire.

Exécuter `azacsnap -c backup` sur le site DR

Si vous exécutez des sauvegardes basées sur des instantanés sur le site DR, le nom du serveur HANA configuré dans le fichier config azacsnap sur le site DR doit être identique au nom du serveur de production.

Important

L’exécution de azacsnap -c backup peut entraîner la création d’instantanés de stockage sur le site DR. Ceux-ci ne sont pas automatiquement répliqués vers un autre site. Collaborez avec l’équipe des opérations Microsoft pour mieux comprendre comment restaurer les fichiers ou les données sur le site de production d’origine.

Partager via

Récupération d’urgence avec l’outil Azure Application Consistent Snapshot Tool

Introduction

Prérequis de la configuration d’une reprise d’activité

Configurer une récupération d'urgence

Superviser la réplication des données du site principal au site DR

Effectuer un basculement vers le site DR

Exemple de reprise d’activité

Étape 1 : Obtenir les détails du volume du nœud DR

Étape 2 : Arrêter HANA sur le site principal

Étape 3 : Arrêter HANA sur le site DR

Étape 4 : Restaurer les volumes

Étape 5 : Démonter les systèmes de fichiers inutiles

Étape 6 : Configurer les points de montage

Étape 7 : Monter les volumes de récupération

Étape 8 : Récupérer SYSTEMDB

Étape 9 : Récupérer la base de données de locataire

Exécuter `azacsnap -c backup` sur le site DR

Étapes suivantes

Commentaires

Ressources supplémentaires

Partager via

Récupération d’urgence avec l’outil Azure Application Consistent Snapshot Tool

Introduction

Prérequis de la configuration d’une reprise d’activité

Configurer une récupération d'urgence

Superviser la réplication des données du site principal au site DR

Effectuer un basculement vers le site DR

Exemple de reprise d’activité

Étape 1 : Obtenir les détails du volume du nœud DR

Étape 2 : Arrêter HANA sur le site principal

Étape 3 : Arrêter HANA sur le site DR

Étape 4 : Restaurer les volumes

Étape 5 : Démonter les systèmes de fichiers inutiles

Étape 6 : Configurer les points de montage

Étape 7 : Monter les volumes de récupération

Étape 8 : Récupérer SYSTEMDB

Étape 9 : Récupérer la base de données de locataire

Exécuter azacsnap -c backup sur le site DR

Étapes suivantes

Commentaires

Ressources supplémentaires

Exécuter `azacsnap -c backup` sur le site DR