Ripristino di emergenza con lo strumento snapshot coerente con app Azure
Questo articolo illustra come eseguire il ripristino di emergenza quando si usa lo strumento snapshot coerente app Azure che è possibile usare con Azure NetApp Files.
Importante
Questa operazione si applica solo all'istanza Large di Azure.
Introduzione
La piattaforma di istanze Large di Azure può anche avere un sito di ripristino di emergenza configurato in cui è possibile replicare gli snapshot del volume di archiviazione. Se gli snapshot sono stati configurati correttamente con tale configurazione, è possibile eseguire un ripristino di emergenza in questo sito. Questo documento è destinato a essere una guida all'esecuzione del ripristino di emergenza per questa configurazione.
Prerequisiti per la configurazione del ripristino di emergenza
Prima di pianificare il failover di ripristino di emergenza, è necessario soddisfare i prerequisiti seguenti.
- È stato eseguito il provisioning di un nodo di ripristino di emergenza nel sito di ripristino di emergenza. Sono disponibili due opzioni per il ripristino di emergenza. Uno è il ripristino di emergenza normale e l'altro è il ripristino di emergenza multiuso.
- La replica di archiviazione funziona. Il team operativo Microsoft esegue automaticamente la configurazione della replica di archiviazione al momento del provisioning del ripristino di emergenza. È possibile monitorare la replica di archiviazione usando il comando
azacsnap -c details --details replication
nel sito di ripristino di emergenza. - Gli snapshot di archiviazione sono stati configurati e configurati nella posizione primaria.
- Nel sito di ripristino di emergenza è installata un'istanza di HANA per il database primario con lo stesso SID dell'istanza primaria.
- Leggere e comprendere la procedura di failover di ripristino di emergenza descritta in Disponibilità elevata e ripristino di emergenza di istanze Large di SAP HANA in Azure
- Gli snapshot di archiviazione sono stati configurati e configurati nella posizione di ripristino di emergenza.
- È stato creato un file di configurazione , ad esempio ,
DR.json
con i volumi di archiviazione di ripristino di emergenza e le informazioni associate sul server di ripristino di emergenza. - Sono stati completati i passaggi nel sito di ripristino di emergenza per:
- Abilitare la comunicazione con l'archiviazione.
- Abilitare la comunicazione con SAP HANA.
Configurare il ripristino di emergenza
Microsoft supporta la replica a livello di archiviazione per il ripristino di emergenza. Esistono due modi per configurare il ripristino di emergenza.
Uno è normale e l'altro è multiuso. Nel ripristino di emergenza normale si dispone di un'istanza dedicata nella posizione di ripristino di emergenza per il failover. Nello scenario di ripristino di emergenza multiuso è presente un'altra istanza di HANA di sviluppo o controllo di qualità in esecuzione nell'unità di istanze Large di HANA nel sito di ripristino di emergenza. È stata installata anche un'istanza di HANA preinstallata che è inattiva e ha lo stesso SID dell'istanza di HANA di cui si vuole eseguire il failover in tale unità di istanze Large di HANA. Le operazioni Microsoft configurano l'ambiente per l'utente, inclusa la replica di archiviazione in base all'input fornito nel modulo di richiesta di servizio (SRF) al momento dell'onboarding.
Importante
Assicurarsi che tutti i prerequisiti siano soddisfatti per la configurazione di ripristino di emergenza.
Monitorare la replica dei dati dal sito primario al sito di ripristino di emergenza
Il team operativo Microsoft gestisce e monitora già il collegamento di ripristino di emergenza dal sito primario al sito di ripristino di emergenza.
È possibile monitorare la replica dei dati dal server primario al server di ripristino di emergenza usando il comando azacsnap -c details --details replication
snapshot .
Eseguire un failover nel sito di ripristino di emergenza
Eseguire il comando di failover nel sito di ripristino di emergenza (azacsnap -c restore --restore revertvolume
).
Importante
Il azacsnap -c restore --restore revertvolume
comando interrompe la replica di archiviazione dal sito di produzione al sito di ripristino di emergenza. Per configurare di nuovo la replica, è necessario contattare le operazioni Microsoft. Dopo aver riabilitato la replica, tutti i dati nell'archiviazione di ripristino di emergenza per questo SID verranno inizializzati. Il comando che esegue il failover rende disponibile lo snapshot di archiviazione replicato più di recente. Se è necessario ripristinare uno snapshot precedente, aprire una richiesta di supporto per consentire alle operazioni di fornire uno snapshot precedente ripristinato nel sito di ripristino di emergenza.
A livello generale, ecco i passaggi da seguire per il failover di ripristino di emergenza:
- È necessario arrestare l'istanza di HANA nel sito primario . Questa azione è necessaria solo se si esegue realmente il failover nel sito di ripristino di emergenza in modo da non avere incoerenze di dati.
- Arrestare l'istanza di HANA nel nodo di ripristino di emergenza per il SID di produzione.
- Eseguire il comando
azacsnap -c restore --restore revertvolume
nel nodo di ripristino di emergenza con il SID da ripristinare- Il comando interrompe il collegamento di replica dell'archiviazione dal sito primario al sito di ripristino di emergenza
- Il comando ripristina solo il volume /data e /logbackups, /shared volume non viene recuperato, ma usa il file /shared esistente per SID nel percorso di ripristino di emergenza.
- Montare il volume /data e /logbackups: assicurarsi di aggiungerlo al file fstab
- Ripristinare lo snapshot HANA SYSTEMDB. HANA Studio mostra solo lo snapshot HANA più recente disponibile nello snapshot di archiviazione ripristinato come parte dell'esecuzione del comando
azacsnap -c restore --restore revertvolume
. - Ripristinare il database tenant.
- Avviare l'istanza di HANA nel sito di ripristino di emergenza per il SID di produzione (ad esempio: H80 in questo caso).
- Eseguire i test.
Esempio di esecuzione del ripristino di emergenza
Questa sottosezione descrive i passaggi dettagliati per un failover nel sito di ripristino di emergenza.
Passaggio 1: Ottenere i dettagli del volume del nodo di ripristino di emergenza
Eseguire il comando df –h
per elencare i file system e i volumi associati a cui fare riferimento dopo il failover.
df -h
Filesystem Size Used Avail Use% Mounted on
devtmpfs 378G 8.0K 378G 1% /dev
tmpfs 569G 0 569G 0%
/dev/shm
tmpfs 378G 18M 378G 1% /run
tmpfs 378G 0 378G 0%
/sys/fs/cgroup
/dev/mapper/3600a098038304445622b4b584c575a66-part2 47G 20G 28G 42% /
/dev/mapper/3600a098038304445622b4b584c575a66-part1 979M 57M 856M 7% /boot
172.18.20.241:/hana_log_h80_mnt00003_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00001_t020_vol 512G 5.5G 507G 2% /hana/log/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00003_t020_vol 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00002_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00002_t020_vol 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00001_t020_vol 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_shared_h80_t020_vol/usr_sap_node1 2.7T 11G 2.7T 1% /usr/sap/H80
tmpfs 76G 0 76G 0% /run/user/0
172.18.20.241:/hana_shared_h80_t020_vol 2.7T 11G 2.7T 1% /hana/shared
172.18.20.241:/hana_data_h80_mnt00001_t020_xdp 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00002_t020_xdp 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00003_t020_xdp 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_backups_h80_t020_xdp 512G 15G 498G 3% /hana/logbackups/H80_T250
Passaggio 2: Arrestare HANA nel sito primario
Se si esegue un failover completo dei carichi di lavoro di produzione ed è possibile connettersi al sito di produzione primario, arrestare le istanze di SAP HANA sottoposte a failover nel ripristino di emergenza.
Ad esempio, se è stato eseguito l'accesso come radice nell'esempio seguente viene illustrato come arrestare SAP HANA. Sostituire <sid> con il SID di SAP HANA.
su - <sid>adm
HDB stop
Passaggio 3: Arrestare HANA nel sito di ripristino di emergenza
È importante arrestare SAP HANA nel sito di ripristino di emergenza prima di ripristinare i volumi.
Ad esempio, se è stato eseguito l'accesso come radice nell'esempio seguente viene illustrato come arrestare SAP HANA. Sostituire <sid> con il SID di SAP HANA.
su - <sid>adm
HDB stop
Importante
Assicurarsi che le istanze di HANA nel sito di ripristino di emergenza siano fuori linea prima di ripristinare tutti i volumi.
Passaggio 4: Ripristinare i volumi
azacsnap -c restore --restore revertvolume --dbsid H80
Output del comando failover di ripristino di emergenza.
azacsnap --configfile DR.json -c restore --restore revertvolume --dbsid H80
* This program is designed for those customers who have previously installed the
Production HANA instance in the Disaster Recovery Location either as a
stand-alone instance or as part of a multi-purpose environment.
* This program should be executed from the Disaster Recovery location otherwise
unintended consequences may result.
* This program is intended to allow the customer to complete a Disaster Recovery
failover.
* Any other restore points must be handled by Microsoft Operations.
* All volumes ('data' and 'other') are reverted to their most recent snapshot.
* The SnapMirror replication relationship between Prod and DR will be broken.
CAUTION: a failback will be required after running this command and failback
might not be a quick process and will require multiple steps in coordination
with Microsoft Operations.
Do you wish to continue? (y/n) [n]: y
Checking state of HLI volumes for SID 'H80'
Configured volumes (Data and Other) are not quiesced for revert, will retry in 00:00:10 seconds
Volumes All Ok to Revert = True
Reverting volume 'hana_data_h80_mnt00001_t020_xdp' to snapshot 'H80_HANA_DATA_30MIN.2020-09-16_0330.0'
DR.json Data Volume #1 'hana_data_h80_mnt00001_t020_xdp' assigning to mountpoint 'mnt00001'
Reverting volume 'hana_log_backups_h80_t020_xdp01' to snapshot 'H80_HANA_LOGS_3MIN_X9.2020-09-16_0339.recent'
DR.json Other Volume #1 'hana_log_backups_h80_t020_xdp01' assigning to mountpoint '01'
HLI Volume revert completed for SID 'H80'
Displaying Mount Points by Volume as follows:
10.50.251.34:/hana_data_h80_mnt00001_t020_xdp /hana/data/H80/mnt00001 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
10.50.251.36:/hana_log_backups_h80_t020_xdp01 /hana/log_backups/H80/01 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
********************* HANA DR Restore Steps **********************************
* Please complete the following steps to recover your HANA database: *
* 1. Ensure ALL the target mount points exist to mount the snapshot clones. *
* e.g. mkdir /hana/logbackups/H99_SOURCE *
* 2. Add Mount Point Details from 'Displaying Mount Points by Volume' as *
* output above into /etc/fstab of DR Server. *
* 3. Mount newly added filesystems. *
* 4. Perform HANA Snapshot Recovery using HANA Studio. *
********************************************************************************
Nota
I passaggi alla fine della visualizzazione della console devono essere eseguiti per completare la preparazione dell'archiviazione per un failover di ripristino di emergenza.
Passaggio 5: Smontare i file system non necessari
Eseguire il comando umount
per smontare i file system/volumi non necessari.
umount <Mount point>
Smontare i punti di montaggio di backup di dati e log. È possibile che si disponga di più punti di montaggio dati nello scenario di scalabilità orizzontale.
Passaggio 6: Configurare i punti di montaggio
Modificare il file /etc/fstab
per impostare come commento le voci di backup di dati e log per il SID primario (in questo esempio SID=H80) e aggiungere le nuove voci dei punti di montaggio create dai volumi di ripristino di emergenza del sito primario. Le nuove voci del punto di montaggio vengono fornite nell'output del comando.
Impostare come commento i punti di montaggio esistenti in esecuzione nel sito di ripristino di emergenza con il
#
carattere :#172.18.20.241:/hana_data_h80_mnt00001_t020_vol /hana/data/H80/mnt00001 nfs rw,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0 #172.18.20.241:/hana_log_backups_h80_t020 /hana/logbackups/H80 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
Aggiungere le righe seguenti a
/etc/fstab
deve essere lo stesso output del comando
10.50.251.34:/hana_data_h80_mnt00001_t020_xdp /hana/data/H80/mnt00001 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0 10.50.251.36:/hana_log_backups_h80_t020_xdp01 /hana/log_backups/H80/01 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
Passaggio 7: Montare i volumi di ripristino
Eseguire il comando mount –a
per montare tutti i punti di montaggio.
mount -a
A questo momento, se si esegue df –h
verranno visualizzati i *_dp
volumi montati.
df -h
Filesystem Size Used Avail Use% Mounted on
devtmpfs 378G 8.0K 378G 1% /dev
tmpfs 569G 0 569G 0% /dev/shm
tmpfs 378G 18M 378G 1% /run
tmpfs 378G 0 378G 0% /sys/fs/cgroup
/dev/mapper/3600a098038304445622b4b584c575a66-part2 47G 20G 28G 42% /
/dev/mapper/3600a098038304445622b4b584c575a66-part1 979M 57M 856M 7% /boot
172.18.20.241:/hana_log_h80_mnt00003_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00001_t020_vol 512G 5.5G 507G 2% /hana/log/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00003_t020_vol 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00002_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00002_t020_vol 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00001_t020_vol 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_shared_h80_t020_vol/usr_sap_node1 2.7T 11G 2.7T 1% /usr/sap/H80
tmpfs 76G 0 76G 0% /run/user/0
172.18.20.241:/hana_shared_h80_t020_vol 2.7T 11G 2.7T 1% /hana/shared
172.18.20.241:/hana_data_h80_mnt00001_t020_xdp 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00002_t020_xdp 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00003_t020_xdp 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_backups_h80_t020_xdp 512G 15G 498G 3% /hana/logbackups/H80_T250
Passaggio 8: Ripristinare SYSTEMDB
Da HANA Studio fare clic con il pulsante destro del mouse sull'istanza di SYSTEMDB e scegliere "Backup e ripristino" e quindi "Ripristina database di sistema"
Vedere la guida per ripristinare un database da uno snapshot, in particolare systemdb.
Passaggio 9: Ripristinare il database tenant
Da HANA Studio fare clic con il pulsante destro del mouse sull'istanza di SYSTEMDB e scegliere "Backup e ripristino" e quindi "Ripristina database tenant".
Vedere la guida per ripristinare un database da uno snapshot, in particolare i database TENANT.
Eseguire azacsnap -c backup
nel sito di ripristino di emergenza
Se si eseguono backup basati su snapshot nel sito di ripristino di emergenza, il nome del server HANA configurato nel azacsnap
file di configurazione nel sito di ripristino di emergenza deve corrispondere al nome del server di produzione.
Importante
L'esecuzione azacsnap -c backup
di può creare snapshot di archiviazione nel sito di ripristino di emergenza, che non vengono replicati automaticamente in un altro sito. Collaborare con Microsoft Operations per comprendere meglio la restituzione di file o dati al sito di produzione originale.