Udostępnij za pośrednictwem


Odzyskiwanie po awarii przy użyciu narzędzia aplikacja systemu Azure spójnej migawki

W tym artykule wyjaśniono, jak przeprowadzić odzyskiwanie po awarii podczas korzystania z narzędzia aplikacja systemu Azure spójnej migawki, którego można używać z usługą Azure NetApp Files.

Ważne

Ta operacja dotyczy tylko dużego wystąpienia platformy Azure.

Wprowadzenie

Platforma Azure Large Instance może również mieć skonfigurowaną lokację odzyskiwania po awarii, w której można replikować migawki woluminu magazynu. Jeśli migawki zostały prawidłowo skonfigurowane z taką konfiguracją, możliwe jest przeprowadzenie odzyskiwania po awarii w tej lokacji. Ten dokument ma być przewodnikiem po wykonaniu odzyskiwania po awarii dla tej konfiguracji.

Wymagania wstępne dotyczące konfiguracji odzyskiwania po awarii

Przed zaplanowaniem trybu failover odzyskiwania po awarii należy spełnić następujące wymagania wstępne.

  • Węzeł odzyskiwania po awarii jest aprowizowany w lokacji odzyskiwania po awarii. Istnieją dwie opcje odzyskiwania po awarii. Jeden z nich jest normalnym odzyskiwaniem po awarii, a drugi jest wielozadaniowy odzyskiwanie po awarii.
  • Masz działającą replikację magazynu. Zespół operacyjny firmy Microsoft automatycznie wykonuje konfigurację replikacji magazynu w momencie aprowizacji odzyskiwania po awarii. Replikację magazynu można monitorować przy użyciu polecenia azacsnap -c details --details replication w lokacji odzyskiwania po awarii.
  • W lokalizacji podstawowej skonfigurowano i skonfigurowano migawki magazynu.
  • Wystąpienie platformy HANA jest zainstalowane w lokacji odzyskiwania po awarii dla serwera podstawowego z tym samym identyfikatorem SID co wystąpienie podstawowe.
  • Przeczytaj i zapoznasz się z procedurą trybu failover odzyskiwania po awarii opisaną w artykule Sap HANA Large Instances high availability and disaster recovery on Azure (Wysoka dostępność i odzyskiwanie po awarii na platformie Azure)
  • W lokalizacji odzyskiwania po awarii skonfigurowano i skonfigurowano migawki magazynu.
  • Plik konfiguracji (na przykład DR.json) został utworzony przy użyciu woluminów magazynu odzyskiwania po awarii i skojarzonych informacji na serwerze odzyskiwania po awarii.
  • Kroki opisane w lokacji odzyskiwania po awarii zostały wykonane w celu wykonania następujących czynności:
    • Włącz komunikację z magazynem.
    • Włącz komunikację z platformą SAP HANA.

Konfigurowanie odzyskiwania po awarii

Firma Microsoft obsługuje replikację na poziomie magazynu na potrzeby odzyskiwania po awarii. Istnieją dwa sposoby konfigurowania odzyskiwania po awarii.

Jeden z nich jest normalny , a drugi jest wielofunkcyjny. W przypadku normalnego odzyskiwania po awarii masz dedykowane wystąpienie w lokalizacji odzyskiwania po awarii na potrzeby trybu failover. W scenariuszu odzyskiwania po awarii obejmującej wiele programowania masz inne wystąpienie QA lub HANA działające w dużej jednostce wystąpienia platformy HANA w lokacji odzyskiwania po awarii. Zainstalowano również wstępnie zainstalowane wystąpienie platformy HANA, które jest uśpione i ma ten sam identyfikator SID co wystąpienie platformy HANA, które ma zostać przełączone w tryb failover do tej jednostki dużego wystąpienia platformy HANA. Operacje firmy Microsoft konfigurują środowisko, w tym replikację magazynu na podstawie danych wejściowych podanych w formularzu żądania obsługi (SRF) w momencie dołączania.

Ważne

Upewnij się, że wszystkie wymagania wstępne zostały spełnione dla konfiguracji odzyskiwania po awarii.

Monitorowanie replikacji danych z lokacji podstawowej do lokacji odzyskiwania po awarii

Zespół operacyjny firmy Microsoft już zarządza i monitoruje link odzyskiwania po awarii z lokacji głównej do lokacji odzyskiwania po awarii. Replikację danych z serwera podstawowego do serwera odzyskiwania po awarii można monitorować przy użyciu polecenia azacsnap -c details --details replicationmigawki .

Przechodzenie w tryb failover do lokacji odzyskiwania po awarii

Uruchom polecenie trybu failover w lokacji odzyskiwania po awarii (azacsnap -c restore --restore revertvolume).

Ważne

Polecenie azacsnap -c restore --restore revertvolume powoduje przerwanie replikacji magazynu z lokacji produkcyjnej do lokacji odzyskiwania po awarii. Aby ponownie skonfigurować replikację, musisz skontaktować się z firmą Microsoft Operations. Po ponownym włączeniu replikacji wszystkie dane w magazynie odzyskiwania po awarii dla tego identyfikatora SID zostaną zainicjowane. Polecenie, które wykonuje tryb failover, udostępnia ostatnio replikowane migawki magazynu. Jeśli musisz przywrócić starszą migawkę, otwórz wniosek o pomoc techniczną, aby operacje mogły pomóc w udostępnieniu wcześniejszej migawki przywróconej w witrynie odzyskiwania po awarii.

Poniżej przedstawiono kroki, które należy wykonać w przypadku trybu failover odzyskiwania po awarii:

  • Należy zamknąć wystąpienie platformy HANA w lokacji głównej . Ta akcja jest wymagana tylko wtedy, gdy naprawdę wykonujesz tryb failover w witrynie odzyskiwania po awarii, aby nie mieć niespójności danych.
  • Zamknij wystąpienie platformy HANA w węźle odzyskiwania po awarii dla produkcyjnego identyfikatora SID.
  • Wykonaj polecenie azacsnap -c restore --restore revertvolume w węźle odzyskiwania po awarii z identyfikatorem SID, aby odzyskać
    • Polecenie przerywa połączenie replikacji magazynu z lokacji podstawowej do lokacji odzyskiwania po awarii
    • Polecenie przywraca tylko wolumin /data i /logbackups, /shared wolumin nie jest odzyskiwane, ale raczej używa istniejącego /udostępnionego identyfikatora SID w lokalizacji odzyskiwania po awarii.
    • Zainstaluj wolumin /data i /logbackups — upewnij się, że dodaj go do pliku fstab
  • Przywróć migawkę bazy danych HANA SYSTEMDB. Program HANA Studio pokazuje tylko najnowszą migawkę platformy HANA dostępną w ramach migawki magazynu przywróconej w ramach wykonywania polecenia azacsnap -c restore --restore revertvolume .
  • Odzyskiwanie bazy danych dzierżawy.
  • Uruchom wystąpienie HANA w lokacji odzyskiwania po awarii dla produkcyjnego identyfikatora SID (przykład: H80 w tym przypadku).
  • Przeprowadzanie testów.

Przykład wykonywania odzyskiwania po awarii

W tej podsekcji opisano szczegółowe kroki przejścia w tryb failover do lokacji odzyskiwania po awarii.

Krok 1. Pobieranie szczegółów woluminu węzła odzyskiwania po awarii

Wykonaj polecenie df –h , aby wyświetlić listę systemów plików i skojarzonych woluminów, aby odwoływać się do po przejściu w tryb failover.

df -h
Filesystem Size Used Avail Use% Mounted on
devtmpfs 378G 8.0K 378G 1% /dev
tmpfs 569G 0 569G 0%
/dev/shm
tmpfs 378G 18M 378G 1% /run
tmpfs 378G 0 378G 0%
/sys/fs/cgroup
/dev/mapper/3600a098038304445622b4b584c575a66-part2 47G 20G 28G 42% /
/dev/mapper/3600a098038304445622b4b584c575a66-part1 979M 57M 856M 7% /boot
172.18.20.241:/hana_log_h80_mnt00003_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00001_t020_vol 512G 5.5G 507G 2% /hana/log/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00003_t020_vol 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00002_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00002_t020_vol 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00001_t020_vol 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_shared_h80_t020_vol/usr_sap_node1 2.7T 11G 2.7T 1% /usr/sap/H80
tmpfs 76G 0 76G 0% /run/user/0
172.18.20.241:/hana_shared_h80_t020_vol 2.7T 11G 2.7T 1% /hana/shared
172.18.20.241:/hana_data_h80_mnt00001_t020_xdp 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00002_t020_xdp 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00003_t020_xdp 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_backups_h80_t020_xdp 512G 15G 498G 3% /hana/logbackups/H80_T250

Krok 2. Zamykanie platformy HANA w lokacji głównej

Jeśli wykonasz pełne przejście w tryb failover obciążeń produkcyjnych i istnieje możliwość nawiązania połączenia z podstawową lokacją produkcyjną, zamknij wystąpienia sap HANA, które są przełączone w tryb failover do odzyskiwania po awarii.

Jeśli na przykład zalogowano się jako użytkownik główny, w poniższym przykładzie pokazano, jak można zamknąć platformę SAP HANA. Zastąp identyfikator <sid identyfikatorem SID> platformy SAP HANA.

su - <sid>adm
HDB stop

Krok 3. Zamykanie platformy HANA w witrynie odzyskiwania po awarii

Przed przywróceniem woluminów należy zamknąć platformę SAP HANA w lokacji odzyskiwania po awarii.

Jeśli na przykład zalogowano się jako użytkownik główny, w poniższym przykładzie pokazano, jak można zamknąć platformę SAP HANA. Zastąp identyfikator <sid identyfikatorem SID> platformy SAP HANA.

su - <sid>adm
HDB stop

Ważne

Przed przywróceniem woluminów upewnij się, że wystąpienia platformy HANA w witrynie odzyskiwania po awarii są wyłączone.

Krok 4. Przywracanie woluminów

azacsnap -c restore --restore revertvolume --dbsid H80

Dane wyjściowe polecenia trybu failover odzyskiwania po awarii.

azacsnap --configfile DR.json -c restore --restore revertvolume --dbsid H80
* This program is designed for those customers who have previously installed the
  Production HANA instance in the Disaster Recovery Location either as a
  stand-alone instance or as part of a multi-purpose environment.
* This program should be executed from the Disaster Recovery location otherwise
  unintended consequences may result.
* This program is intended to allow the customer to complete a Disaster Recovery
  failover.
* Any other restore points must be handled by Microsoft Operations.
* All volumes ('data' and 'other') are reverted to their most recent snapshot.
* The SnapMirror replication relationship between Prod and DR will be broken.

  CAUTION: a failback will be required after running this command and failback
   might not be a quick process and will require multiple steps in coordination
   with Microsoft Operations.

Do you wish to continue? (y/n) [n]: y
Checking state of HLI volumes for SID 'H80'
Configured volumes (Data and Other) are not quiesced for revert, will retry in 00:00:10 seconds
Volumes All Ok to Revert = True
Reverting volume 'hana_data_h80_mnt00001_t020_xdp' to snapshot 'H80_HANA_DATA_30MIN.2020-09-16_0330.0'
DR.json Data Volume #1 'hana_data_h80_mnt00001_t020_xdp' assigning to mountpoint 'mnt00001'
Reverting volume 'hana_log_backups_h80_t020_xdp01' to snapshot 'H80_HANA_LOGS_3MIN_X9.2020-09-16_0339.recent'
DR.json Other Volume #1 'hana_log_backups_h80_t020_xdp01' assigning to mountpoint '01'
HLI Volume revert completed for SID 'H80'
Displaying Mount Points by Volume as follows:
10.50.251.34:/hana_data_h80_mnt00001_t020_xdp  /hana/data/H80/mnt00001 nfs  rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
10.50.251.36:/hana_log_backups_h80_t020_xdp01  /hana/log_backups/H80/01 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
*********************  HANA DR Restore Steps  **********************************
* Please complete the following steps to recover your HANA database:           *
* 1. Ensure ALL the target mount points exist to mount the snapshot clones.    *
*    e.g. mkdir /hana/logbackups/H99_SOURCE                                    *
* 2. Add Mount Point Details from 'Displaying Mount Points by Volume' as       *
*    output above into /etc/fstab of DR Server.                                *
* 3. Mount newly added filesystems.                                            *
* 4. Perform HANA Snapshot Recovery using HANA Studio.                         *
********************************************************************************

Uwaga

Kroki na końcu ekranu konsoli należy wykonać w celu ukończenia przygotowania magazynu do przejścia w tryb failover odzyskiwania po awarii.

Krok 5. Odinstalowywanie niepotrzebnych systemów plików

Wykonaj polecenie umount , aby odinstalować systemy plików/woluminy, które nie są potrzebne.

umount <Mount point>

Odinstalowywanie punktów instalacji kopii zapasowych danych i dzienników. W scenariuszu skalowania w poziomie może istnieć wiele punktów instalacji danych.

Krok 6. Konfigurowanie punktów instalacji

Zmodyfikuj plik /etc/fstab , aby oznaczyć jako komentarz wpisy danych i kopii zapasowych dziennika dla podstawowego identyfikatora SID (w tym przykładzie SID=H80) i dodać nowe wpisy punktu instalacji utworzone na podstawie woluminów odzyskiwania po awarii lokacji głównej. Nowe wpisy punktu instalacji są podane w danych wyjściowych polecenia.

  • Oznacz jako komentarz istniejące punkty instalacji uruchomione w lokacji odzyskiwania po awarii z znakiem # :

    #172.18.20.241:/hana_data_h80_mnt00001_t020_vol /hana/data/H80/mnt00001 nfs     rw,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
    #172.18.20.241:/hana_log_backups_h80_t020 /hana/logbackups/H80 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
    
  • Dodaj następujące wiersze do /etc/fstab

    powinny to być te same dane wyjściowe polecenia

    10.50.251.34:/hana_data_h80_mnt00001_t020_xdp  /hana/data/H80/mnt00001 nfs  rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
    10.50.251.36:/hana_log_backups_h80_t020_xdp01  /hana/log_backups/H80/01 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
    

Krok 7. Instalowanie woluminów odzyskiwania

Wykonaj polecenie mount –a , aby zainstalować wszystkie punkty instalacji.

mount -a

Teraz, jeśli wykonasz polecenie df –h , powinny zostać wyświetlone woluminy *_dp zainstalowane.

df -h
Filesystem Size Used Avail Use% Mounted on
devtmpfs 378G 8.0K 378G 1% /dev
tmpfs 569G 0 569G 0% /dev/shm
tmpfs 378G 18M 378G 1% /run
tmpfs 378G 0 378G 0% /sys/fs/cgroup
/dev/mapper/3600a098038304445622b4b584c575a66-part2 47G 20G 28G 42% /
/dev/mapper/3600a098038304445622b4b584c575a66-part1 979M 57M 856M 7% /boot
172.18.20.241:/hana_log_h80_mnt00003_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00001_t020_vol 512G 5.5G 507G 2% /hana/log/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00003_t020_vol 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00002_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00002_t020_vol 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00001_t020_vol 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_shared_h80_t020_vol/usr_sap_node1 2.7T 11G 2.7T 1% /usr/sap/H80
tmpfs 76G 0 76G 0% /run/user/0
172.18.20.241:/hana_shared_h80_t020_vol 2.7T 11G 2.7T 1% /hana/shared
172.18.20.241:/hana_data_h80_mnt00001_t020_xdp 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00002_t020_xdp 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00003_t020_xdp 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_backups_h80_t020_xdp 512G 15G 498G 3% /hana/logbackups/H80_T250

Krok 8. Odzyskiwanie bazy danych SYSTEMDB

W programie HANA Studio kliknij prawym przyciskiem myszy wystąpienie bazy danych SYSTEMDB i wybierz pozycję "Kopia zapasowa i odzyskiwanie", a następnie pozycję "Odzyskaj systemową bazę danych"

Zobacz przewodnik odzyskiwania bazy danych z migawki, w szczególności systemDB.

Krok 9. Odzyskiwanie bazy danych dzierżawy

W programie HANA Studio kliknij prawym przyciskiem myszy wystąpienie bazy danych SYSTEMDB i wybierz pozycję "Kopia zapasowa i odzyskiwanie", a następnie pozycję "Odzyskaj bazę danych dzierżawy".

Zapoznaj się z przewodnikiem dotyczącym odzyskiwania bazy danych z migawki, w szczególności baz danych DZIERŻAWY.

Uruchamianie azacsnap -c backup w lokacji odzyskiwania po awarii

Jeśli uruchamiasz kopie zapasowe oparte na migawkach w lokacji odzyskiwania po awarii, nazwa serwera HANA skonfigurowana w pliku konfiguracji w azacsnap lokacji odzyskiwania po awarii powinna być taka sama jak nazwa serwera produkcyjnego.

Ważne

Uruchomienie programu azacsnap -c backup może tworzyć migawki magazynu w lokacji odzyskiwania po awarii. Nie są one automatycznie replikowane do innej lokacji. Współpracuj z operacjami firmy Microsoft, aby lepiej zrozumieć zwracanie plików lub danych z powrotem do oryginalnej witryny produkcyjnej.

Następne kroki