Pemulihan bencana menggunakan alat Azure Application Consistent Snapshot

Artikel
06/01/2023

Artikel ini menjelaskan cara melakukan pemulihan bencana saat menggunakan alat Azure Application Consistent Snapshot yang dapat Anda gunakan dengan Azure NetApp Files.

Penting

Operasi ini hanya berlaku untuk Instans Besar Azure.

Pendahuluan

Platform Instans Besar Azure juga dapat mengonfigurasikan situs Pemulihan Bencana, yang menjadi tempat replikasi rekam jepret volume penyimpanan. Jika rekam jepret telah dikonfigurasi secara sesuai dengan pengaturan tersebut, kita dapat melakukan Pemulihan Bencana di situs ini. Dokumen ini dimaksudkan sebagai panduan untuk melakukan Pemulihan Bencana untuk penyiapan ini.

Prasyarat untuk penyiapan pemulihan bencana

Prasyarat berikut harus dipenuhi sebelum Anda merencanakan kegagalan pemulihan bencana.

Anda harus memiliki node DR yang tersedia di situs DR. Ada dua opsi untuk DR. Salah satunya adalah DR normal, dan lainnya adalah DR multiguna.
Anda harus memiliki replikasi penyimpanan yang berfungsi. Tim operasi Microsoft melakukan penyiapan replikasi penyimpanan pada saat penyediaan DR secara otomatis. Anda dapat memantau replikasi penyimpanan menggunakan perintah azacsnap -c details --details replication di situs DR.
Anda telah menyiapkan dan mengonfigurasi rekam jepret penyimpanan di lokasi utama.
Anda telah menginstal instans HANA di situs DR untuk situs utama yang memiliki SID yang sama dengan instans utama.
Anda harus membaca dan memahami prosedur Kegagalan DR yang dijelaskan Pemulihan bencana dan ketersediaan tinggi Instans Besar SAP HANA di Azure
Anda telah menyiapkan dan mengonfigurasi rekam jepret penyimpanan di lokasi DR.
File konfigurasi (misalnya, DR.json ) telah dibuat dengan volume penyimpanan DR dan informasi terkait di server DR.
Anda menyelesaikan langkah-langkah di situs DR untuk:
- Mengaktifkan komunikasi dengan penyimpanan.
- Mengaktifkan komunikasi dengan SAP HANA.

Menyiapkan pemulihan bencana

Microsoft mendukung replikasi tingkat penyimpanan untuk pemulihan DR. Ada dua cara untuk menyiapkan DR.

Yang satu yakni dengan cara normal dan yang satu lagi adalah serbaguna. Dalam DR normal, Anda memiliki instans khusus di lokasi DR untuk kegagalan. Dalam skenario DR serbaguna, Anda memiliki instans QA atau pengembangan HANA lain yang berjalan di unit instans besar HANA di situs DR. Namun, Anda juga menginstal instans HANA pra-instal yang tidak aktif dan memiliki SID yang sama dengan instans HANA yang ingin Anda gagalkan pada unit Instans Besar HANA tersebut. Operasi Microsoft menyiapkan lingkungan tersebut untuk Anda, termasuk replikasi penyimpanan berdasarkan input yang disediakan dalam Formulir Permintaan Layanan (SRF) pada saat onboarding.

Penting

Pastikan bahwa semua prasyarat terpenuhi untuk penyiapan DR.

Memantau replikasi data dari situs Utama ke situs DR

Tim operasi Microsoft sudah mengelola dan memantau link DR dari situs Utama ke situs DR. Anda dapat memantau replikasi data dari server utama ke server DR menggunakan perintah rekam jepret azacsnap -c details --details replication.

Menjalankan skenario kegagalan pada situs DR

Jalankan perintah kegagalan di situs DR (azacsnap -c restore --restore revertvolume).

Penting

Perintah azacsnap -c restore --restore revertvolume memutus replikasi penyimpanan dari situs Produksi ke situs DR. Anda harus menghubungi tim Operasi Microsoft untuk menyiapkan replikasi lagi. Setelah replikasi diaktifkan kembali, semua data di penyimpanan DR untuk SID ini akan diinisialisasi. Perintah yang menjalankan skenario kegagalan akan menyediakan replikasi rekam jepret penyimpanan yang paling baru. Jika Anda perlu memulihkan kembali rekam jepret yang lebih lama, buka permintaan dukungan sehingga tim operasi dapat membantu menyediakan rekam jepret yang dipulihkan sebelumnya di situs DR.

Pada tingkat tinggi, berikut adalah langkah-langkah yang harus diikuti untuk skenario kegagalan DR:

Anda harus mematikan instans HANA di situs utama. Tindakan ini diperlukan hanya jika Anda benar-benar menjalankan skenario kegagalan pada situs DR, sehingga tidak ada inkonsistensi data.
Matikan instans HANA pada node DR untuk SID produksi.
Jalankan perintah azacsnap -c restore --restore revertvolume pada simpul DR dengan SID yang akan dipulihkan
- Perintah tersebut memutus tautan replikasi penyimpanan dari situs Utama ke situs DR
- Perintah ini hanya memulihkan volume /data dan /logbackups, volume /shared TIDAK dipulihkan. Sebagai gantinya, /shared yang sudah ada digunakan untuk SID di lokasi DR.
- Pasang volume /data dan /logbackups – pastikan untuk menambahkannya ke file fstab
Pulihkan rekam jepret HANA SYSTEMDB. HANA Studio hanya menampilkan rekam jepret HANA terbaru yang tersedia di bagian rekam jepret penyimpanan yang dipulihkan sebagai bagian dari eksekusi perintah azacsnap -c restore --restore revertvolume.
Pulihkan database penyewa.
Mulai instans HANA di situs DR untuk ID keamanan Produksi (Contoh: H80 dalam kasus ini).
Lakukan pengujian.

Contoh cara melakukan Pemulihan Bencana

Subbagian ini menjelaskan langkah-langkah terperinci untuk skenario kegagalan pada situs Pemulihan Bencana.

Langkah 1: Dapatkan detail volume node DR

Jalankan perintah df –h untuk mencantumkan sistem file dan volume terkait untuk dirujuk setelah kegagalan.

df -h

Filesystem Size Used Avail Use% Mounted on
devtmpfs 378G 8.0K 378G 1% /dev
tmpfs 569G 0 569G 0%
/dev/shm
tmpfs 378G 18M 378G 1% /run
tmpfs 378G 0 378G 0%
/sys/fs/cgroup
/dev/mapper/3600a098038304445622b4b584c575a66-part2 47G 20G 28G 42% /
/dev/mapper/3600a098038304445622b4b584c575a66-part1 979M 57M 856M 7% /boot
172.18.20.241:/hana_log_h80_mnt00003_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00001_t020_vol 512G 5.5G 507G 2% /hana/log/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00003_t020_vol 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00002_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00002_t020_vol 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00001_t020_vol 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_shared_h80_t020_vol/usr_sap_node1 2.7T 11G 2.7T 1% /usr/sap/H80
tmpfs 76G 0 76G 0% /run/user/0
172.18.20.241:/hana_shared_h80_t020_vol 2.7T 11G 2.7T 1% /hana/shared
172.18.20.241:/hana_data_h80_mnt00001_t020_xdp 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00002_t020_xdp 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00003_t020_xdp 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_backups_h80_t020_xdp 512G 15G 498G 3% /hana/logbackups/H80_T250

Langkah 2: Matikan HANA di situs Utama

Jika kita menjalankan skenario kegagalan total beban kerja produksi, dan ada kemungkinan untuk tersambung ke situs produksi Utama, matikan instans SAP HANA yang digagalkan pada DR.

Misalnya, jika kita masuk sebagai root, contoh berikut menunjukkan cara mematikan SAP HANA. Ganti <sid> dengan SAP Hana SID Anda.

su - <sid>adm
HDB stop

Langkah 3: Matikan HANA di situs DR

Sangat penting untuk mematikan SAP HANA di situs DR sebelum memulihkan volume.

Misalnya, jika kita masuk sebagai root, contoh berikut menunjukkan cara mematikan SAP HANA. Ganti <sid> dengan SAP Hana SID Anda.

su - <sid>adm
HDB stop

Penting

Sebelum memulihkan volume apa pun, pastikan instans HANA di situs DR sudah offline.

Langkah 4: Pulihkan volume

azacsnap -c restore --restore revertvolume --dbsid H80

Output dari perintah kegagalan DR.

azacsnap --configfile DR.json -c restore --restore revertvolume --dbsid H80

* This program is designed for those customers who have previously installed the
  Production HANA instance in the Disaster Recovery Location either as a
  stand-alone instance or as part of a multi-purpose environment.
* This program should be executed from the Disaster Recovery location otherwise
  unintended consequences may result.
* This program is intended to allow the customer to complete a Disaster Recovery
  failover.
* Any other restore points must be handled by Microsoft Operations.
* All volumes ('data' and 'other') are reverted to their most recent snapshot.
* The SnapMirror replication relationship between Prod and DR will be broken.

  CAUTION: a failback will be required after running this command and failback
   might not be a quick process and will require multiple steps in coordination
   with Microsoft Operations.

Do you wish to continue? (y/n) [n]: y
Checking state of HLI volumes for SID 'H80'
Configured volumes (Data and Other) are not quiesced for revert, will retry in 00:00:10 seconds
Volumes All Ok to Revert = True
Reverting volume 'hana_data_h80_mnt00001_t020_xdp' to snapshot 'H80_HANA_DATA_30MIN.2020-09-16_0330.0'
DR.json Data Volume #1 'hana_data_h80_mnt00001_t020_xdp' assigning to mountpoint 'mnt00001'
Reverting volume 'hana_log_backups_h80_t020_xdp01' to snapshot 'H80_HANA_LOGS_3MIN_X9.2020-09-16_0339.recent'
DR.json Other Volume #1 'hana_log_backups_h80_t020_xdp01' assigning to mountpoint '01'
HLI Volume revert completed for SID 'H80'
Displaying Mount Points by Volume as follows:
10.50.251.34:/hana_data_h80_mnt00001_t020_xdp  /hana/data/H80/mnt00001 nfs  rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
10.50.251.36:/hana_log_backups_h80_t020_xdp01  /hana/log_backups/H80/01 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
*********************  HANA DR Restore Steps  **********************************
* Please complete the following steps to recover your HANA database:           *
* 1. Ensure ALL the target mount points exist to mount the snapshot clones.    *
*    e.g. mkdir /hana/logbackups/H99_SOURCE                                    *
* 2. Add Mount Point Details from 'Displaying Mount Points by Volume' as       *
*    output above into /etc/fstab of DR Server.                                *
* 3. Mount newly added filesystems.                                            *
* 4. Perform HANA Snapshot Recovery using HANA Studio.                         *
********************************************************************************

Catatan

Langkah-langkah di akhir tampilan konsol perlu diambil guna menyelesaikan persiapan penyimpanan untuk kegagalan DR.

Langkah 5: Lepas sistem file yang tidak perlu

Jalankan perintah umount untuk melepas sistem file/volume yang tidak diperlukan.

umount <Mount point>

Lepas titik pemasangan cadangan log dan data. Anda mungkin memiliki beberapa titik pemasangan data dalam skenario perluasan.

Langkah 6: Konfigurasikan titik pemasangan

Ubah file /etc/fstab untuk mengomentari entri cadangan log dan data untuk SID utama (Dalam contoh ini, SID =H80), lalu tambahkan entri titik pemasangan baru yang dibuat dari volume DR situs Utama. Entri titik pemasangan baru disediakan dalam output perintah.

Komentari titik pemasangan yang sudah ada yang berjalan di situs DR dengan karakter #:

#172.18.20.241:/hana_data_h80_mnt00001_t020_vol /hana/data/H80/mnt00001 nfs     rw,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
#172.18.20.241:/hana_log_backups_h80_t020 /hana/logbackups/H80 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0

Tambahkan baris berikut ke /etc/fstab

ini harus merupakan output yang sama dari perintah

10.50.251.34:/hana_data_h80_mnt00001_t020_xdp  /hana/data/H80/mnt00001 nfs  rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
10.50.251.36:/hana_log_backups_h80_t020_xdp01  /hana/log_backups/H80/01 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0

Langkah 7: Pasang volume pemulihan

Jalankan perintah mount –a untuk memasang semua titik pemasangan.

mount -a

Sekarang, jika Anda menjalankan df –h, Anda akan melihat volume *_dp yang dipasang.

df -h

Filesystem Size Used Avail Use% Mounted on
devtmpfs 378G 8.0K 378G 1% /dev
tmpfs 569G 0 569G 0% /dev/shm
tmpfs 378G 18M 378G 1% /run
tmpfs 378G 0 378G 0% /sys/fs/cgroup
/dev/mapper/3600a098038304445622b4b584c575a66-part2 47G 20G 28G 42% /
/dev/mapper/3600a098038304445622b4b584c575a66-part1 979M 57M 856M 7% /boot
172.18.20.241:/hana_log_h80_mnt00003_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00001_t020_vol 512G 5.5G 507G 2% /hana/log/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00003_t020_vol 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00002_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00002_t020_vol 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00001_t020_vol 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_shared_h80_t020_vol/usr_sap_node1 2.7T 11G 2.7T 1% /usr/sap/H80
tmpfs 76G 0 76G 0% /run/user/0
172.18.20.241:/hana_shared_h80_t020_vol 2.7T 11G 2.7T 1% /hana/shared
172.18.20.241:/hana_data_h80_mnt00001_t020_xdp 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00002_t020_xdp 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00003_t020_xdp 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_backups_h80_t020_xdp 512G 15G 498G 3% /hana/logbackups/H80_T250

Langkah 8: Pulihkan SYSTEMDB

Dari HANA Studio, klik kanan instans SYSTEMDB dan pilih "Pencadangan dan Pemulihan", lalu "Pulihkan Database Sistem"

Lihat panduan untuk memulihkan database dari rekam jepret, khususnya SYSTEMDB.

Langkah 9: Pulihkan database Penyewa

Dari HANA Studio, klik kanan instans SYSTEMDB dan pilih "Pencadangan dan Pemulihan", lalu "Pulihkan Database Penyewa".

Lihat panduan untuk memulihkan database dari rekam jepret, khususnya database TENANT.

Manjalankan `azacsnap -c backup` di situs DR

Jika Anda menjalankan pencadangan berbasis rekam jepret di situs DR, Nama Server HANA yang dikonfigurasi dalam file konfigurasi azacsnap di situs DR harus sama dengan nama server produksi.

Penting

Menjalankan azacsnap -c backup dapat membuat rekam jepret penyimpanan di situs DR dan ini tidak otomatis direplikasi ke situs lain. Bekerja samalah dengan Operasi Microsoft untuk lebih memahami cara mengembalikan file atau data apa pun ke situs produksi aslinya.

Bagikan melalui

Pemulihan bencana menggunakan alat Azure Application Consistent Snapshot

Pendahuluan

Prasyarat untuk penyiapan pemulihan bencana

Menyiapkan pemulihan bencana

Memantau replikasi data dari situs Utama ke situs DR

Menjalankan skenario kegagalan pada situs DR

Contoh cara melakukan Pemulihan Bencana

Langkah 1: Dapatkan detail volume node DR

Langkah 2: Matikan HANA di situs Utama

Langkah 3: Matikan HANA di situs DR

Langkah 4: Pulihkan volume

Langkah 5: Lepas sistem file yang tidak perlu

Langkah 6: Konfigurasikan titik pemasangan

Langkah 7: Pasang volume pemulihan

Langkah 8: Pulihkan SYSTEMDB

Langkah 9: Pulihkan database Penyewa

Manjalankan `azacsnap -c backup` di situs DR

Langkah berikutnya

Saran dan Komentar

Sumber Daya Tambahan:

Bagikan melalui

Pemulihan bencana menggunakan alat Azure Application Consistent Snapshot

Pendahuluan

Prasyarat untuk penyiapan pemulihan bencana

Menyiapkan pemulihan bencana

Memantau replikasi data dari situs Utama ke situs DR

Menjalankan skenario kegagalan pada situs DR

Contoh cara melakukan Pemulihan Bencana

Langkah 1: Dapatkan detail volume node DR

Langkah 2: Matikan HANA di situs Utama

Langkah 3: Matikan HANA di situs DR

Langkah 4: Pulihkan volume

Langkah 5: Lepas sistem file yang tidak perlu

Langkah 6: Konfigurasikan titik pemasangan

Langkah 7: Pasang volume pemulihan

Langkah 8: Pulihkan SYSTEMDB

Langkah 9: Pulihkan database Penyewa

Manjalankan azacsnap -c backup di situs DR

Langkah berikutnya

Saran dan Komentar

Sumber Daya Tambahan:

Manjalankan `azacsnap -c backup` di situs DR