Pemulihan bencana menggunakan alat Azure Application Consistent Snapshot
Artikel ini menjelaskan cara melakukan pemulihan bencana saat menggunakan alat Azure Application Consistent Snapshot yang dapat Anda gunakan dengan Azure NetApp Files.
Penting
Operasi ini hanya berlaku untuk Instans Besar Azure.
Pendahuluan
Platform Instans Besar Azure juga dapat mengonfigurasikan situs Pemulihan Bencana, yang menjadi tempat replikasi rekam jepret volume penyimpanan. Jika rekam jepret telah dikonfigurasi secara sesuai dengan pengaturan tersebut, kita dapat melakukan Pemulihan Bencana di situs ini. Dokumen ini dimaksudkan sebagai panduan untuk melakukan Pemulihan Bencana untuk penyiapan ini.
Prasyarat untuk penyiapan pemulihan bencana
Prasyarat berikut harus dipenuhi sebelum Anda merencanakan kegagalan pemulihan bencana.
- Anda harus memiliki node DR yang tersedia di situs DR. Ada dua opsi untuk DR. Salah satunya adalah DR normal, dan lainnya adalah DR multiguna.
- Anda harus memiliki replikasi penyimpanan yang berfungsi. Tim operasi Microsoft melakukan penyiapan replikasi penyimpanan pada saat penyediaan DR secara otomatis. Anda dapat memantau replikasi penyimpanan menggunakan perintah
azacsnap -c details --details replication
di situs DR. - Anda telah menyiapkan dan mengonfigurasi rekam jepret penyimpanan di lokasi utama.
- Anda telah menginstal instans HANA di situs DR untuk situs utama yang memiliki SID yang sama dengan instans utama.
- Anda harus membaca dan memahami prosedur Kegagalan DR yang dijelaskan Pemulihan bencana dan ketersediaan tinggi Instans Besar SAP HANA di Azure
- Anda telah menyiapkan dan mengonfigurasi rekam jepret penyimpanan di lokasi DR.
- File konfigurasi (misalnya,
DR.json
) telah dibuat dengan volume penyimpanan DR dan informasi terkait di server DR. - Anda menyelesaikan langkah-langkah di situs DR untuk:
- Mengaktifkan komunikasi dengan penyimpanan.
- Mengaktifkan komunikasi dengan SAP HANA.
Menyiapkan pemulihan bencana
Microsoft mendukung replikasi tingkat penyimpanan untuk pemulihan DR. Ada dua cara untuk menyiapkan DR.
Yang satu yakni dengan cara normal dan yang satu lagi adalah serbaguna. Dalam DR normal, Anda memiliki instans khusus di lokasi DR untuk kegagalan. Dalam skenario DR serbaguna, Anda memiliki instans QA atau pengembangan HANA lain yang berjalan di unit instans besar HANA di situs DR. Namun, Anda juga menginstal instans HANA pra-instal yang tidak aktif dan memiliki SID yang sama dengan instans HANA yang ingin Anda gagalkan pada unit Instans Besar HANA tersebut. Operasi Microsoft menyiapkan lingkungan tersebut untuk Anda, termasuk replikasi penyimpanan berdasarkan input yang disediakan dalam Formulir Permintaan Layanan (SRF) pada saat onboarding.
Penting
Pastikan bahwa semua prasyarat terpenuhi untuk penyiapan DR.
Memantau replikasi data dari situs Utama ke situs DR
Tim operasi Microsoft sudah mengelola dan memantau link DR dari situs Utama ke situs DR.
Anda dapat memantau replikasi data dari server utama ke server DR menggunakan perintah rekam jepret azacsnap -c details --details replication
.
Menjalankan skenario kegagalan pada situs DR
Jalankan perintah kegagalan di situs DR (azacsnap -c restore --restore revertvolume
).
Penting
Perintah azacsnap -c restore --restore revertvolume
memutus replikasi penyimpanan dari situs Produksi ke situs DR. Anda harus menghubungi tim Operasi Microsoft untuk menyiapkan replikasi lagi. Setelah replikasi diaktifkan kembali, semua data di penyimpanan DR untuk SID ini akan diinisialisasi. Perintah yang menjalankan skenario kegagalan akan menyediakan replikasi rekam jepret penyimpanan yang paling baru. Jika Anda perlu memulihkan kembali rekam jepret yang lebih lama, buka permintaan dukungan sehingga tim operasi dapat membantu menyediakan rekam jepret yang dipulihkan sebelumnya di situs DR.
Pada tingkat tinggi, berikut adalah langkah-langkah yang harus diikuti untuk skenario kegagalan DR:
- Anda harus mematikan instans HANA di situs utama. Tindakan ini diperlukan hanya jika Anda benar-benar menjalankan skenario kegagalan pada situs DR, sehingga tidak ada inkonsistensi data.
- Matikan instans HANA pada node DR untuk SID produksi.
- Jalankan perintah
azacsnap -c restore --restore revertvolume
pada simpul DR dengan SID yang akan dipulihkan- Perintah tersebut memutus tautan replikasi penyimpanan dari situs Utama ke situs DR
- Perintah ini hanya memulihkan volume /data dan /logbackups, volume /shared TIDAK dipulihkan. Sebagai gantinya, /shared yang sudah ada digunakan untuk SID di lokasi DR.
- Pasang volume /data dan /logbackups – pastikan untuk menambahkannya ke file fstab
- Pulihkan rekam jepret HANA SYSTEMDB. HANA Studio hanya menampilkan rekam jepret HANA terbaru yang tersedia di bagian rekam jepret penyimpanan yang dipulihkan sebagai bagian dari eksekusi perintah
azacsnap -c restore --restore revertvolume
. - Pulihkan database penyewa.
- Mulai instans HANA di situs DR untuk ID keamanan Produksi (Contoh: H80 dalam kasus ini).
- Lakukan pengujian.
Contoh cara melakukan Pemulihan Bencana
Subbagian ini menjelaskan langkah-langkah terperinci untuk skenario kegagalan pada situs Pemulihan Bencana.
Langkah 1: Dapatkan detail volume node DR
Jalankan perintah df –h
untuk mencantumkan sistem file dan volume terkait untuk dirujuk setelah kegagalan.
df -h
Filesystem Size Used Avail Use% Mounted on
devtmpfs 378G 8.0K 378G 1% /dev
tmpfs 569G 0 569G 0%
/dev/shm
tmpfs 378G 18M 378G 1% /run
tmpfs 378G 0 378G 0%
/sys/fs/cgroup
/dev/mapper/3600a098038304445622b4b584c575a66-part2 47G 20G 28G 42% /
/dev/mapper/3600a098038304445622b4b584c575a66-part1 979M 57M 856M 7% /boot
172.18.20.241:/hana_log_h80_mnt00003_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00001_t020_vol 512G 5.5G 507G 2% /hana/log/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00003_t020_vol 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00002_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00002_t020_vol 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00001_t020_vol 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_shared_h80_t020_vol/usr_sap_node1 2.7T 11G 2.7T 1% /usr/sap/H80
tmpfs 76G 0 76G 0% /run/user/0
172.18.20.241:/hana_shared_h80_t020_vol 2.7T 11G 2.7T 1% /hana/shared
172.18.20.241:/hana_data_h80_mnt00001_t020_xdp 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00002_t020_xdp 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00003_t020_xdp 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_backups_h80_t020_xdp 512G 15G 498G 3% /hana/logbackups/H80_T250
Langkah 2: Matikan HANA di situs Utama
Jika kita menjalankan skenario kegagalan total beban kerja produksi, dan ada kemungkinan untuk tersambung ke situs produksi Utama, matikan instans SAP HANA yang digagalkan pada DR.
Misalnya, jika kita masuk sebagai root, contoh berikut menunjukkan cara mematikan SAP HANA. Ganti <sid> dengan SAP Hana SID Anda.
su - <sid>adm
HDB stop
Langkah 3: Matikan HANA di situs DR
Sangat penting untuk mematikan SAP HANA di situs DR sebelum memulihkan volume.
Misalnya, jika kita masuk sebagai root, contoh berikut menunjukkan cara mematikan SAP HANA. Ganti <sid> dengan SAP Hana SID Anda.
su - <sid>adm
HDB stop
Penting
Sebelum memulihkan volume apa pun, pastikan instans HANA di situs DR sudah offline.
Langkah 4: Pulihkan volume
azacsnap -c restore --restore revertvolume --dbsid H80
Output dari perintah kegagalan DR.
azacsnap --configfile DR.json -c restore --restore revertvolume --dbsid H80
* This program is designed for those customers who have previously installed the
Production HANA instance in the Disaster Recovery Location either as a
stand-alone instance or as part of a multi-purpose environment.
* This program should be executed from the Disaster Recovery location otherwise
unintended consequences may result.
* This program is intended to allow the customer to complete a Disaster Recovery
failover.
* Any other restore points must be handled by Microsoft Operations.
* All volumes ('data' and 'other') are reverted to their most recent snapshot.
* The SnapMirror replication relationship between Prod and DR will be broken.
CAUTION: a failback will be required after running this command and failback
might not be a quick process and will require multiple steps in coordination
with Microsoft Operations.
Do you wish to continue? (y/n) [n]: y
Checking state of HLI volumes for SID 'H80'
Configured volumes (Data and Other) are not quiesced for revert, will retry in 00:00:10 seconds
Volumes All Ok to Revert = True
Reverting volume 'hana_data_h80_mnt00001_t020_xdp' to snapshot 'H80_HANA_DATA_30MIN.2020-09-16_0330.0'
DR.json Data Volume #1 'hana_data_h80_mnt00001_t020_xdp' assigning to mountpoint 'mnt00001'
Reverting volume 'hana_log_backups_h80_t020_xdp01' to snapshot 'H80_HANA_LOGS_3MIN_X9.2020-09-16_0339.recent'
DR.json Other Volume #1 'hana_log_backups_h80_t020_xdp01' assigning to mountpoint '01'
HLI Volume revert completed for SID 'H80'
Displaying Mount Points by Volume as follows:
10.50.251.34:/hana_data_h80_mnt00001_t020_xdp /hana/data/H80/mnt00001 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
10.50.251.36:/hana_log_backups_h80_t020_xdp01 /hana/log_backups/H80/01 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
********************* HANA DR Restore Steps **********************************
* Please complete the following steps to recover your HANA database: *
* 1. Ensure ALL the target mount points exist to mount the snapshot clones. *
* e.g. mkdir /hana/logbackups/H99_SOURCE *
* 2. Add Mount Point Details from 'Displaying Mount Points by Volume' as *
* output above into /etc/fstab of DR Server. *
* 3. Mount newly added filesystems. *
* 4. Perform HANA Snapshot Recovery using HANA Studio. *
********************************************************************************
Catatan
Langkah-langkah di akhir tampilan konsol perlu diambil guna menyelesaikan persiapan penyimpanan untuk kegagalan DR.
Langkah 5: Lepas sistem file yang tidak perlu
Jalankan perintah umount
untuk melepas sistem file/volume yang tidak diperlukan.
umount <Mount point>
Lepas titik pemasangan cadangan log dan data. Anda mungkin memiliki beberapa titik pemasangan data dalam skenario perluasan.
Langkah 6: Konfigurasikan titik pemasangan
Ubah file /etc/fstab
untuk mengomentari entri cadangan log dan data untuk SID utama (Dalam contoh ini, SID =H80), lalu tambahkan entri titik pemasangan baru yang dibuat dari volume DR situs Utama. Entri titik pemasangan baru disediakan dalam output perintah.
Komentari titik pemasangan yang sudah ada yang berjalan di situs DR dengan karakter
#
:#172.18.20.241:/hana_data_h80_mnt00001_t020_vol /hana/data/H80/mnt00001 nfs rw,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0 #172.18.20.241:/hana_log_backups_h80_t020 /hana/logbackups/H80 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
Tambahkan baris berikut ke
/etc/fstab
ini harus merupakan output yang sama dari perintah
10.50.251.34:/hana_data_h80_mnt00001_t020_xdp /hana/data/H80/mnt00001 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0 10.50.251.36:/hana_log_backups_h80_t020_xdp01 /hana/log_backups/H80/01 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
Langkah 7: Pasang volume pemulihan
Jalankan perintah mount –a
untuk memasang semua titik pemasangan.
mount -a
Sekarang, jika Anda menjalankan df –h
, Anda akan melihat volume *_dp
yang dipasang.
df -h
Filesystem Size Used Avail Use% Mounted on
devtmpfs 378G 8.0K 378G 1% /dev
tmpfs 569G 0 569G 0% /dev/shm
tmpfs 378G 18M 378G 1% /run
tmpfs 378G 0 378G 0% /sys/fs/cgroup
/dev/mapper/3600a098038304445622b4b584c575a66-part2 47G 20G 28G 42% /
/dev/mapper/3600a098038304445622b4b584c575a66-part1 979M 57M 856M 7% /boot
172.18.20.241:/hana_log_h80_mnt00003_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00001_t020_vol 512G 5.5G 507G 2% /hana/log/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00003_t020_vol 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00002_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00002_t020_vol 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00001_t020_vol 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_shared_h80_t020_vol/usr_sap_node1 2.7T 11G 2.7T 1% /usr/sap/H80
tmpfs 76G 0 76G 0% /run/user/0
172.18.20.241:/hana_shared_h80_t020_vol 2.7T 11G 2.7T 1% /hana/shared
172.18.20.241:/hana_data_h80_mnt00001_t020_xdp 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00002_t020_xdp 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00003_t020_xdp 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_backups_h80_t020_xdp 512G 15G 498G 3% /hana/logbackups/H80_T250
Langkah 8: Pulihkan SYSTEMDB
Dari HANA Studio, klik kanan instans SYSTEMDB dan pilih "Pencadangan dan Pemulihan", lalu "Pulihkan Database Sistem"
Lihat panduan untuk memulihkan database dari rekam jepret, khususnya SYSTEMDB.
Langkah 9: Pulihkan database Penyewa
Dari HANA Studio, klik kanan instans SYSTEMDB dan pilih "Pencadangan dan Pemulihan", lalu "Pulihkan Database Penyewa".
Lihat panduan untuk memulihkan database dari rekam jepret, khususnya database TENANT.
Manjalankan azacsnap -c backup
di situs DR
Jika Anda menjalankan pencadangan berbasis rekam jepret di situs DR, Nama Server HANA yang dikonfigurasi dalam file konfigurasi azacsnap
di situs DR harus sama dengan nama server produksi.
Penting
Menjalankan azacsnap -c backup
dapat membuat rekam jepret penyimpanan di situs DR dan ini tidak otomatis direplikasi ke situs lain. Bekerja samalah dengan Operasi Microsoft untuk lebih memahami cara mengembalikan file atau data apa pun ke situs produksi aslinya.