Pemulihan masalah arsitektur Azure ke Azure

Artikel ini menjelaskan arsitektur, komponen, dan proses yang digunakan saat Anda menyebar pemulihan bencana untuk mesin virtual Azure (VM) menggunakan layanan Azure Site Recovery. Dengan penyiapan pemulihan bencana, Azure VM terus mereplikasi ke wilayah target yang berbeda. Jika pemadaman terjadi, Anda bisa melakukan fail over VM ke wilayah sekunder, dan mengaksesnya dari sana. Ketika semuanya berjalan normal lagi, Anda bisa melakukan fail back dan terus bekerja di lokasi utama.

Komponen arsitektur

Komponen yang terlibat dalam pemulihan bencana untuk Azure VMs diringkas dalam tabel berikut.

Komponen Persyaratan
Komputer virtual di wilayah sumber Salah satu Azure VM lainnya di wilayah sumber yang didukung.

VM bisa menjalankan sistem operasi yang didukung.
Penyimpanan sumber komputer virtual Azure VM dapat dikelola, atau memiliki disk yang tidak dikelola yang tersebar di akun penyimpanan.

Pelajari tentang penyimpanan Azure yang didukung.
Jaringan sumber komputer virtual VM dapat ditemukan di satu atau beberapa subnet dalam jaringan virtual (VNet) di wilayah sumber. Pelajari selengkapnya tentang persyaratan jaringan.
Akun penyimpanan cache Anda memerlukan akun penyimpanan cache di jaringan sumber. Selama replikasi, perubahan VM disimpan di cache sebelum dikirim ke penyimpanan target.

Menggunakan cache memastikan dampak minimal pada aplikasi produksi yang berjalan pada VM.

Pelajari selengkapnya tentang persyaratan penyimpanan cache.
Sumber daya target Sumber daya target digunakan selama replikasi, dan ketika terjadi failover. Azure Site Recovery bisa menyiapkan sumber daya target secara default, atau Anda bisa membuat/mengkustomisasinya.

Di wilayah target, periksa apakah Anda dapat membuat VM, dan langganan Anda memiliki sumber daya yang cukup untuk mendukung ukuran VM yang diperlukan di wilayah target.

Diagram menampilkan replikasi sumber dan target.

Sumber daya target

Saat Anda mengaktifkan replikasi untuk VM, Azure Site Recovery memberi Anda opsi untuk membuat sumber daya target secara otomatis.

Sumber daya target Pengaturan default
Target langganan Sama seperti langganan sumber.
Grup sumber daya target Grup sumber daya tempat VM berada setelah failover.

Ini bisa berada di wilayah Azure apa pun kecuali wilayah sumber.

Secara default, Azure Site Recovery membuat nama grup sumber daya baru di wilayah target dengan akhiran "asr".
Target VNet Jaringan virtual (VNet) tempat VM yang direplikasi berada setelah failover. Pemetaan jaringan dibuat antara jaringan virtual sumber dan target, dan sebaliknya.

Azure Site Recovery membuat VNet dan subnet baru, dengan akhiran "asr".
Akun penyimpanan target Jika komputer virtual tidak menggunakan disk terkelola, akun ini adalah akun penyimpanan tempat data direplikasi.

Azure Site Recovery membuat akun penyimpanan baru di wilayah target, untuk mencerminkan akun penyimpanan sumber.
Replika disk terkelola Jika VM menggunakan disk terkelola, ini adalah disk terkelola tempat data direplikasi.

Azure Site Recovery membuat replika disk yang dikelola di wilayah penyimpanan untuk mencerminkan sumbernya.
Set ketersediaan target Ketersediaan set di mana replikasi VM berada setelah failover.

Azure Site Recovery menciptakan set ketersediaan di wilayah target dengan akhiran "asr", untuk VM yang terletak di set ketersediaan yang ditetapkan di lokasi sumber. Jika tersedia set ketersediaan, kumpulan tersedia dan yang baru tidak dibuat.
Zona ketersediaan target Jika wilayah target mendukung zona ketersediaan, Site Recovery menetapkan nomor zona yang sama dengan yang digunakan di wilayah sumber.

Membuat sumber daya target

Anda dapat mengelola sumber daya target sebagai berikut:

  • Anda dapat mengubah pengaturan saat mengaktifkan replikasi. Perhatikan bahwa SKU default untuk VM wilayah target sama dengan SKU VM sumber (atau SKU terbaik berikutnya yang tersedia dibandingkan dengan SKU VM sumber). Daftar dropdown hanya menunjukkan SKU yang relevan dari keluarga yang sama dengan sumber VM (Gen 1 atau Gen 2).
  • Anda dapat mengubah setelan target setelah replikasi sudah berfungsi. Mirip dengan sumber daya lain seperti kelompok sumber daya target, nama target, dan lainnya, target wilayah VM SKU juga dapat diperbarui setelah replikasi sedang berlangsung. Sumber daya, yang tidak dapat diperbarui adalah jenis ketersediaan (instans tunggal, set, atau zona). Untuk mengubah setelan ini, Anda perlu menonaktifkan replikasi, mengubah setelan, lalu mengaktifkannya kembali.

Kebijakan replikasi

Jika Anda mengaktifkan replikasi mesin virtual Azure, Site Recovery akan secara default membuat kebijakan replikasi baru dengan setelan default yang diringkas dalam tabel.

Pengaturan kebijakan Rincian Default
Retensi titik pemulihan Menentukan durasi penyimpanan titik pemulihan di Azure Site Recovery. Satu hari
Frekuensi rekam jepret yang konsisten dengan aplikasi Seberapa sering Azure Site Recovery mengambil rekam jepret yang konsisten dengan aplikasi. Nol jam (Dinonaktifkan)

Mengelola kebijakan replikasi

Anda dapat mengelola dan mengubah setelan kebijakan replikasi default sebagai berikut:

  • Anda dapat mengubah pengaturan saat mengaktifkan replikasi.
  • Anda dapat membuat kebijakan replikasi kapan saja, lalu menerapkannya saat Anda mengaktifkan replikasi.

Catatan

Periode retensi titik pemulihan yang tinggi mungkin berimplikasi pada biaya penyimpanan karena lebih banyak titik pemulihan yang mungkin perlu disimpan.

Konsistensi multi-VM

Jika Anda ingin komputer virtual direplikasi bersama-sama, dan telah berbagi titik pemulihan yang konsisten dengan crash dan konsisten dengan aplikasi pada failover, Anda dapat mengumpulkannya bersama-sama ke dalam sebuah grup replikasi. Konsistensi multi-komputer virtual memengaruhi performa beban kerja, dan hanya boleh digunakan untuk komputer virtual yang menjalankan beban kerja yang membutuhkan konsistensi di semua komputer.

Snapshot dan titik pemulihan

Titik pemulihan dibuat dari rekam jepret disk komputer virtual yang diambil pada titik waktu tertentu. Ketika Anda menjalankan failover pada komputer virtual, Anda menggunakan titik pemulihan untuk memulihkan komputer virtual di lokasi target.

Ketika menjalankan failover, secara umum kami ingin memastikan bahwa komputer virtual dimulai tanpa kerusakan atau kehilangan data, dan data komputer virtual konsisten untuk sistem operasi, dan untuk aplikasi yang berjalan di komputer virtual. Ini tergantung pada jenis rekam jepret yang diambil.

Azure Site Recovery mengambil rekam jepret sebagai berikut:

  1. Azure Site Recovery mengambil rekam jepret data yang konsisten dengan crash secara default, dan rekam jepret yang konsisten dengan aplikasi jika Anda menentukan frekuensi untuknya.
  2. Titik pemulihan dibuat dari rekam jepret, dan disimpan sesuai dengan pengaturan retensi dalam kebijakan replikasi.

Konsistensi

Tabel berikut ini menjelaskan berbagai jenis konsistensi.

Konsisten dengan crash

Keterangan Rincian Rekomendasi
Rekam jepret yang konsisten dengan crash menangkap data yang ada di disk saat rekam jepret diambil. Rekam jepret ini tidak termasuk apa pun dalam memori.

Rekam jepret ini berisi data yang setara dengan data pada disk yang akan ada jika komputer virtual mengalami crash atau kabel daya ditarik dari server pada saat rekam jepret diambil.

Konsisten dengan crash tidak menjamin konsistensi data untuk sistem operasi, atau untuk aplikasi di komputer virtual.
Azure Site Recovery membuat titik pemulihan yang konsisten dengan crash setiap lima menit secara default. Pengaturan ini tidak bisa diubah.

Saat ini, sebagian besar aplikasi dapat pulih dengan baik dari titik yang konsisten dengan crash.

Titik pemulihan yang konsisten dengan crash cukup untuk replikasi sistem operasi, dan aplikasi seperti server DHCP dan server cetak.

Konsisten dengan aplikasi

Keterangan Rincian Rekomendasi
Titik pemulihan yang konsisten dengan aplikasi dibuat dari rekam jepret yang konsisten dengan aplikasi.

Rekam jepret yang konsisten dengan aplikasi berisi semua informasi dalam rekam jepret yang konsisten dengan crash, ditambah semua data dalam memori dan transaksi yang sedang berlangsung.
Rekam jepret yang konsisten dengan aplikasi menggunakan Layanan Menyalin Bayangan Volume (VSS):

1) Azure Site Recovery menggunakan metode pencadangan Hanya Salin (VSS_BT_COPY), yang tidak mengubah waktu pencadangan log transaksi Microsoft SQL dan urutan nomor

2) Saat rekam jepret dimulai, VSS melakukan operasi copy-on-write (COW) pada volume.

3) Sebelum melakukan COW, VSS memberi tahu setiap aplikasi pada komputer bahwa perlu melakukan flush data residen RAM ke disk.

4) VSS kemudian mengizinkan aplikasi cadangan/pemulihan bencana (dalam kasus ini Site Recovery) untuk membaca data rekam jepret dan melanjutkan proses berikutnya.
Rekam jepret yang konsisten dengan aplikasi diambil sesuai dengan frekuensi yang Anda tentukan. Frekuensi ini harus selalu kurang dari yang Anda tetapkan untuk mempertahankan titik pemulihan. Misalnya, jika Anda mempertahankan titik pemulihan menggunakan pengaturan default 24 jam, Anda harus mengatur frekuensi kurang dari 24 jam.

Rekam jepret yang konsisten dengan aplikasi lebih kompleks dan membutuhkan waktu lebih lama untuk diselesaikan daripada rekam jepret yang konsisten dengan crash.

Rekam jepret ini memengaruhi performa aplikasi yang berjalan pada komputer virtual yang diaktifkan untuk replikasi.

Proses replikasi

Saat Anda mengaktifkan replikasi untuk Azure VM, hal berikut ini terjadi:

  1. Ekstensi layanan Mobilitas Azure Site Recovery secara otomatis diinstal pada VM.
  2. Ekstensi tersebut mendaftarkan VM dengan Azure Site Recovery.
  3. Replikasi berkelanjutan dimulai untuk VM. Penulisan disk segera ditransfer ke akun penyimpanan cache di lokasi sumber.
  4. Site Recovery memproses data dalam cache, dan mengirimkannya ke akun penyimpanan target, atau ke replika disk terkelola.
  5. Setelah data diproses, titik pemulihan yang konsisten dengan crash dihasilkan setiap lima menit. Titik pemulihan yang konsisten dengan aplikasi dihasilkan sesuai dengan pengaturan yang ditentukan dalam kebijakan replikasi.

Diagram memperlihatkan proses replikasi, langkah 2.

Proses replikasi

Persyaratan konektivitas

Azure VM yang Anda replikasi memerlukan konektivitas keluar. Site Recovery tidak pernah memerlukan konektivitas masuk ke VM.

Konektivitas keluar (URL)

Jika akses keluar untuk VM dikontrol dengan URL, perbolehkan URL ini.

Nama Komersial Pemerintah Keterangan
Penyimpanan *.blob.core.windows.net *.blob.core.usgovcloudapi.net Memungkinkan data ditulis dari VM ke akun penyimpanan cache di wilayah sumber data.
Microsoft Entra ID login.microsoftonline.com login.microsoftonline.us Menyediakan otorisasi dan autentikasi ke URL layanan Site Recovery.
Replikasi *.hypervrecoverymanager.windowsazure.com *.hypervrecoverymanager.windowsazure.us Memungkinkan VM untuk berkomunikasi dengan layanan Site Recovery.
Service Bus *.servicebus.windows.net *.servicebus.usgovcloudapi.net Memungkinkan komputer virtual untuk menulis data pemantauan dan diagnostik Azure Site Recovery.
Key Vault *.vault.azure.net *.vault.usgovcloudapi.net Memungkinkan akses untuk mengaktifkan replikasi untuk komputer virtual berkemampuan ADE melalui portal
Otomatisasi Azure *.automation.ext.azure.com *.azure-automation.us Memungkinkan mengaktifkan autoupgrade agen mobilitas untuk item yang direplikasi melalui portal

Konektivitas keluar untuk rentang alamat IP

Untuk mengontrol konektivitas keluar untuk VM menggunakan alamat IP, perbolehkan alamat ini. Perhatikan bahwa detail persyaratan konektivitas jaringan dapat ditemukan di laporan resmi jaringan.

Aturan wilayah sumber

Aturan Rincian Tag layanan
Perbolehkan HTTPS keluar: port 443 Perbolehkan rentang yang sesuai dengan akun penyimpanan di wilayah sumber Storage.<region-name>
Perbolehkan HTTPS keluar: port 443 Perbolehkan rentang yang sesuai dengan ID Microsoft Entra AzureActiveDirectory
Perbolehkan HTTPS keluar: port 443 Perbolehkan rentang yang sesuai dengan Pusat Aktivitas di wilayah target. EventHub.<nama-wilayah>
Perbolehkan HTTPS keluar: port 443 Perbolehkan rentang yang terkait dengan Azure Site Recovery AzureSiteRecovery
Perbolehkan HTTPS keluar: port 443 Perbolehkan rentang yang sesuai dengan Azure Key Vault (Ini diperlukan hanya untuk mengaktifkan replikasi komputer virtual yang mendukung ADE melalui portal) AzureKeyVault
Perbolehkan HTTPS keluar: port 443 Perbolehkan rentang yang sesuai dengan Azure Automation Controller (Ini diperlukan hanya untuk mengaktifkan peningkatan otomatis agen mobilitas untuk item yang direplikasi melalui portal) GuestAndHybridManagement

Aturan wilayah target

Aturan Rincian Tag layanan
Perbolehkan HTTPS keluar: port 443 Perbolehkan rentang yang sesuai dengan akun penyimpanan di wilayah target Storage.<region-name>
Perbolehkan HTTPS keluar: port 443 Perbolehkan rentang yang sesuai dengan ID Microsoft Entra AzureActiveDirectory
Perbolehkan HTTPS keluar: port 443 Perbolehkan rentang yang sesuai dengan Pusat Aktivitas di wilayah sumber. EventHub.<nama-wilayah>
Perbolehkan HTTPS keluar: port 443 Perbolehkan rentang yang terkait dengan Azure Site Recovery AzureSiteRecovery
Perbolehkan HTTPS keluar: port 443 Perbolehkan rentang yang sesuai dengan Azure Key Vault (Ini diperlukan hanya untuk mengaktifkan replikasi komputer virtual yang mendukung ADE melalui portal) AzureKeyVault
Perbolehkan HTTPS keluar: port 443 Perbolehkan rentang yang sesuai dengan Azure Automation Controller (Ini diperlukan hanya untuk mengaktifkan peningkatan otomatis agen mobilitas untuk item yang direplikasi melalui portal) GuestAndHybridManagement

Mengontrol akses dengan aturan Kelompok Keamanan Jaringan

Jika Anda mengontrol konektivitas VM dengan memfilter lalu lintas jaringan ke dan dari jaringan/subnet Azure menggunakan aturan Kelompok Keamanan Jaringan, perhatikan persyaratan berikut:

  • Aturan Grup Keamanan Jaringan untuk wilayah Azure sumber harus mengizinkan akses keluar untuk lalu lintas replikasi.
  • Kami menyarankan Anda membuat aturan di lingkungan pengujian sebelum Anda memasukkannya ke dalam produksi.
  • Gunakan tag layanandaripada memperbolehkan alamat IP individual.
    • Tag layanan mewakili sekelompok awalan alamat IP berkumpul bersama untuk meminimalkan kompleksitas saat membuat aturan keamanan.
    • Microsoft secara otomatis memperbarui tag layanan dari waktu ke waktu.

Pelajari selengkapnya tentang konektivitas keluar untuk Site Recovery, dan mengontrol konektivitas dengan Kelompok Keamanan Jaringan.

Konektivitas untuk konsistensi multi-VM

Jika konsistensi multi-VM diaktifkan, komputer di grup replikasi berkomunikasi satu sama lain melalui port 20004.

  • Pastikan bahwa tidak ada appliance firewall yang memblokir komunikasi internal antara VM melalui port 20004.
  • Jika Anda ingin Linux VM menjadi bagian dari grup replikasi, pastikan lalu lintas keluar pada port 20004 dibuka secara manual sesuai dengan panduan untuk versi Linux tertentu.

Proses failover

Saat Anda memulai failover, VM dibuat di grup sumber daya target, jaringan virtual target, subnet target, dan di set ketersediaan target. Selama failover, Anda dapat menggunakan titik pemulihan apa pun.

Diagram menampilkan proses failover dengan lingkungan sumber dan target.

Langkah berikutnya