Arsitektur pemulihan bencana VMware ke Azure - Dimodernisasi

Artikel ini menjelaskan arsitektur dan proses yang digunakan saat Anda menyebarkan replikasi pemulihan bencana, failover, dan pemulihan komputer virtual VMware (VM) antara situs VMware lokal dan Azure menggunakan pengalaman perlindungan komputer VMware/Fisik yang Dimodernisasi.

Catatan

Pastikan Anda membuat vault Layanan Pemulihan baru untuk menyiapkan appliance replikasi ASR. Jangan gunakan vault yang sudah ada.

Untuk informasi tentang arsitektur Azure Site Recovery dalam arsitektur Klasik, lihat artikel ini.

Komponen arsitektur

Tabel dan grafik berikut ini menyediakan tampilan tingkat tinggi dari komponen yang digunakan untuk pemulihan bencana VMware ke Azure.

VMware to Azure architecture

Komponen Persyaratan Rincian
Azure Langganan Azure, akun Azure Storage untuk cache, Disk Terkelola, dan jaringan Azure. Data yang direplikasi dari komputer virtual lokal disimpan di penyimpanan Azure. Azure VM dibuat dengan data yang direplikasi saat Anda menjalankan failover dari lokal ke Azure. Azure VM tersambung ke jaringan virtual Azure saat dibuat.
Appliance replikasi Azure Site Recovery Ini adalah blok bangunan dasar dari seluruh infrastruktur lokal Azure Site Recovery.

Semua komponen dalam appliance berkoordinasi dengan appliance replikasi. Layanan ini mengawasi semua kegiatan Site Recovery end-to-end termasuk memantau kesehatan mesin yang dilindungi, replikasi data, pembaruan otomatis, dll.
Appliance ini menghosting berbagai komponen penting seperti:

Server proksi: Komponen ini bertindak sebagai saluran proksi antara agen mobilitas dan layanan Site Recovery di cloud. Ini memastikan tidak ada konektivitas internet lain yang diperlukan dari beban kerja produksi untuk menghasilkan titik pemulihan.

Item yang ditemukan: Komponen ini mengumpulkan informasi vCenter Server dan berkoordinasi dengan layanan manajemen Azure Site Recovery di cloud.

Server perlindungan ulang: Komponen ini berkoordinasi antara Azure dan mesin lokal selama operasi reprotect dan failback.

Server proses: Komponen ini digunakan untuk penembolokan, pemadatan data sebelum dikirim ke Azure.

Pelajari selengkapnya tentang appliance replikasi dan cara menggunakan beberapa appliance replikasi.

Agen Layanan Pemulihan: Komponen ini digunakan untuk mengonfigurasi/mendaftar dengan layanan Site Recovery, dan untuk memantau kesehatan semua komponen.

Penyedia Site Recovery: Komponen ini digunakan untuk memfasilitasi perlindungan ulang. Ini mengidentifikasi antara lokasi alternatif proteksi ulang dan lokasi asli proteksi ulang untuk komputer sumber.

Layanan replikasi: Komponen ini digunakan untuk mereplikasi data dari lokasi sumber ke Azure.
Server VMware Komputer virtual VMware di-hosting di server vSphere ESXi lokal. Kami sarankan Anda menggunakan server vCenter untuk mengelola host. Selama penyebaran Site Recovery, Anda menambahkan server VMware ke brankas Layanan Pemulihan.
Komputer yang direplikasi Layanan Mobilitas diinstal pada setiap komputer virtual VMware yang Anda replikasi. Kami menyarankan Anda mengizinkan instalasi otomatis Layanan Mobilitas. Atau, Anda dapat menginstal layanan secara manual.

Siapkan konektivitas jaringan keluar

Agar Site Recovery berfungsi seperti yang diharapkan, Anda perlu mengubah konektivitas jaringan keluar untuk memungkinkan replikasi lingkungan Anda.

Catatan

Site Recovery tidak mendukung penggunaan autentikasi proksi untuk mengontrol konektivitas jaringan.

Konektivitas keluar untuk URL

Jika Anda menggunakan proksi firewall berbasis URL untuk mengontrol konektivitas keluar, izinkan akses ke URL ini:

URL Rincian
portal.azure.com Buka portal Microsoft Azure.
*.windows.net
*.msftauth.net
*.msauth.net
*.microsoft.com
*.live.com
*.office.com
Untuk masuk ke langganan Azure Anda.
*.microsoftonline.com Buat aplikasi Microsoft Entra untuk appliance untuk berkomunikasi dengan Azure Site Recovery.
management.azure.com Buat aplikasi Microsoft Entra untuk appliance untuk berkomunikasi dengan layanan Azure Site Recovery.
*.services.visualstudio.com Menggunggah log aplikasi yang digunakan untuk pemantauan internal.
*.vault.azure.net Kelola rahasia di Azure Key Vault. Catatan: Pastikan bahwa komputer yang akan direplikasi memiliki akses ke ini.
aka.ms Izinkan akses ke tautan "juga dikenal sebagai". Digunakan untuk pembaruan appliance Azure Site Recovery.
download.microsoft.com/download Mengizinkan pengunduhan dari unduhan Microsoft.
*.servicebus.windows.net Komunikasi antara peralatan dan layanan Azure Site Recovery.
*.discoverysrv.windowsazure.com Menghubungkan ke URL layanan penemuan Azure Site Recovery.
*.hypervrecoverymanager.windowsazure.com Sambungkan ke URL layanan mikro Azure Site Recovery.
*.blob.core.windows.net Unggah data ke penyimpanan Azure, yang digunakan untuk membuat disk target.
*.backup.windowsazure.com URL layanan perlindungan – layanan mikro yang digunakan oleh Azure Site Recovery untuk memproses & membuat disk yang direplikasi di Azure.
*.prod.migration.windowsazure.com Untuk menemukan properti lokal Anda.

Proses replikasi

  1. Saat Anda mengaktifkan replikasi untuk komputer virtual, replikasi awal ke penyimpanan Azure dimulai, menggunakan kebijakan replikasi yang ditentukan. Berikut hal-hal yang perlu diketahui:

    • Untuk komputer virtual VMware, replikasi dilakukan di tingkat blok, hampir berkelanjutan, menggunakan agen servis Mobilitas yang berjalan pada komputer virtual.
    • Pengaturan kebijakan replikasi apa pun diterapkan:
      • Ambang RPO. Pengaturan ini tidak memengaruhi replikasi. Pengaturan ini membantu dengan pemantauan. Peristiwa dimunculkan, dan email dikirim secara opsional, jika RPO saat ini melebihi batas ambang yang Anda tentukan.
      • Retensi titik pemulihan. Pengaturan ini menentukan seberapa jauh waktu yang Anda inginkan ketika terjadi gangguan. Retensi maksimum adalah 15 hari.
      • Rekam jepret yang konsisten dengan aplikasi. Rekam jepret yang konsisten dengan aplikasi dapat diambil setiap 1 hingga 12 jam, tergantung pada kebutuhan aplikasi Anda. Rekam jepret adalah rekam jepret blob Azure standar. Agen Mobilitas yang berjalan pada komputer virtual meminta rekam jepret VSS sesuai dengan pengaturan ini, dan memberi marka buku pada titik waktu itu sebagai titik konsisten aplikasi dalam aliran replikasi.

      Catatan

      Periode retensi titik pemulihan yang tinggi mungkin berimplikasi pada biaya penyimpanan karena lebih banyak titik pemulihan yang mungkin perlu disimpan.

  2. Lalu lintas mereplikasi ke titik akhir umum penyimpanan Azure melalui internet. Atau, Anda dapat menggunakan Azure ExpressRoute dengan serekan Microsoft. Mereplikasi lalu lintas melalui jaringan privat virtual (VPN) situs-ke-situs dari situs lokal ke Azure hanya didukung saat menggunakan titik akhir privat.

  3. Operasi replikasi awal memastikan bahwa seluruh data pada komputer pada saat replikasi diaktifkan dikirim ke Azure. Setelah replikasi awal selesai, replikasi perubahan delta ke Azure dimulai. Perubahan terlacak untuk komputer dikirim ke server proses.

  4. Komunikasi terjadi sebagai berikut:

    • VM berkomunikasi dengan appliance replikasi pada port HTTPS 443 inbound, untuk manajemen replikasi.
    • VM mengirim data replikasi ke appliance pada port HTTPS 9443 masuk. Port ini bisa diubah.
    • Appliance menerima data replikasi, mengoptimalkan, dan mengenkripsinya, dan mengirimkannya ke penyimpanan Azure melalui port 443 keluar.
  5. Log data replikasi masuk terlebih dahulu di akun penyimpanan cache di Azure. Log ini diproses, dan data disimpan di Azure Managed Disk (disebut asrseeddisk). Titik pemulihan dibuat pada disk ini.

VMware to Azure data flow with ports

Proses sinkronisasi ulang

  1. Kadang-kadang, selama replikasi awal atau saat mentransfer perubahan delta, masalah konektivitas jaringan antara komputer sumber ke server proses atau antara server proses ke Azure bisa terjadi. Salah satu dari kemungkinan tersebut dapat menyebabkan kegagalan dalam transfer data ke Azure sesaat.
  2. Untuk menghindari masalah integritas data, dan meminimalkan biaya transfer data, Site Recovery menandai komputer untuk sinkronisasi ulang.
  3. Komputer juga dapat ditandai untuk sinkronisasi ulang dalam situasi seperti berikut ini untuk mempertahankan konsistensi antara komputer sumber dan data yang disimpan di Azure
    • Jika mesin mengalami pematian paksa
    • Jika komputer mengalami perubahan konfigurasi seperti pengubahan ukuran disk (mengubah ukuran disk dari 2 TB menjadi 4 TB)
  4. Sinkronisasi ulang hanya mengirim data delta ke Azure. Transfer data antara server lokal dan Azure dilakukan dengan diminimalkan dengan menghitung checksum antara komputer sumber dan data yang disimpan di Azure.
  5. Secara default, sinkronisasi ulang dijadwalkan untuk berjalan secara otomatis di luar jam kantor. Jika Anda tidak ingin menunggu sinkronisasi ulang default di luar jam kerja, Anda dapat menjalankan sinkronisasi ulang komputer virtual secara manual. Untuk melakukan hal ini, masuk ke portal Microsoft Azure, pilih mesin virtual >Sinkronisasi ulang.
  6. Jika sinkronisasi ulang default gagal di luar jam kantor dan intervensi manual diperlukan, kesalahan akan dihasilkan pada komputer tertentu di portal Microsoft Azure. Anda dapat mengatasi kesalahan itu dan memicu sinkronisasi ulang secara manual.
  7. Setelah menyelesaikan sinkronisasi ulang, replikasi perubahan delta akan dilanjutkan.

Kebijakan replikasi

Saat Anda mengaktifkan replikasi komputer virtual Azure, Site Recovery membuat kebijakan replikasi baru secara default dengan pengaturan default yang diringkas dalam tabel.

Pengaturan kebijakan Rincian Default
Retensi titik pemulihan Menentukan berapa lama Azure Site Recovery mempertahankan titik pemulihan 1 hari
Frekuensi rekam jepret yang konsisten dengan aplikasi Seberapa sering Site Recovery mengambil rekam jepret yang konsisten dengan aplikasi Nonaktif

Mengelola kebijakan replikasi

Anda dapat mengelola dan mengubah pengaturan kebijakan replikasi default sebagai berikut:

  • Anda dapat mengubah pengaturan saat mengaktifkan replikasi.
  • Anda dapat membuat atau mengedit kebijakan replikasi baru saat mencoba mengaktifkan replikasi.

Konsistensi multi-VM

Jika Anda ingin VM direplikasi bersama dan telah berbagi titik pemulihan yang konsisten dengan crash dan konsisten dengan aplikasi saat failover, Anda dapat mengumpulkannya bersama-sama ke dalam grup replikasi. Konsistensi multi-VM berdampak pada performa beban kerja dan hanya boleh digunakan untuk beban kerja VM 4 yang membutuhkan konsistensi di semua komputer.

Rekam jepret dan titik pemulihan

Titik pemulihan dibuat dari rekam jepret disk komputer virtual yang diambil pada titik waktu tertentu. Ketika Anda menjalankan failover pada komputer virtual, Anda menggunakan titik pemulihan untuk memulihkan komputer virtual di lokasi target.

Ketika menjalankan failover, secara umum kami ingin memastikan bahwa komputer virtual dimulai tanpa kerusakan atau kehilangan data, dan data komputer virtual konsisten untuk sistem operasi, dan untuk aplikasi yang berjalan di komputer virtual. Ini tergantung pada jenis rekam jepret yang diambil.

Azure Site Recovery mengambil rekam jepret sebagai berikut:

  1. Azure Site Recovery mengambil rekam jepret data yang konsisten dengan crash secara default, dan rekam jepret yang konsisten dengan aplikasi jika Anda menentukan frekuensi untuknya.
  2. Titik pemulihan dibuat dari rekam jepret dan disimpan sesuai dengan pengaturan retensi dalam kebijakan replikasi.

Konsistensi

Tabel berikut ini menjelaskan berbagai jenis konsistensi.

Konsisten dengan crash

Keterangan Rincian Rekomendasi
Rekam jepret yang konsisten dengan crash menangkap data yang ada di disk saat rekam jepret diambil. Rekam jepret ini tidak termasuk apa pun dalam memori.

Rekam jepret ini berisi data yang setara dengan data pada disk yang akan ada jika komputer virtual mengalami crash atau kabel daya ditarik dari server pada saat rekam jepret diambil.

Konsisten dengan crash tidak menjamin konsistensi data untuk sistem operasi, atau untuk aplikasi di komputer virtual.
Azure Site Recovery membuat titik pemulihan yang konsisten dengan crash setiap lima menit secara default. Pengaturan ini tidak bisa diubah.

Saat ini, sebagian besar aplikasi dapat pulih dengan baik dari titik yang konsisten dengan crash.

Titik pemulihan yang konsisten dengan crash biasanya cukup untuk replikasi sistem operasi, dan aplikasi seperti server DHCP dan server cetak.

Konsisten dengan aplikasi

Keterangan Rincian Rekomendasi
Titik pemulihan yang konsisten dengan aplikasi dibuat dari rekam jepret yang konsisten dengan aplikasi.

Rekam jepret yang konsisten dengan aplikasi berisi semua informasi dalam rekam jepret yang konsisten dengan crash, ditambah semua data dalam memori dan transaksi yang sedang berlangsung.
Rekam jepret yang konsisten dengan aplikasi menggunakan Layanan Menyalin Bayangan Volume (VSS):

1) Azure Site Recovery menggunakan metode pencadangan Hanya Salin (VSS_BT_COPY), yang tidak mengubah waktu pencadangan log transaksi Microsoft SQL dan urutan nomor

2) Saat rekam jepret dimulai, VSS melakukan operasi copy-on-write (COW) pada volume.

3) Sebelum melakukan COW, VSS memberi tahu setiap aplikasi pada komputer bahwa perlu melakukan flush data residen RAM ke disk.

4) VSS kemudian mengizinkan aplikasi cadangan/pemulihan bencana (dalam kasus ini Site Recovery) untuk membaca data rekam jepret dan melanjutkan proses berikutnya.
Rekam jepret yang konsisten dengan aplikasi diambil sesuai dengan frekuensi yang Anda tentukan. Frekuensi ini harus selalu kurang dari yang Anda tetapkan untuk mempertahankan titik pemulihan. Misalnya, jika Anda mempertahankan titik pemulihan menggunakan pengaturan default 24 jam, Anda harus mengatur frekuensi kurang dari 24 jam.

Rekam jepret yang konsisten dengan aplikasi lebih kompleks dan membutuhkan waktu lebih lama untuk diselesaikan daripada rekam jepret yang konsisten dengan crash.

Rekam jepret ini memengaruhi performa aplikasi yang berjalan pada komputer virtual yang diaktifkan untuk replikasi.

Proses failover dan failback

Setelah replikasi disiapkan dan Anda menjalankan latihan pemulihan bencana (uji failover) untuk memeriksa bahwa semuanya berfungsi seperti yang diharapkan, Anda dapat menjalankan failover, dan failback sesuai kebutuhan Anda.

  1. Anda menjalankan failover untuk satu komputer, atau membuat rencana pemulihan untuk menjalankan failover pada beberapa komputer virtual secara bersamaan. Keuntungan dari rencana pemulihan daripada failover komputer tunggal termasuk:

    • Anda dapat membuat model ketergantungan aplikasi dengan menyertakan semua komputer virtual di seluruh aplikasi dalam satu rencana pemulihan.
    • Anda dapat menambahkan skrip, runbook Azure, dan menjeda tindakan manual.
  2. Setelah memicu failover awal, Anda menerapkannya untuk mulai mengakses beban kerja dari komputer virtual Azure.

  3. Ketika situs primer lokal Anda tersedia lagi, Anda dapat bersiap untuk menjalankan failback. Jika Anda perlu melakukan failback volume lalu lintas yang besar, siapkan appliance replikasi Azure Site Recovery baru.

    • Tahap 1: Proteksi ulang Azure VM sehingga mereka mereplikasi dari Azure kembali ke VMware VM lokal.
    • Tahap 2: Jalankan failover ke situs lokal.
    • Tahap 3: Setelah melakukan failback pada beban kerja, Anda dapat mengaktifkan kembali replikasi untuk komputer virtual lokal.

Langkah berikutnya

Ikuti tutorial ini untuk mengaktifkan replikasi VMware ke Azure.