Failover dan failback menggunakan Azure Site Recovery
Azure Site Recovery memungkinkan organisasi Anda memiliki fleksibilitas, baik melakukan failover secara manual ke wilayah Azure sekunder atau gagal kembali ke VM sumber. Cara termudah untuk mengelola proses ini secara manual di portal Azure. Anda memang memiliki opsi lain untuk mengaktifkan otomatisasi jika perusahaan Anda ingin mengotomatiskan triggering failover. Opsi ini termasuk teknologi seperti pembuatan skrip melalui PowerShell atau menyiapkan runbook di Azure Automation untuk mengatur failover.
Ikuti langkah-langkah berikut untuk menjalankan failover penuh dari VM yang dilindungi ke wilayah sekunder di langganan Anda. Setelah failover selesai dengan baik, Anda akan mengembalikan VM pada tindakan sebelumnya.
Pada unit ini, Anda akan menjelajahi failover dan failback, mengetahui cara melindungi kembali VM yang gagal proses, dan memantau status perlindungan ulang.
Apa itu failover?
Failover terjadi saat Anda memutuskan untuk menjalankan rencana DR untuk organisasi. Lingkungan produksi yang ada, dilindungi oleh Pemulihan Situs, direplikasi ke wilayah lain. Lingkungan target menjadi lingkungan produksi de facto, dan menjadi lingkungan tempat layanan produksi organisasi Anda berjalan. Setelah wilayah target aktif, lingkungan sumber tidak boleh lagi digunakan. Anda akan menerapkan ketentuan ini dengan membiarkan VM sumber dihentikan.
Ada keuntungan lain untuk mematikan sumber VM. Menggunakan VM yang dimatikan menyebabkan Anda kehilangan beberapa data, karena untuk triggering failover, Site Recovery harus menunggu hingga semua data ditulis ke disk. Untuk menggunakan data ini dan memiliki RPO serendah mungkin, kami memilih titik pemulihan Terbaru (RPO terendah).
Apa itu perlindungan ulang, dan mengapa hal itu penting?
Ketika VM gagal, Site Recovery replikasi yang dilakukan tidak lagi aktif. Anda harus mengaktifkan kembali perlindungan agar dapat melindungi VM yang mengalami kegagalan. Karena Anda sudah memiliki infrastruktur di wilayah yang berbeda, Anda dapat memulai replikasi kembali ke wilayah sumber. Perlindungan ulang mengizinkan Site Recovery untuk mulai mereplikasi lingkungan target baru Anda agar kembali ke lingkungan sumber tempat dimulainya.
Anda dapat menggunakan fleksibilitas failover atas VM tunggal atau failover menggunakan rencana pemulihan untuk melindungi kembali infrastruktur Anda yang gagal. Anda dapat melindungi setiap VM satu per satu, atau Anda dapat melindungi ulang beberapa VM menggunakan rencana pemulihan.
Perlindungan ulang membutuhkan waktu antara 45 menit hingga 2 jam, tergantung pada ukuran dan jenis VM. Tidak seperti proses Site Recovery lainnya yang dapat Anda pantau dengan melihat kemajuan pekerjaan, Anda harus melihat kemajuan perlindungan ulang di tingkat VM. Persyaratan ini ada karena fase sinkronisasi tidak terdaftar sebagai tindakan pemulihan situs.
Gambar ini menunjukkan status item yang dilindungi, dengan persentase sinkronisasi yang disorot.
Apa itu failback?
Failback adalah kebalikan dari failover. Di sinilah failover lengkap ke wilayah sekunder telah dilakukan, dan sekarang menjadi lingkungan produksi. Perlindungan ulang telah selesai untuk lingkungan yang gagal, dan lingkungan sumber sekarang menjadi replikanya. Dalam skenario failback, Pemulihan Situs akan gagal kembali ke VM sumber.
Proses untuk menyelesaikan failback sama dengan failover, bahkan sama-sama menggunakan rencana pemulihan kembali. Memilih failover pada rencana pemulihan Anda dari disetel ke wilayah target, dan untuk disetel ke wilayah sumber.
Kelola failover
Site Recovery dapat menjalankan failover sesuai permintaan. Uji failover diisolasi, artinya tidak memengaruhi layanan produksi. Fleksibilitas ini memungkinkan Anda menjalankan failover tanpa mengganggu pengguna sistem tersebut. Fleksibilitas juga berfungsi dengan cara lain, memungkinkan failback sesuai permintaan baik sebagai bagian dari pengujian yang direncanakan atau sebagai bagian dari proses DR yang sepenuhnya dipanggil.
Rencana pemulihan di Site Recovery juga memungkinkan Anda menyesuaikan dan mengurutkan failover dan failback. Paket ini memungkinkan Anda mengelompokkan komputer dan beban kerja.
Fleksibilitas juga dapat diterapkan dengan cara triggering failover. Kegagalan manual mudah dilakukan melalui portal Azure. Skrip PowerShell atau menggunakan runbook di Azure Automation juga menyediakan opsi otomatisasi.
Perbaiki masalah dengan failover
Meskipun Site Recovery berjalan otomatis, kesalahan masih dapat terjadi. Daftar berikut menunjukkan tiga masalah paling umum yang diamati. Untuk daftar lengkap masalah dan cara memecahkannya, lihat tautan pada unit Ringkasan.
Masalah kuota sumber daya Azure
Site Recovery harus membuat sumber daya di berbagai wilayah. Jika langganan kami tidak dapat melakukan ini, replikasi gagal. Kesalahan ini juga terjadi jika pelanggan tidak memiliki batas kuota yang tepat untuk membuat VM yang sesuai dengan ukuran VM sumber.
Anda dapat memperbaiki ini dengan menghubungi dukungan penagihan Azure dan meminta mereka membuat VM ukuran yang benar di wilayah target yang diperlukan.
Satu atau lebih disk tersedia untuk perlindungan
Kesalahan ini terjadi jika Anda telah selesai menyiapkan Set Recovery untuk VM Anda. Selanjutnya, Anda telah menambahkan atau menginisialisasi, disk tambahan.
Untuk memperbaiki kesalahan ini, Anda dapat menambahkan replikasi untuk disk yang baru ditambahkan, atau Anda dapat memilih untuk mengabaikan peringatan disk.
Sertifikat akar tepercaya
Periksa apakah sertifikat akar terbaru dipasang agar Site Recovery memungkinkan berkomunikasi dan mengautentikasi VM untuk replikasi dengan aman. Anda dapat melihat kesalahan ini jika VM tidak mwnjalankan pembaruan. Sebelum Site Recovery dapat mengaktifkan replikasi, Anda harus memperbarui VM Windows dan Linux.
Koreksi berbeda untuk setiap sistem operasi. Windows sesederhana memastikan pembaruan Windows otomatis diaktifkan dan pembaruan diterapkan. Anda harus mengikuti panduan yang diberikan oleh distributor ketika distribusi Linux.