Bagikan melalui


Keandalan di Komputer Virtual

Artikel ini berisi informasi terperinci tentang ketahanan regional VM dengan zona ketersediaan dan pemulihan bencana lintas wilayah dan kelangsungan bisnis.

Dukungan zona ketersediaan

Zona ketersediaan Azure adalah setidaknya tiga grup pusat data yang terpisah secara fisik dalam setiap wilayah Azure. Pusat data dalam setiap zona dilengkapi dengan infrastruktur daya, pendinginan, dan jaringan independen. Dalam kasus kegagalan zona lokal, zona ketersediaan dirancang sehingga jika satu zona terpengaruh, layanan regional, kapasitas, dan ketersediaan tinggi didukung oleh dua zona yang tersisa.

Kegagalan dapat berkisar dari kegagalan perangkat lunak dan perangkat keras hingga peristiwa seperti gempa bumi, banjir, dan kebakaran. Toleransi terhadap kegagalan dicapai dengan redundansi dan isolasi logis layanan Azure. Untuk informasi selengkapnya tentang zona ketersediaan di Azure, lihat Wilayah dan zona ketersediaan.

Layanan berkemampuan zona ketersediaan Azure dirancang untuk memberikan tingkat keandalan dan fleksibilitas yang tepat. Mereka dapat dikonfigurasi dalam dua cara. Mereka dapat berupa zona redundan,dengan replikasi otomatis di seluruh zona, atau zonal, dengan instans yang disematkan ke zona tertentu. Anda juga dapat menggabungkan pendekatan ini. Untuk informasi selengkapnya tentang arsitektur zonal vs. zona-redundan, lihat Rekomendasi untuk menggunakan zona dan wilayah ketersediaan.

Komputer virtual mendukung zona ketersediaan dengan tiga zona ketersediaan per wilayah Azure yang didukung dan juga zona redundan dan zonal. Untuk informasi selengkapnya, lihat dukungan zona ketersediaan. Pelanggan bertanggung jawab untuk mengonfigurasi dan memigrasikan komputer virtual mereka untuk ketersediaan.

Untuk mempelajari selengkapnya tentang opsi kesiapan zona ketersediaan, lihat:

Prasyarat

  • SKU komputer virtual Anda harus tersedia di seluruh zona untuk wilayah Anda. Untuk meninjau wilayah mana yang mendukung zona ketersediaan, lihat daftar wilayah yang didukung.

  • SKU VM Anda harus tersedia di seluruh zona di wilayah Anda. Untuk memeriksa ketersediaan SKU VM, gunakan salah satu metode berikut:

Peningkatan SLA

Karena zona ketersediaan secara fisik terpisah dan menyediakan sumber daya, jaringan, dan pendinginan yang berbeda, SLA (Perjanjian tingkat layanan) meningkat. Untuk informasi selengkapnya, lihat SLA untuk Komputer Virtual.

Membuat sumber daya dengan zona ketersediaan diaktifkan

Mulailah dengan membuat komputer virtual (VM) dengan zona ketersediaan diaktifkan dari opsi penyebaran berikut di bawah ini:

Dukungan failover zonal

Anda dapat menyiapkan komputer virtual untuk melakukan failover ke zona lain menggunakan layanan Site Recovery. Untuk informasi selengkapnya, lihat Site Recovery.

Toleransi kegagalan

Komputer virtual dapat melakukan failover ke server lain dalam kluster, dengan sistem operasi VM dimulai ulang di server baru. Anda harus merujuk ke proses failover untuk pemulihan bencana, mengumpulkan komputer virtual dalam perencanaan pemulihan, dan menjalankan latihan pemulihan bencana untuk memastikan solusi toleransi kesalahan mereka berhasil.

Untuk informasi selengkapnya, lihat proses pemulihan situs.

Pengalaman zona tidak berfungsi

Selama pemadaman di seluruh zona, Anda harus mengharapkan penurunan performa singkat sampai layanan komputer virtual menyeimbangkan kembali kapasitas yang mendasar untuk menyesuaikan dengan zona yang sehat. Penyembuhan mandiri tidak tergantung pada pemulihan zona; diharapkan bahwa status pemulihan mandiri layanan yang dikelola Microsoft mengkompensasi zona yang hilang, menggunakan kapasitas dari zona lain.

Anda juga harus mempersiapkan kemungkinan bahwa ada pemadaman di seluruh wilayah. Jika ada gangguan layanan untuk seluruh wilayah, salinan data Anda yang berlebihan secara lokal untuk sementara tidak akan tersedia. Jika replikasi geografis diaktifkan, tiga salinan lain dari blob dan tabel Azure Storage Anda disimpan di wilayah yang berbeda. Ketika ada pemadaman regional lengkap atau bencana di mana wilayah utama tidak dapat dipulihkan, Azure memetakan ulang semua entri DNS ke wilayah yang direplikasi secara geografis.

Persiapan dan pemulihan pemadaman zona

Panduan berikut disediakan untuk komputer virtual Azure selama gangguan layanan di seluruh wilayah tempat aplikasi komputer virtual Azure Anda disebarkan:

Desain latensi rendah

Lintas Wilayah (wilayah sekunder), Langganan Silang (pratinjau), dan Lintas Zona (pratinjau) tersedia opsi yang tersedia untuk dipertimbangkan saat merancang solusi komputer virtual latensi rendah. Untuk informasi selengkapnya tentang opsi ini, lihat metode pemulihan yang didukung.

Penting

Dengan memilih keluar dari penyebaran sadar zona, Anda meminta perlindungan dari isolasi kesalahan yang mendasar. Penggunaan SKU yang tidak mendukung zona ketersediaan atau menolak konfigurasi zona ketersediaan memaksa ketergantungan pada sumber daya yang tidak mematuhi penempatan dan pemisahan zona (termasuk dependensi yang mendasar dari sumber daya ini). Sumber daya ini seharusnya tidak diharapkan untuk bertahan dari skenario zona tidak berfungsi. Solusi yang memanfaatkan sumber daya tersebut harus menentukan strategi pemulihan bencana dan mengonfigurasi pemulihan solusi di wilayah lain.

Teknik penyebaran yang aman

Saat Anda memilih isolasi zona ketersediaan, Anda harus menggunakan teknik penyebaran yang aman untuk kode aplikasi dan peningkatan aplikasi. Selain mengonfigurasi Azure Site Recovery, dan terapkan salah satu teknik penyebaran aman berikut untuk VM:

Karena Microsoft secara berkala melakukan pembaruan pemeliharaan terencana, mungkin ada instans yang jarang terjadi ketika pembaruan ini memerlukan boot ulang komputer virtual Anda untuk menerapkan pembaruan yang diperlukan ke infrastruktur yang mendasar. Untuk mempelajari lebih lanjut, lihat pertimbangan ketersediaan selama pemeliharaan terjadwal.

Sebelum memutakhirkan kumpulan simpul berikutnya di zona lain, Anda harus melakukan tugas berikut:

Dukungan bermigrasi ke zona ketersediaan

Untuk mempelajari cara memigrasikan VM ke dukungan zona ketersediaan, lihat Memigrasikan Virtual Machines dan Virtual Machine Scale Sets ke dukungan zona ketersediaan.

Pemulihan bencana lintas wilayah dan kelangsungan bisnis

Pemulihan bencana (DR) adalah tentang pemulihan dari peristiwa berdampak tinggi, seperti bencana alam atau penyebaran gagal yang mengakibatkan waktu henti dan kehilangan data. Terlepas dari penyebabnya, obat terbaik untuk bencana adalah rencana DR yang terdefinisi dan teruji dengan baik dan desain aplikasi yang secara aktif mendukung DR. Sebelum Anda mulai berpikir tentang membuat rencana pemulihan bencana Anda, lihat Rekomendasi untuk merancang strategi pemulihan bencana.

Ketika datang ke DR, Microsoft menggunakan model tanggung jawab bersama. Dalam model tanggung jawab bersama, Microsoft memastikan bahwa infrastruktur dasar dan layanan platform tersedia. Pada saat yang sama, banyak layanan Azure tidak secara otomatis mereplikasi data atau mundur dari wilayah yang gagal untuk mereplikasi silang ke wilayah lain yang diaktifkan. Untuk layanan tersebut, Anda bertanggung jawab untuk menyiapkan rencana pemulihan bencana yang berfungsi untuk beban kerja Anda. Sebagian besar layanan yang berjalan pada penawaran platform as a service (PaaS) Azure menyediakan fitur dan panduan untuk mendukung DR dan Anda dapat menggunakan fitur khusus layanan untuk mendukung pemulihan cepat untuk membantu mengembangkan rencana DR Anda.

Anda dapat menggunakan pemulihan Lintas Wilayah untuk memulihkan Azure VM melalui wilayah yang dipasangkan. Dengan pemulihan Lintas Wilayah, Anda dapat memulihkan semua Azure VM untuk titik pemulihan yang dipilih jika pencadangan dilakukan di wilayah sekunder. Untuk informasi selengkapnya tentang pemulihan Lintas Wilayah, lihat entri baris tabel Lintas Wilayah di opsi pemulihan kami.

Pemulihan bencana dalam geografi multi-wilayah

Dalam kasus gangguan layanan di seluruh wilayah, Microsoft bekerja dengan rajin untuk memulihkan layanan komputer virtual. Namun, Anda masih harus mengandalkan strategi pencadangan khusus aplikasi lainnya untuk mencapai tingkat ketersediaan tertinggi. Untuk informasi selengkapnya, lihat bagian tentang Strategi data untuk pemulihan bencana.

Deteksi, pemberitahuan, dan manajemen pemadaman

Infrastruktur perangkat keras atau fisik untuk komputer virtual mungkin gagal secara tak terduga. Kegagalan tak terduga dapat mencakup kegagalan jaringan lokal, kegagalan disk lokal, atau kegagalan tingkat rak lainnya. Saat terdeteksi, platform Azure secara otomatis memigrasi (menyembuhkan) komputer virtual Anda ke komputer fisik yang sehat di pusat data yang sama. Selama prosedur penyembuhan, komputer virtual mengalami waktu henti (reboot) dan dalam beberapa kasus kehilangan drive sementara. OS dan disk data yang terpasang selalu disimpan.

Untuk informasi lebih rinci tentang gangguan layanan komputer virtual, lihat panduan pemulihan bencana.

Menyiapkan pemulihan bencana dan deteksi pemadaman

Saat menyiapkan pemulihan bencana untuk komputer virtual, pahami apa yang disediakan Azure Site Recovery. Aktifkan pemulihan bencana untuk komputer virtual dengan metode di bawah ini:

Pemulihan bencana dalam geografi wilayah tunggal

Dengan penyiapan pemulihan bencana, Azure VM terus mereplikasi ke wilayah target yang berbeda. Jika pemadaman terjadi, Anda bisa melakukan fail over VM ke wilayah sekunder, dan mengaksesnya dari sana.

Saat Anda mereplikasi VM Azure menggunakan Site Recovery, semua disk VM terus direplikasi ke wilayah target secara asinkronis. Titik pemulihan dibuat setiap beberapa menit, yang memberi Anda Tujuan Titik Pemulihan (RPO) dalam urutan menit. Anda dapat melakukan latihan pemulihan bencana sebanyak yang Anda inginkan, tanpa mempengaruhi aplikasi produksi atau replikasi yang sedang berlangsung. Untuk informasi selengkapnya, lihat Jalankan latihan pemulihan bencana ke Microsoft Azure.

Untuk informasi selengkapnya, lihat Komponen arsitektur azure VM dan pemasangan wilayah.

Kapasitas dan ketahanan pemulihan bencana proaktif

Microsoft dan pelanggannya beroperasi di bawah Model Tanggung Jawab Bersama. Tanggung jawab bersama berarti bahwa untuk DR yang mendukung pelanggan (layanan yang bertanggung jawab pelanggan), Anda harus menangani DR untuk layanan apa pun yang mereka sebarkan dan kontrol. Untuk memastikan bahwa pemulihan proaktif, Anda harus selalu melakukan pra-penyebaran sekunder karena tidak ada jaminan kapasitas pada saat dampak bagi mereka yang belum melakukan pra-alokasi.

Untuk menyebarkan komputer virtual, Anda dapat menggunakan mode orkestrasi fleksibel pada Virtual Machine Scale Sets. Semua ukuran VM dapat digunakan dengan mode orkestrasi fleksibel. Mode orkestrasi fleksibel juga menawarkan jaminan ketersediaan tinggi (hingga 1000 VM) dengan menyebarkan VM di seluruh domain kesalahan baik dalam suatu wilayah atau dalam zona ketersediaan.

Langkah berikutnya