Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Azure VMware Solution menyediakan cloud privat yang berisi kluster VMware vSphere yang dibangun dari infrastruktur Azure bare-metal khusus. Anda dapat memigrasikan beban kerja dari lingkungan lokal Anda, menyebarkan komputer virtual (VM) baru, dan menggunakan layanan Azure dari cloud privat Anda. Anda dapat menggunakan kombinasi kemampuan VMware dan Azure-native untuk memungkinkan ketersediaan tinggi dan ketahanan beban kerja Anda.
Saat Anda menggunakan Azure, keandalan adalah tanggung jawab bersama. Microsoft menyediakan berbagai kemampuan untuk mendukung ketahanan dan pemulihan. Anda bertanggung jawab untuk memahami cara kerja kemampuan tersebut dalam semua layanan yang Anda gunakan, dan memilih kemampuan yang Anda butuhkan untuk memenuhi tujuan bisnis dan tujuan waktu aktif Anda.
Artikel ini menjelaskan cara membuat Azure VMware Solution tahan terhadap potensi pemadaman dan masalah, termasuk kesalahan sementara, pemadaman zona ketersediaan, dan pemadaman wilayah. Ini juga menjelaskan bagaimana Anda dapat menggunakan cadangan untuk memulihkan dari jenis masalah lain, dan menyoroti beberapa informasi utama tentang perjanjian tingkat layanan (SLA) Azure VMware Solution.
Rekomendasi penyebaran produksi
Penyebaran Azure VMware Solution memerlukan perencanaan yang cermat di berbagai area dan sering memerlukan beberapa layanan Azure. Untuk panduan terperinci, lihat Beban kerja Azure VMware Solution di Well-Architected Framework.
Gambaran umum arsitektur keandalan
Azure VMware Solution menggunakan infrastruktur hiperkonvergensi dengan kluster VMware vSphere.
Saat Anda menyebarkan Azure VMware Solution, Anda menyebarkan cloud privat, yang memiliki satu atau beberapa kluster. Setiap kluster berisi host ESXi yang menyediakan komputasi, penyimpanan melalui vSAN, dan jaringan melalui VMware NSX. Ada dua generasi Azure VMware Solution:
- Gen 1 menggunakan perangkat keras bare-metal khusus untuk simpul dan menggunakan pendekatan jaringan yang berdedikasi. Untuk informasi selengkapnya tentang konsep utama, lihat Konsep cloud dan kluster privat Azure VMware Solution.
- Gen 2 menggunakan jenis komputer virtual Azure standar dan jaringan virtual Azure. Arsitektur ini menyederhanakan arsitektur jaringan, meningkatkan kecepatan transfer data, mengurangi latensi untuk beban kerja, dan meningkatkan performa saat mengakses layanan Azure lainnya.
Toleransi kesalahan
Azure VMware Solution menyediakan beberapa mekanisme untuk menangani kesalahan di tingkat infrastruktur dan aplikasi:
Ketersediaan Tinggi vSphere (HA): vSphere HA memantau host dan VM ESXi. Jika host gagal, sistem secara otomatis memulai ulang VM yang terpengaruh pada host yang sehat. vSphere HA diaktifkan secara default dan mencadangkan kapasitas komputasi dan memori untuk kegagalan simpul tunggal.
Toleransi kesalahan vSAN: Kebijakan penyimpanan vSAN melindungi dari kesalahan sementara tingkat penyimpanan dengan mempertahankan beberapa salinan data di seluruh host. Jika jalur penyimpanan atau disk mengalami masalah sementara, vSAN secara otomatis menangani failover ke jalur penyimpanan yang sehat.
Redundansi jaringan: Azure VMware Solution menyediakan jalur jaringan redundan dan beberapa adaptor jaringan VMkernel untuk menangani kesalahan sementara tingkat jaringan.
Ketahanan terhadap kesalahan sementara
Kesalahan sementara adalah kegagalan yang bersifat sementara dan intermiten dalam komponen. Mereka sering terjadi di lingkungan terdistribusi seperti cloud, dan mereka adalah bagian normal dari operasi. Kesalahan sementara memperbaiki diri setelah waktu yang singkat. Penting bahwa aplikasi Anda dapat menangani kesalahan sementara, biasanya dengan mencoba kembali permintaan yang terpengaruh.
Semua aplikasi yang dihosting cloud harus mengikuti panduan penanganan kesalahan sementara Azure saat berkomunikasi dengan API, database, dan komponen lain yang dihosting cloud. Untuk informasi selengkapnya, lihat Rekomendasi untuk menangani kesalahan sementara.
Untuk aplikasi yang berjalan di VM Azure VMware Solution, terapkan praktik penanganan kesalahan sementara standar:
- Mengonfigurasi kebijakan pengulangan yang sesuai dengan backoff eksponensial
- Menggunakan pola pemutus sirkuit untuk panggilan layanan eksternal
- Memantau kesehatan aplikasi dan menerapkan degradasi yang anggun
- Merancang aplikasi tanpa status jika memungkinkan untuk mengurangi dampak pengulangan restart VM.
Ketahanan terhadap kegagalan zona ketersediaan
Zona ketersediaan adalah grup pusat data yang terpisah secara fisik dalam wilayah Azure. Ketika satu zona gagal, layanan dapat melakukan failover ke salah satu zona yang tersisa.
Azure VMware Solution Gen 1 mendukung zona ketersediaan melalui kluster yang direntangkan, yang mendistribusikan host ESXi di dua zona ketersediaan dalam suatu wilayah. Microsoft memilih zona yang akan digunakan. Kluster Anda berjalan dalam konfigurasi aktif-aktif di dua zona, dan vSAN juga mencakup beberapa zona. Anda dapat menunjuk apakah setiap beban kerja disebarkan ke satu atau dua zona.
Simpul saksi secara otomatis disebarkan ke zona ketersediaan ketiga untuk menyediakan kuorum untuk skenario split-brain. Microsoft mengelola simpul saksi secara otomatis.
Kluster standar adalah yang tidak disebarkan di seluruh zona. Dalam kluster standar, kluster dan semua host ESXi-nya dianggap nonzonal atau regional. Kluster nonzonal mungkin ditempatkan di zona ketersediaan apa pun di wilayah tersebut dan Microsoft memilih zona tersebut. Jika zona ketersediaan di wilayah tersebut mengalami pemadaman, kluster dan host nonzonal mungkin berada di zona yang terpengaruh dan dapat mengalami waktu henti.
Azure VMware Solution Gen 2 mendukung penyebaran zona cloud privat. Saat Anda mengonfigurasi cloud privat zona, setiap klusternya dan semua host ESXi mereka disebarkan ke dalam satu zona ketersediaan yang Anda pilih.
Cloud privat zona tidak melindungi dari kegagalan zona ketersediaan. Anda dapat menyebarkan beberapa cloud privat ke zona ketersediaan terpisah untuk ketahanan yang lebih tinggi, tetapi Anda bertanggung jawab untuk menyebarkan dan mengonfigurasi setiap cloud privat secara independen.
Jika Anda tidak memilih zona ketersediaan, cloud privat Anda, klusternya, dan semua host ESXi mereka dianggap nonzonal atau regional. Kluster nonzonal mungkin ditempatkan di zona ketersediaan apa pun di wilayah tersebut dan Microsoft memilih zona tersebut. Jika zona ketersediaan di wilayah tersebut mengalami pemadaman, kluster nonzonal mungkin berada di zona yang terpengaruh dan dapat mengalami waktu henti.
Untuk melihat informasi tentang dukungan zona ketersediaan untuk generasi lainnya, pilih generasi yang sesuai di awal halaman ini.
Persyaratan
Dukungan wilayah: Kluster yang direntangkan tersedia di wilayah Azure tertentu yang mendukung konfigurasi kluster yang direntangkan. Periksa tabel pemetaan zona ketersediaan wilayah Azure ke jenis host untuk dukungan wilayah saat ini.
Host minimum: Sebarkan minimal enam host di dua zona ketersediaan (tiga host per zona) untuk mengaktifkan konfigurasi kluster yang direntangkan. Ketika Anda menambah atau mengurangi skala, Anda harus melakukannya dalam pasangan sehingga jumlah host sama di setiap zona.
SKU Tuan Rumah: Kluster yang diperluas didukung dengan jenis host AV36, AV36P, dan AV52. SKU AV64 tidak didukung dengan kluster yang direntangkan.
Dukungan wilayah: Anda dapat menyebarkan cloud privat zona di wilayah yang mendukung Azure VMware Solution Gen 2 dan juga mendukung zona ketersediaan.
Pertimbangan
Setiap zona ketersediaan di suatu wilayah dapat mendukung jenis host tertentu. Untuk daftar terperinci jenis host yang tersedia di setiap zona, lihat Tabel pemetaan jenis host ke zona ketersediaan di wilayah Azure.
Biaya
Anda dikenakan biaya untuk setiap simpul dalam kluster, terlepas dari konfigurasi zona ketersediaan kluster. Untuk informasi harga terperinci, lihat Harga Azure VMware Solution.
Mengonfigurasi dukungan zona ketersediaan
Sebarkan kluster baru: Saat membuat private cloud Azure VMware Solution baru di wilayah yang didukung, Anda dapat mengonfigurasinya sebagai kluster direntangkan saat penyebaran. Konfigurasi ini mendistribusikan host di dua zona ketersediaan secara otomatis. Untuk informasi lebih lanjut, lihat Menyebarkan kluster vSAN yang direntangkan.
Kluster yang ada: Anda tidak dapat mengonversi kluster standar ke kluster yang direntangkan, anda juga tidak dapat mengonversi kluster yang direntangkan ke kluster standar. Sebagai gantinya, Anda perlu menyebarkan kluster baru dan memigrasikan beban kerja Anda.
Sebarkan kluster baru: Saat Anda membuat cloud privat Azure VMware Solution baru di wilayah yang didukung, Anda dapat memilih zona ketersediaannya.
Kluster yang ada: Anda tidak dapat mengubah konfigurasi zona ketersediaan kluster yang ada. Sebagai gantinya, Anda perlu menyebarkan kluster baru dan memigrasikan beban kerja Anda.
Perilaku ketika semua zona sehat
Bagian ini menjelaskan apa yang dapat diharapkan ketika kluster Anda diperluas dan semua zona ketersediaan beroperasi.
Operasi lintas wilayah: VM dapat berjalan pada host di salah satu zona ketersediaan. Penempatan VM dapat dikontrol menggunakan afinitas DRS vSphere dan aturan anti-afinitas untuk mengoptimalkan persyaratan performa atau ketersediaan.
Replikasi data lintas wilayah: vSAN mereplikasi data secara sinkron di seluruh zona ketersediaan. Setiap operasi tulis dikonfirmasi oleh kedua zona sebelum selesai, memastikan integritas data yang konsisten.
Bagian ini menjelaskan apa yang diharapkan ketika kluster Anda disebarkan di cloud privat zonal, dan semua zona ketersediaan beroperasi.
Operasi lintas wilayah: VM berjalan pada host dalam zona ketersediaan kluster.
Replikasi data lintas wilayah: Tidak ada data yang direplikasi ke zona lain.
Perilaku selama kegagalan zona
Bagian ini menjelaskan apa yang diharapkan ketika kluster Anda diperluas dan terjadi gangguan pada zona ketersediaan.
- Deteksi dan respons: Azure VMware Solution mengelola respons tingkat infrastruktur terhadap kegagalan zona. vSphere HA secara otomatis mendeteksi kegagalan zona dan memulai prosedur mulai ulang VM jika perlu.
- Pemberitahuan: Microsoft tidak secara otomatis memberi tahu Anda saat zona tidak berfungsi. Namun, Anda dapat menggunakan Azure Resource Health untuk memantau kesehatan sumber daya individual, dan Anda dapat menyiapkan pemberitahuan Resource Health untuk memberi tahu Anda tentang masalah. Anda juga dapat menggunakan Azure Service Health untuk memahami kesehatan layanan secara keseluruhan, termasuk kegagalan zona apa pun, dan Anda dapat menyiapkan pemberitahuan Service Health untuk memberi tahu Anda tentang masalah.
Permintaan aktif: Setiap VM yang berjalan di zona ketersediaan yang gagal akan dimulai ulang pada host di zona ketersediaan yang berfungsi. Permintaan aktif dan koneksi ke VM yang terpengaruh dihentikan, dan klien bertanggung jawab untuk mencobanya kembali.
Waktu henti yang diharapkan: Waktu untuk memulai ulang VM yang gagal di zona sehat biasanya beberapa menit, tergantung pada konfigurasi VM dan prosedur startup. Kluster yang diperluas tetap beroperasi dengan kapasitas yang berkurang.
Jika zona ketersediaan yang gagal berisi simpul saksi, saksi menjadi tidak dapat dijangkau. Selama replika data yang memadai tetap tersedia, host data dan beban kerja yang berjalan terus beroperasi tanpa kehilangan data segera. Namun, vSAN kehilangan kesadaran kuorum dalam keadaan ini, yang mencegahnya membuat keputusan penempatan dan pemulihan dengan aman serta menyebabkan operasi tertentu diblokir, seperti penyalaan VM setelah kegagalan, penyeimbangan kembali, dan perbaikan.
Kehilangan data yang diharapkan: Karena vSAN menggunakan replikasi sinkron antar zona, tidak ada kehilangan data yang diharapkan selama kegagalan zona.
Redistribusi: vSphere DRS secara otomatis mendistribusikan ulang beban kerja VM ke zona ketersediaan yang masih ada. Perutean lalu lintas jaringan melalui VMware NSX beradaptasi dengan penempatan VM baru secara otomatis.
Bagian ini menjelaskan apa yang diharapkan ketika kluster Anda disebarkan di cloud privat zonal, dan terjadi pemadaman zona ketersediaan.
- Deteksi dan respons: Anda perlu mendeteksi hilangnya zona ketersediaan. Jika perlu, Anda dapat melakukan failover ke kluster sekunder yang telah Anda buat sebelumnya di zona ketersediaan lain.
- Pemberitahuan: Microsoft tidak secara otomatis memberi tahu Anda saat zona tidak berfungsi. Namun, Anda dapat menggunakan Azure Resource Health untuk memantau kesehatan sumber daya individual, dan Anda dapat menyiapkan pemberitahuan Resource Health untuk memberi tahu Anda tentang masalah. Anda juga dapat menggunakan Azure Service Health untuk memahami kesehatan layanan secara keseluruhan, termasuk kegagalan zona apa pun, dan Anda dapat menyiapkan pemberitahuan Service Health untuk memberi tahu Anda tentang masalah.
Permintaan aktif: Permintaan aktif dan koneksi ke VM yang terpengaruh dihentikan, dan klien bertanggung jawab untuk mencobanya kembali.
Waktu henti yang diharapkan: Ketika zona tidak tersedia, kluster Anda dan beban kerjanya tidak tersedia hingga zona ketersediaan pulih.
Kehilangan data yang diharapkan: Data di zona yang terpengaruh tidak tersedia hingga zona pulih.
Redistribusi: Anda bertanggung jawab untuk mengalihkan lalu lintas ke kluster lain di zona sehat, jika diperlukan.
Pemulihan Zona
Ketika zona ketersediaan pulih, vSphere DRS dapat secara opsional mendistribusikan ulang VM kembali ke zona yang dipulihkan berdasarkan konfigurasi DRS dan aturan afinitas Anda. Anda juga dapat mengontrol penempatan VM secara manual menggunakan operasi vMotion.
Ketika zona ketersediaan pulih, kluster dan host di zona tersedia lagi. Anda bertanggung jawab atas prosedur pemulihan zona dan sinkronisasi data apa pun yang diperlukan beban kerja Anda.
Uji kegagalan zona
Anda dapat mensimulasikan kegagalan zona dengan:
Menggunakan vSphere untuk menempatkan host ke dalam mode pemeliharaan untuk mensimulasikan kegagalan tingkat zona.
Memvalidasi bahwa sistem pencadangan dan pemantauan terus berfungsi selama kegagalan yang disimulasikan.
- Menguji ketahanan aplikasi terhadap pengulangan VM dan perubahan rute jaringan, terutama ketika Anda memiliki kluster yang diperluas atau menyebarkan aplikasi di kluster-kluster terpisah di zona yang berbeda.
Karena Azure VMware Solution mengelola respons infrastruktur terhadap kegagalan zona, Anda terutama perlu menguji respons aplikasi Anda terhadap mulai ulang VM.
Anda bertanggung jawab atas respons infrastruktur terhadap kegagalan zona, seperti failover ke kluster lain di zona atau wilayah yang berbeda. Pastikan Anda menguji proses respons Anda secara menyeluruh.
Ketahanan terhadap kegagalan di seluruh wilayah
Setiap kluster Azure VMware Solution disebarkan dalam satu wilayah Azure. Jika wilayah menjadi tidak tersedia, cloud privat Anda dan semua sumber daya di dalamnya menjadi tidak tersedia.
Namun, Anda juga dapat merancang solusi multi-wilayah kustom yang menggabungkan pendekatan yang berbeda atau berintegrasi dengan infrastruktur yang ada untuk memenuhi persyaratan bisnis dan tujuan pemulihan spesifik Anda.
Solusi multi-wilayah kustom untuk ketahanan
Untuk mencapai ketahanan multi-wilayah dengan Azure VMware Solution, Anda perlu menyebarkan cloud privat terpisah di beberapa wilayah dan menerapkan failover dan solusi pemulihan bencana lainnya.
Ada berbagai opsi yang mendukung persyaratan yang berbeda. Untuk informasi selengkapnya, lihat Solusi pencadangan dan pemulihan bencana pihak ketiga untuk Azure VMware: Batasan, kompatibilitas, dan masalah yang diketahui.
Pencadangan dan pemulihan
Azure VMware Solution secara otomatis mencadangkan komponen manajemen (vCenter Server, Manajer NSX, dan Manajer HCX jika diaktifkan). Untuk memulihkan dari cadangan manajemen ini, buat permintaan dukungan Azure.
Untuk beban kerja VM Anda, Azure VMware Solution mendukung beberapa pendekatan pencadangan. Untuk informasi terperinci, lihat Pencadangan VM untuk Azure VMware Solution.
Ketahanan terhadap pemeliharaan layanan
Azure melakukan pemeliharaan platform otomatis untuk menerapkan pembaruan keamanan, menyebarkan fitur baru, dan meningkatkan keandalan layanan.
Untuk mempelajari tentang dampak pemeliharaan terhadap komponen Azure VMware Solution, dan untuk memahami komponen yang Anda bertanggung jawab untuk memelihara dan yang dikelola oleh Microsoft, lihat Praktik terbaik pemeliharaan cloud privat Azure VMware Solution.
Anda dapat mengonfigurasi jendela pemeliharaan untuk kluster Anda untuk mengurangi kemungkinan pemeliharaan yang memengaruhi beban kerja produksi Anda. Untuk informasi selengkapnya, lihat Merencanakan pemeliharaan layanan mandiri untuk Azure VMware Solution (pratinjau publik).
Perjanjian tingkat layanan
Perjanjian tingkat layanan (SLA) untuk layanan Azure menjelaskan ketersediaan yang diharapkan dari setiap layanan dan kondisi yang harus dipenuhi solusi Anda untuk mencapai harapan ketersediaan tersebut. Untuk informasi selengkapnya, lihat SLA untuk layanan online.
Azure VMware Solution menyediakan SLA ketersediaan yang berbeda untuk infrastruktur beban kerja dan untuk operasi manajemen.
Kluster yang dikonfigurasi sebagai kluster yang diperluas memiliki SLA ketersediaan infrastruktur untuk beban kerja yang lebih tinggi.
Namun, untuk memenuhi syarat untuk SLA ketersediaan, Anda harus mengonfigurasi kluster Anda dengan cara tertentu. Lihat teks SLA untuk informasi terperinci.