Keandalan di Azure Operator Nexus
Penting
Fitur ini masih dalam mode pratinjau. Pratinjau disediakan untuk Anda dengan syarat Anda menyetujui ketentuan penggunaan tambahan.
Artikel ini menjelaskan dukungan keandalan di Azure Operator Nexus dan mencakup ketahanan intra-regional dengan zona ketersediaan. Untuk gambaran umum keandalan yang lebih rinci di Azure, lihat Keandalan Azure.
Dukungan zona ketersediaan
Zona ketersediaan Azure adalah setidaknya tiga grup pusat data yang terpisah secara fisik dalam setiap wilayah Azure. Pusat data dalam setiap zona dilengkapi dengan infrastruktur daya, pendinginan, dan jaringan independen. Dalam kasus kegagalan zona lokal, zona ketersediaan dirancang sehingga jika satu zona terpengaruh, layanan regional, kapasitas, dan ketersediaan tinggi didukung oleh dua zona yang tersisa.
Kegagalan dapat berkisar dari kegagalan perangkat lunak dan perangkat keras hingga peristiwa seperti gempa bumi, banjir, dan kebakaran. Toleransi terhadap kegagalan dicapai dengan redundansi dan isolasi logis layanan Azure. Untuk informasi selengkapnya tentang zona ketersediaan di Azure, lihat Wilayah dan zona ketersediaan.
Layanan berkemampuan zona ketersediaan Azure dirancang untuk memberikan tingkat keandalan dan fleksibilitas yang tepat. Mereka dapat dikonfigurasi dalam dua cara. Mereka dapat berupa zona redundan,dengan replikasi otomatis di seluruh zona, atau zonal, dengan instans yang disematkan ke zona tertentu. Anda juga dapat menggabungkan pendekatan ini. Untuk informasi selengkapnya tentang arsitektur zonal vs. zona-redundan, lihat Rekomendasi untuk menggunakan zona dan wilayah ketersediaan.
Azure Operator Nexus menawarkan penyebaran zona redundan ketersediaan secara default. Komponen Operator Nexus, seperti Cluster Manager dan Network Fabric Controller semuanya disebarkan pada kluster Azure Kubernetes Service (AKS) yang diaktifkan dengan zona ketersediaan. Dependensi layanan lain, seperti Storage Account Service, dan KeyVault juga dikonfigurasi dengan zona ketersediaan-redundansi.
Catatan
Instans Operator Nexus Lokal mengimplementasikan desain multi-rak yang menyediakan redundansi fisik di semua tingkat tumpukan. Setiap rak dirancang sebagai domain kegagalan atau zona Nexus. Beban kerja pelanggan dapat disebarkan di beberapa rak/simpul, pada dasarnya memberikan pengalaman zona multi-ketersediaan yang serupa.
Pengalaman zona ketersediaan Azure tidak berfungsi
Dalam skenario zona tidak berfungsi, panggilan API terhadap kluster dan penyedia sumber daya akan terus berfungsi tanpa gangguan. Tidak akan ada dampak pada beban kerja penyewa lokal yang sedang berjalan atau pada kemampuan untuk membuat beban kerja penyewa baru. Selain itu, tidak ada kehilangan data yang harus terjadi, karena ketahanan Operator Nexus dan jenis sumber daya lainnya dipastikan.
Dukungan failover zona ketersediaan Azure
Dalam kasus kegagalan zona ketersediaan, koneksi ulang ke zona ketersediaan Azure lain bersifat otomatis dan tidak memerlukan interaksi dari pengguna.
Ketersediaan pada penyebaran instans Nexus Operator
Memastikan ketersediaan dalam penyebaran beban kerja Azure Operator Nexus adalah tanggung jawab terpisah. Seperti yang dinyatakan di bagian sebelumnya, sumber daya berbasis Operator Nexus AKS disebarkan dengan redundansi zona ketersediaan. Di bagian ini, kami mempertimbangkan praktik terbaik untuk ketersediaan beban kerja lokal.
Secara umum, target ketersediaan dicapai melalui penyebaran lokal dan geo-redundan.
Zona Nexus: mekanisme untuk redundansi beban kerja lokal
Instans lokal Nexus operator terdiri dari desain multi-rak yang menyediakan redundansi fisik di semua tingkat tumpukan. Setiap rak ditetapkan sebagai domain kegagalan dan, dengan demikian, dapat dikonfigurasi sebagai zona Nexus di mana zona ini dapat dan, sebaiknya, digunakan untuk penyebaran beban kerja redundan lokal.
Instans Nexus: mekanisme untuk redundansi beban kerja geografis
Instans lokal Nexus dihosting di wilayah Azure tertentu. Seperti yang dinyatakan sebelumnya, layanan Azure yang digunakan dan sumber daya Nexus disebarkan di beberapa zona ketersediaan wilayah Azure tersebut.
Instans Nexus yang didistribusikan secara geografis, yaitu, tidak di pusat data operator yang sama (bahkan mungkin bukan wilayah geografis yang sama), dan dihosting di wilayah Azure yang berbeda harus digunakan untuk menyebarkan beban kerja secara berlebihan untuk geo-redundansi.
Peringatan
Menyebarkan beban kerja, katakanlah, dua instans Nexus yang didistribusikan secara geografis tidak mencukupi untuk mencapai geo-redundansi yang sebenarnya kecuali instans Nexus geo-redundan dihosting di wilayah Azure yang berbeda.
Jika wilayah Azure menjadi tidak tersedia, layanan Azure serta sumber daya Nexus di wilayah tersebut juga akan menjadi tidak tersedia. Meskipun ini tidak berdampak pada menjalankan beban kerja, ini mencegah kemampuan seperti memulai beban kerja baru, analitik, dll.
Beberapa instans Nexus di lokasi geografis yang sama
Ada skenario di mana beberapa instans Nexus perlu disebarkan di lokasi geografis yang sama. Geo-redundansi beban kerja jelas tidak dicapai dengan menyebarkan beban kerja pada instans Nexus di lokasi geografis yang sama.
Salah satu pertimbangan dalam merancang keandalan, selain ketersediaan, adalah ketahanan dan kemampuan untuk pulih dari kegagalan. Pemulihan dari kegagalan, dan kemampuan untuk memenuhi tujuan waktu pemulihan, mengharuskan kita membatasi "ledakan" atau berdampak pada radius kegagalan. Dalam skenario di mana beberapa instans Nexus disebarkan di lokasi geografis yang sama, desain tangguh menuntut agar instans Nexus ini dihosting di wilayah Azure yang berbeda. Dengan demikian, ketika wilayah Azure gagal, dampaknya terbatas pada satu instans Nexus.
Langkah berikutnya
Panduan Azure Architecture Center tentang zona ketersediaan.