Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Artikel ini berisi informasi terperinci tentang ketahanan wilayah regional Event Grid dan namespace Event Grid dengan zona ketersediaan dan pemulihan bencana lintas wilayah serta kelangsungan bisnis.
Untuk gambaran umum arsitektur keandalan di Azure, lihat Keandalan Azure.
Dukungan zona ketersediaan
Zona ketersediaan adalah grup pusat data yang terpisah secara fisik di setiap wilayah Azure. Ketika satu zona gagal, layanan dapat melakukan failover ke salah satu zona yang tersisa.
Definisi sumber daya Event Grid untuk topik, topik sistem, domain, dan langganan peristiwa dan data peristiwa secara otomatis direplikasi di tiga zona ketersediaan. Ketika ada kegagalan regional di salah satu zona ketersediaan, sumber daya Event Grid secara otomatis failover ke zona ketersediaan lain tanpa intervensi manusia. Saat ini, Anda tidak dapat mengontrol (mengaktifkan atau menonaktifkan) fitur ini. Ketika wilayah yang ada mulai mendukung zona ketersediaan, sumber daya Event Grid yang ada secara otomatis akan dialihkan untuk memanfaatkan fitur ini. Tidak perlu tindakan pelanggan.
Namespace Azure Event Grid juga mencapai ketersediaan tinggi dalam wilayah dengan menggunakan zona ketersediaan.
Prasyarat
Untuk dukungan zona ketersediaan, sumber daya Event Grid Anda harus berada di wilayah yang mendukung zona ketersediaan. Untuk meninjau wilayah mana yang mendukung zona ketersediaan, lihat daftar wilayah yang didukung.
Harga
Karena Event Grid mendukung zona ketersediaan secara otomatis di wilayah yang mendukung zona ketersediaan, tidak ada perubahan harga.
Membuat sumber daya dengan zona ketersediaan diaktifkan
Karena Event Grid mendukung zona ketersediaan secara otomatis di wilayah yang mendukung zona ketersediaan, tidak ada konfigurasi penyiapan yang diperlukan.
Dukungan untuk migrasi ke zona ketersediaan
Jika Anda merelokasi sumber daya Event Grid ke wilayah yang mendukung zona ketersediaan, Anda secara otomatis menerima dukungan zona ketersediaan. Untuk mempelajari cara merelokasi sumber daya Anda ke wilayah lain yang mendukung zona ketersediaan, lihat yang berikut ini:
- Merelokasi topik sistem Azure Event Grid ke wilayah lain
- Merelokasi topik kustom Azure Event Grid ke wilayah lain
- Merelokasi domain Azure Event Grid ke wilayah lain
Pemulihan bencana lintas wilayah dan kelangsungan bisnis
Pemulihan bencana (DR) mengacu pada praktik yang digunakan organisasi untuk pulih dari peristiwa berdampak tinggi, seperti bencana alam atau penyebaran gagal yang mengakibatkan waktu henti dan kehilangan data. Terlepas dari penyebabnya, obat terbaik untuk bencana adalah rencana DR yang terdefinisi dan teruji dengan baik dan desain aplikasi yang secara aktif mendukung DR. Sebelum Anda mulai membuat rencana pemulihan bencana, lihat rekomendasi untuk merancang strategi pemulihan bencana.
Untuk DR, Microsoft menggunakan model tanggung jawab bersama . Dalam model ini, Microsoft memastikan bahwa infrastruktur dasar dan layanan platform tersedia. Namun, banyak layanan Azure tidak secara otomatis mereplikasi data atau beralih dari wilayah yang gagal untuk mereplikasi ke wilayah lain yang tersedia. Untuk layanan tersebut, Anda bertanggung jawab untuk menyiapkan rencana pemulihan bencana yang berfungsi untuk beban kerja Anda. Sebagian besar layanan yang berjalan di penawaran platform as a service (PaaS) Azure menyediakan fitur dan panduan untuk mendukung DR. Anda dapat menggunakan fitur khusus layanan untuk mendukung pemulihan cepat dan membantu mengembangkan rencana DR Anda.
Pemulihan bencana biasanya melibatkan pembuatan sumber daya cadangan untuk mencegah gangguan ketika suatu wilayah menjadi tidak sehat. Selama proses ini, wilayah utama dan sekunder sumber daya Azure Event Grid akan diperlukan dalam beban kerja Anda.
Ada berbagai cara untuk pulih dari hilangnya fungsionalitas aplikasi yang parah. Di bagian ini, kami menjelaskan daftar periksa yang perlu Anda ikuti untuk mempersiapkan klien Anda pulih dari kegagalan karena sumber daya atau wilayah yang tidak sehat.
Event Grid mendukung pemulihan bencana geografis manual dan otomatis (GeoDR) di sisi server. Anda masih dapat menerapkan logika pemulihan bencana sisi klien jika Anda menginginkan kontrol yang lebih besar pada proses kegagalan. Untuk detail tentang GeoDR otomatis, lihat Pemulihan bencana geografis sisi server di Azure Event Grid. Untuk detail tentang cara menerapkan pemulihan bencana sisi klien, lihat Implementasi failover sisi klien di Azure Event Grid.
Tabel berikut mengilustrasikan failover sisi klien dan dukungan pemulihan bencana geografis di Event Grid.
| Sumber daya Event Grid | Dukungan failover untuk sisi klien | Dukungan pemulihan bencana geografis (GeoDR) |
|---|---|---|
| Topik Khusus | Didukung | Lintas Geografis atau Regional |
| Topik Sistem | Tidak didukung | Diaktifkan secara otomatis |
| Domain | Didukung | Lintas Geografis atau Regional |
| Partner Namespace | Didukung | Tidak didukung |
| Namaspace | Didukung | Tidak didukung |
Namespace Layanan Event Grid
Namespace Layanan Event Grid tidak mendukung DR lintas wilayah. Namun, Anda dapat mencapai ketersediaan tinggi lintas wilayah melalui implementasi failover sisi klien dengan membuat namespace primer dan sekunder.
Dengan implementasi failover di sisi klien, Anda dapat:
Terapkan proses kustom (manual atau otomatis) untuk mereplikasi namespace, identitas klien, dan konfigurasi lainnya** termasuk sertifikat CA, grup klien, ruang topik, pengikatan izin, perutean, antara wilayah primer dan sekunder.
Terapkan layanan pramutamu yang menyediakan titik akhir primer dan sekunder kepada klien dengan melakukan pemeriksaan kesehatan pada titik akhir. Layanan pramutamu dapat menjadi aplikasi web yang direplikasi dan terus dapat dijangkau menggunakan teknik pengalihan DNS, misalnya, menggunakan Azure Traffic Manager.
Memperoleh solusi DR Aktif-Aktif dengan mereplikasi metadata dan menyeimbangkan beban pada seluruh namespace. Solusi DR Pasif Aktif dapat dicapai dengan mereplikasi metadata agar namespace layanan sekunder tetap siap sehingga ketika namespace utama tidak tersedia, lalu lintas dapat diarahkan ke namespace sekunder.
Menyiapkan pemulihan bencana
Untuk wilayah yang dipasangkan, Event Grid menawarkan kemampuan untuk mengalihkan arus penerbitan ke wilayah yang dipasangkan terhadap topik kustom, topik sistem, dan domain. Di balik layar, Event Grid secara otomatis menyinkronkan definisi sumber daya topik, topik sistem, domain, dan langganan peristiwa ke wilayah yang dipasangkan. Namun, data peristiwa tidak direplikasi ke wilayah yang dipasangkan. Dalam status normal, peristiwa disimpan di wilayah yang Anda pilih untuk sumber daya tersebut. Ketika ada pemadaman wilayah dan Microsoft memulai failover, peristiwa baru mulai mengalir ke wilayah yang dipasangkan secara geografis dan dikirim dari sana tanpa intervensi dari Anda. Peristiwa yang diterbitkan dan diterima di wilayah asli dikirim dari sana setelah pemadaman dimitigasi.
Anda dapat memilih antara dua opsi failover, failover yang dimulai Microsoft dan pelanggan dimulai. Untuk langkah-langkah terperinci tentang cara mengonfigurasi kedua pengaturan ini, silakan lihat Konfigurasi residensi data.
Failover yang diinisiasi Microsoft dilakukan dalam situasi yang jarang terjadi untuk mengalihkan sumber daya Event Grid dari wilayah yang terpengaruh ke wilayah pasangan geografis yang sesuai. Microsoft berhak menentukan kapan opsi ini akan dilakukan. Mekanisme ini tidak melibatkan persetujuan pengguna sebelum lalu lintas pengguna dilakukan fail over.
Aktifkan fungsionalitas ini dengan memperbarui konfigurasi untuk topik atau domain Anda. Pilih Cross-Geo (default) untuk mengaktifkan failover yang dimulai Microsoft.
Failover yang dimulai oleh pelanggan ditentukan oleh rencana pemulihan bencana kustom Anda untuk topik dan domain Azure Event Grid, dan tidak ada data apa pun yang direplikasi ke wilayah lain oleh Microsoft. Meskipun opsi failover ini membutuhkan sedikit lebih banyak upaya, opsi ini memungkinkan failover yang lebih cepat, dan Anda mengendalikan pemilihan wilayah sekunder. Jika Anda ingin menerapkan pemulihan bencana sisi klien untuk topik Azure Event Grid, lihat Membangun pemulihan bencana sisi klien Anda sendiri untuk topik Azure Event Grid.
Ada beberapa alasan mengapa Anda mungkin ingin menonaktifkan fitur failover yang dimulai Microsoft:
- Failover yang dimulai Microsoft dilakukan berdasarkan upaya terbaik.
- Beberapa pasangan geografis tidak memenuhi persyaratan residensi data organisasi Anda.
Aktifkan fungsionalitas ini dengan memperbarui konfigurasi untuk topik atau domain Anda. Pilih Regional.
Jika Anda menggunakan wilayah yang tidak berpasangan, maka terlepas dari konfigurasi residensi data yang Anda pilih, metadata Anda hanya akan direplikasi dalam wilayah tersebut.
Pengalaman failover pemulihan bencana
Pemulihan bencana diukur dengan dua metrik, Recovery Point Objective (RPO) dan Recovery Time Objective (RTO). Untuk informasi selengkapnya, lihat Apa itu kelangsungan bisnis, ketersediaan tinggi, dan pemulihan bencana?.
Failover otomatis Event Grid memiliki RPO dan RTO yang berbeda untuk metadata Anda (topik, domain, langganan peristiwa) dan data (peristiwa). Jika Anda memerlukan spesifikasi yang berbeda dari yang berikut ini, Anda tetap dapat menerapkan failover client-side Anda sendiri menggunakan topic health API.
Tujuan titik pemulihan (RPO)
Metadata RPO: nol menit. Untuk sumber daya yang berlaku, saat sumber daya dibuat/diperbarui/dihapus, definisi sumber daya direplikasi secara sinkron ke pasangan geografis. Ketika failover terjadi, tidak ada metadata yang hilang.
Data RPO: Ketika failover terjadi, data baru akan diproses dari wilayah yang dipasangkan. Segera setelah pemadaman diatasi untuk wilayah yang terkena dampak, peristiwa yang belum diproses dikirim dari sana. Jika pemulihan wilayah memerlukan waktu lebih lama daripada nilai time-to-live yang ditetapkan pada peristiwa, data bisa dihilangkan. Untuk mengurangi kehilangan data ini, kami sarankan Anda menyiapkan tujuan dead-letter untuk langganan peristiwa. Jika wilayah yang terpengaruh hilang dan tidak dapat dipulihkan, akan ada beberapa kehilangan data. Dalam skenario terbaik, pelanggan dapat mengikuti laju penerbitan dan hanya kehilangan beberapa detik data. Skenario terburuk adalah ketika pelanggan tidak memproses peristiwa secara aktif dan dengan waktu aktif maksimum 24 jam, dapat menyebabkan kehilangan data hingga 24 jam.
Tujuan waktu pemulihan (RTO)
Metadata RTO: Pengambilan keputusan failover didasarkan pada faktor-faktor seperti kapasitas yang tersedia di wilayah berpasangan dan dapat bertahan dalam kisaran 60 menit atau lebih. Setelah failover dimulai, dalam waktu 5 menit, Event Grid mulai menerima panggilan buat/perbarui/hapus untuk topik dan langganan.
Data RTO: Sama seperti informasi di atas.
Penting
- Dalam kasus pemulihan bencana sisi server, jika wilayah yang dipasangkan tidak memiliki kapasitas tambahan untuk menangani lalu lintas tambahan, Event Grid tidak dapat memulai failover. Pemulihan dilakukan berdasarkan upaya terbaik.
- Tidak ada biaya untuk menggunakan fitur ini.
- Pemulihan dari bencana geografis tidak didukung untuk namespace mitra dan topik mitra.