Bagikan melalui


Keberlangsungan bisnis dan pemulihan bencana

Bencana dapat berupa kegagalan perangkat keras, bencana alam, atau kegagalan perangkat lunak. Proses persiapan dan pemulihan dari bencana disebut pemulihan bencana (DR). Artikel ini membahas praktik yang direkomendasikan untuk mencapai kelangsungan bisnis dan pemulihan bencana (BCDR) untuk Azure Operator Insights.

Strategi BCDR termasuk redundansi zona ketersediaan dan pemulihan yang dikelola pengguna.

Sarana kontrol

Sarana kontrol Azure Operator Insights tahan terhadap kesalahan perangkat lunak dan kegagalan Zona Ketersediaan. Kemampuan untuk membuat dan mengelola Produk Data tidak terpengaruh oleh mode kegagalan ini.

Sarana kontrol tidak berlebihan secara regional. Selama pemadaman di wilayah Azure, Anda tidak dapat membuat Produk Data baru di wilayah tersebut atau mengakses/mengelola produk yang sudah ada. Setelah wilayah pulih dari pemadaman, Anda dapat mengakses dan mengelola Produk Data yang ada lagi.

Pesawat data

Produk Data tahan terhadap kegagalan perangkat lunak atau perangkat keras. Misalnya, jika bug perangkat lunak menyebabkan layanan mengalami crash, atau kegagalan perangkat keras menyebabkan sumber daya komputasi untuk kueri pengayaan hilang, layanan akan pulih secara otomatis. Satu-satunya dampak adalah sedikit keterlambatan dalam data yang baru diserap yang tersedia di titik akhir penyimpanan Produk Data dan di URL konsumsi KQL.

Redundansi zona

Produk Data tidak mendukung redundansi zona. Ketika zona ketersediaan gagal, penyerapan Produk Data, blob/DFS dan API KQL/SQL semuanya tidak tersedia, dan dasbor tidak berfungsi. Transformasi data yang sudah diserap dijeda. Tidak ada data yang diserap sebelumnya yang hilang. Pemrosesan dilanjutkan ketika zona ketersediaan pulih.

Apa yang terjadi pada data yang dihasilkan selama pemadaman zona ketersediaan tergantung pada perilaku agen penyerapan:

  • Jika agen penyerapan menyangga data dan mengirimnya kembali saat zona ketersediaan pulih, data tidak hilang. Azure Operator Insights mungkin membutuhkan waktu untuk bekerja melalui backlog transformasinya.
  • Jika tidak, data akan hilang.

Pemulihan dari bencana

Azure Operator Insights tidak memiliki redundansi wilayah bawaan. Pemadaman regional memengaruhi Produk Data dengan cara yang sama seperti kegagalan zona ketersediaan. Kami memiliki rekomendasi dan fitur untuk mendukung pelanggan yang ingin dapat menangani kegagalan seluruh wilayah Azure.

Redundansi yang dikelola pengguna

Untuk redundansi maksimal, Anda dapat menyebarkan Produk Data dalam mode aktif-aktif. Sebarkan Produk Data kedua di wilayah Azure cadangan pilihan Anda, dan konfigurasikan agen penyerapan Anda untuk fork data ke kedua Produk Data secara bersamaan. Produk Data cadangan tidak terpengaruh oleh kegagalan wilayah utama. Selama pemadaman regional, lihat dasbor yang menggunakan Produk Data cadangan sebagai sumber data. Arsitektur ini menggandakan biaya solusi.

Atau, Anda dapat menggunakan mode pasif aktif. Sebarkan Produk Data kedua di wilayah Azure cadangan, dan konfigurasikan agen penyerapan Anda untuk dikirim ke Produk Data utama. Selama pemadaman regional, konfigurasi ulang agen penyerapan Anda untuk mengirim data ke Produk Data cadangan selama pemadaman wilayah. Arsitektur ini memberikan akses penuh ke data yang dibuat selama pemadaman (mulai dari waktu Anda mengonfigurasi ulang agen penyerapan), tetapi selama pemadaman Anda tidak memiliki akses ke data yang diserap sebelum waktu tersebut. Arsitektur ini memerlukan biaya infrastruktur kecil untuk Produk Data kedua, tetapi tidak ada biaya pemrosesan data tambahan.