Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Azure Managed Grafana menyediakan ruang kerja Grafana yang dihosting untuk membangun dasbor dan visualisasi. Microsoft mengelola semua infrastruktur yang mendasar, termasuk pembaruan komputasi, jaringan, penyimpanan, dan layanan.
Saat Anda menggunakan Azure, keandalan adalah tanggung jawab bersama. Microsoft menyediakan berbagai kemampuan untuk mendukung ketahanan dan pemulihan. Anda bertanggung jawab untuk memahami cara kerja kemampuan tersebut dalam semua layanan yang Anda gunakan, dan memilih kemampuan yang Anda butuhkan untuk memenuhi tujuan bisnis dan tujuan waktu aktif Anda.
Artikel ini menjelaskan cara membuat Azure Managed Grafana tahan terhadap berbagai potensi pemadaman dan masalah, termasuk kesalahan sementara, pemadaman zona ketersediaan, dan pemadaman wilayah. Ini juga menjelaskan bagaimana Anda dapat melakukan pencadangan dan pemulihan dari berbagai jenis masalah lainnya, serta menyoroti beberapa informasi penting mengenai perjanjian tingkat layanan (SLA) Azure Managed Grafana.
Rekomendasi penyebaran produksi
Untuk meningkatkan keandalan penyebaran produksi menggunakan Azure Managed Grafana, kami sarankan Anda mengambil tindakan berikut:
- Aktifkan redundansi zona saat membuat ruang kerja untuk memberikan ketahanan terhadap kegagalan zona ketersediaan.
- Simpan dasbor dan sumber daya Grafana lainnya sebagai kode, misalnya dengan mengekspornya dari Grafana API atau CLI, dan menyimpannya di repositori kontrol versi seperti GitHub. Gunakan alur CI/CD untuk menyebarkan dasbor ke Azure Managed Grafana. Pendekatan ini mendukung skenario pemulihan. Ini juga memungkinkan penyebaran ke beberapa instans Grafana, termasuk instans di wilayah Azure yang berbeda jika diperlukan.
Gambaran umum arsitektur keandalan
Bagian ini menjelaskan beberapa aspek penting tentang cara kerja layanan yang paling relevan dari perspektif keandalan. Bagian ini memperkenalkan arsitektur logis, yang mencakup beberapa sumber daya dan fitur yang Anda sebarkan dan gunakan. Ini juga membahas arsitektur fisik, yang memberikan detail tentang cara kerja layanan di bawah sampul.
Arsitektur logika
Sumber daya Azure utama yang Anda sebarkan adalah workspace. Setelah menerapkan ruang kerja, Anda dapat menggunakan titik akhir Grafana dari ruang kerja untuk mengonfigurasi dan berinteraksi dengan sumber data, dasbor, visualisasi, serta resource Grafana lainnya.
Arsitektur fisik
Di balik layar, saat Anda membuat ruang kerja, platform Azure menyediakan komponen berikut:
- Server Grafana: Komputer virtual khusus yang menjalankan aplikasi Grafana. Secara default, dua server disediakan untuk ketersediaan tinggi dan redundansi. Server ini dikelola sepenuhnya oleh Microsoft. Anda tidak melihatnya di langganan Anda, Anda tidak dapat mengaksesnya, dan Anda tidak bertanggung jawab untuk menambal, menskalakan, atau memeliharanya.
- Load balancer: Penyeimbang beban jaringan yang mendistribusikan permintaan browser masuk di seluruh server Grafana. Load balancer memantau kesehatan server dan secara otomatis mengalihkan lalu lintas dari server yang bermasalah.
- Database Backend: Azure Database for PostgreSQL yang menyimpan konfigurasi ruang kerja serta data persisten lainnya. Database ini dibagikan di semua server Grafana di ruang kerja.
Load balancer melacak server Grafana mana yang tersedia. Dalam penyiapan server ganda, jika satu server menjadi tidak sehat, load balancer mengirimkan semua permintaan ke server yang tersisa. Server tersebut mengambil sesi browser yang sebelumnya dilayani oleh yang lain, berdasarkan informasi yang disimpan dalam database bersama. Sementara itu, layanan Azure Managed Grafana berfungsi untuk memperbaiki server yang tidak sehat atau memunculkan yang baru.
Ketahanan terhadap kesalahan sementara
Kesalahan sementara adalah kegagalan yang bersifat sementara dan intermiten dalam komponen. Mereka sering terjadi di lingkungan terdistribusi seperti cloud, dan mereka adalah bagian normal dari operasi. Kesalahan sementara memperbaiki diri setelah waktu yang singkat. Penting bahwa aplikasi Anda dapat menangani kesalahan sementara, biasanya dengan mencoba kembali permintaan yang terpengaruh.
Semua aplikasi yang dihosting cloud harus mengikuti panduan penanganan kesalahan sementara Azure saat berkomunikasi dengan API, database, dan komponen lain yang dihosting cloud. Untuk informasi selengkapnya, lihat Rekomendasi untuk menangani kesalahan sementara.
Anda dapat membangun aplikasi klien untuk berinteraksi dengan ruang kerja Grafana Anda melalui Grafana API. Pastikan aplikasi tersebut mengikuti panduan coba lagi Azure untuk permintaan yang gagal.
Ketahanan terhadap kegagalan zona ketersediaan
Zona ketersediaan adalah grup pusat data yang terpisah secara fisik dalam wilayah Azure. Ketika satu zona gagal, layanan dapat melakukan failover ke salah satu zona yang tersisa.
Ruang kerja Azure Managed Grafana mendukung redundansi zona di wilayah Azure yang didukung. Ketika redundansi zona diaktifkan, server Grafana dalam ruang kerja didistribusikan di beberapa zona ketersediaan. Microsoft memilih zona yang digunakan ruang kerja Anda. Sumber daya lain, seperti penyeimbang beban jaringan, database, dan gateway bersama, juga dikonfigurasi untuk menggunakan beberapa zona ketersediaan.
Jika Anda tidak mengaktifkan redundansi zona, itu nonzonal atau regional, yang berarti bahwa server dan komponen lain mungkin ditempatkan di zona ketersediaan apa pun dalam wilayah atau dalam zona yang sama. Jika ada zona ketersediaan di wilayah tersebut yang bermasalah, ruang kerja Anda mungkin mengalami gangguan layanan.
Persyaratan
Dukungan wilayah: Dukungan redundansi zona tersedia di wilayah berikut:
| Americas | Eropa | Asia Pasifik |
|---|---|---|
| US Timur | Eropa Utara | Australia Timur |
| US Tengah Selatan | Asia Timur | |
| Barat AS 3 |
Biaya
Mengaktifkan redundansi zona dikenakan biaya tambahan. Untuk informasi selengkapnya, lihat harga Azure Managed Grafana.
Mengonfigurasi dukungan zona ketersediaan
Buat ruang kerja baru dengan zona ketersediaan diaktifkan: Aktifkan redundansi zona selama pembuatan ruang kerja melalui portal Azure, CLI, atau templat ARM/Bicep.
Untuk informasi selengkapnya, lihat Enable zone redundancy in Azure Managed Grafana.
Mengonfigurasi redundansi zona pada ruang kerja yang ada: Anda tidak dapat mengaktifkan atau menonaktifkan redundansi zona pada ruang kerja yang ada. Sebagai gantinya, Anda perlu membuat ruang kerja baru dengan konfigurasi redundansi zona yang Diinginkan, memigrasikan dasbor dan konfigurasi Anda, lalu menghapus ruang kerja yang ada.
Perilaku ketika semua zona sehat
Bagian ini menjelaskan apa yang bisa diharapkan ketika ruang kerja dikonfigurasi sebagai zona redundan, dan semua zona ketersediaan beroperasi.
Perutean lalu lintas antar zona: Load balancer zona-redundan secara otomatis mendistribusikan permintaan masuk di seluruh server Grafana. Kedua server dapat memproses lalu lintas.
Replikasi data antar zona: Perubahan pada data ruang kerja direplikasi secara sinkron di beberapa zona ketersediaan. Replikasi data dilakukan oleh Azure Database for PostgreSQL. Untuk informasi selengkapnya, lihat Reliability di Azure Database for PostgreSQL. Azure Managed Grafana tidak menerapkan logika replikasi kustom tambahan di luar apa yang disediakan platform database.
Perilaku selama kegagalan zona
Bagian ini menjelaskan apa yang diharapkan ketika ruang kerja dikonfigurasi menjadi zona redundan, dan zona ketersediaan menjadi tidak tersedia.
- Deteksi dan tanggapan: platform Azure mendeteksi dan menanggapi kegagalan di zona ketersediaan. Anda tidak perlu memulai failover zona.
- Pemberitahuan: Microsoft tidak secara otomatis memberi tahu Anda saat zona tidak berfungsi. Namun, Anda dapat menggunakan Azure Resource Health untuk memantau kesehatan sumber daya individual, dan Anda dapat menyiapkan pemberitahuan Resource Health untuk memberi tahu Anda tentang masalah. Anda juga dapat menggunakan Azure Service Health untuk memahami kesehatan keseluruhan layanan, termasuk kegagalan zona apa pun, dan Anda dapat menyiapkan pemberitahuan Service Health untuk memberi tahu Anda tentang masalah.
Kehilangan data yang diharapkan: Tidak ada kehilangan data yang diharapkan selama pemadaman zona ketersediaan.
Waktu henti yang diharapkan: Ruang kerja Anda mungkin mengalami sedikit waktu henti, biasanya terbatas pada beberapa detik, sementara lalu lintas dialihkan ke server yang sehat. Pastikan setiap aplikasi klien menangani gangguan sementara dengan tepat untuk meminimalkan efek dari waktu henti apa pun.
Pengalihan lalu lintas: Lalu lintas masuk secara otomatis dirutekan ke server di zona sehat. Layanan berjalan dengan kapasitas yang berkurang selama pemadaman zona. Server pengganti tidak disediakan di zona sehat selama pemadaman.
Pemulihan Zona
Microsoft mengelola pemulihan zona secara otomatis, termasuk memulihkan kapasitas layanan ketika zona yang terkena dampak menjadi sehat lagi.
Uji kegagalan zona
Platform Azure mengelola perutean lalu lintas, failover, dan failback untuk ruang kerja zona redundan. Fitur ini dikelola sepenuhnya, sehingga Anda tidak perlu memulai atau memvalidasi proses kegagalan zona ketersediaan.
Ketahanan terhadap kegagalan di seluruh wilayah
Azure Managed Grafana adalah layanan wilayah tunggal. Jika wilayah tidak tersedia, ruang kerja Anda juga tidak tersedia.
Solusi multi-wilayah kustom untuk ketahanan
Untuk mencapai ketahanan terhadap pemadaman regional, Anda dapat menyebarkan beberapa ruang kerja Grafana di berbagai wilayah. Dalam jenis solusi ini, Anda bertanggung jawab untuk:
- Replikasi dasbor dan konfigurasi antar wilayah. Misalnya, Anda dapat menerapkan konfigurasi yang konsisten di beberapa ruang kerja dengan menggunakan CI/CD dan kontrol sumber.
- Menerapkan perutean lalu lintas dan failover di tingkat aplikasi atau klien.
Pencadangan dan pemulihan
Azure Managed Grafana tidak menyediakan fungsionalitas pencadangan atau pemulihan bawaan untuk dasbor atau entitas bidang data lainnya. Untuk melindungi dari penghapusan atau kerusakan yang tidak disengaja:
- Gunakan Grafana API atau CLI untuk mengekspor dasbor dan konfigurasi Grafana lainnya.
- Simpan dasbor yang diekspor di repositori kontrol sumber, seperti GitHub.
- Gunakan otomatisasi atau alur CI/CD untuk menerapkan kembali dasbor dan konfigurasi Grafana lainnya.
Untuk sebagian besar solusi, Anda tidak boleh mengandalkan cadangan secara eksklusif. Sebagai gantinya, gunakan kemampuan lain yang dijelaskan dalam panduan ini untuk mendukung persyaratan ketahanan Anda. Namun, pencadangan melindungi dari beberapa risiko yang tidak dapat dicegah oleh pendekatan lain. Untuk informasi selengkapnya, lihat Apa itu redundansi, replikasi, dan cadangan?.
Ketahanan terhadap pemeliharaan layanan
Microsoft secara teratur menerapkan pembaruan layanan dan melakukan pemeliharaan lainnya. Platform Azure menangani aktivitas ini secara otomatis, memastikan bahwa pemeliharaan mulus dan transparan bagi Anda. Selama operasi pemeliharaan, Anda mungkin mengamati gangguan singkat. Biasanya gangguan ini berlangsung beberapa detik. Pastikan aplikasi klien dikonfigurasi untuk menangani kesalahan sementara sehingga tahan terhadap gangguan singkat.
Perjanjian tingkat layanan
Perjanjian tingkat layanan (SLA) untuk layanan Azure menjelaskan ketersediaan yang diharapkan dari setiap layanan dan kondisi yang harus dipenuhi solusi Anda untuk mencapai harapan ketersediaan tersebut. Untuk informasi selengkapnya, lihat Perjanjian Tingkat Layanan untuk layanan online.