Praktik terbaik untuk memantau Kubernetes dengan Azure Monitor

Artikel ini menyediakan praktik terbaik untuk memantau kesehatan dan performa kluster Kubernetes Service (AKS) dan Kubernetes dengan dukungan Azure Arc. Panduan ini didasarkan pada lima pilar keunggulan arsitektur yang dijelaskan dalam Azure Well-Architected Framework.

Keandalan

Di cloud, kami mengakui bahwa kegagalan terjadi. Alih-alih mencoba mencegah kegagalan secara bersamaan, tujuannya adalah untuk meminimalkan efek dari satu komponen yang gagal. Gunakan informasi berikut untuk memanfaatkan Azure Monitor dengan sebaik-baiknya untuk memastikan keandalan kluster Dan lingkungan pemantauan Kubernetes Anda.

Daftar periksa desain

  • Aktifkan pengikisan metrik Prometheus untuk kluster Anda.
  • Aktifkan wawasan Kontainer untuk pengumpulan log dan data performa dari kluster Anda.
  • Buat pengaturan diagnostik untuk mengumpulkan log sarana kontrol untuk kluster AKS.
  • Aktifkan pemberitahuan Prometheus yang direkomendasikan.
  • Pastikan ketersediaan ruang kerja Analitik Log yang mendukung wawasan Kontainer.

Rekomendasi konfigurasi

Rekomendasi Keuntungan
Aktifkan pengikisan metrik Prometheus untuk kluster Anda. Aktifkan Prometheus pada kluster Anda dengan layanan terkelola Azure Monitor untuk Prometheus jika Anda belum memiliki lingkungan Prometheus. Gunakan Azure Managed Grafana untuk menganalisis data Prometheus yang dikumpulkan. Lihat Menyesuaikan pengikisan metrik Prometheus di layanan terkelola Azure Monitor untuk Prometheus untuk mengumpulkan metrik tambahan di luar konfigurasi default.
Aktifkan wawasan Kontainer untuk pengumpulan log dan data performa dari kluster Anda. Wawasan kontainer mengumpulkan log stdout/stderr, metrik performa, dan peristiwa Kubernetes dari setiap simpul di kluster Anda. Ini menyediakan dasbor dan laporan untuk menganalisis data ini, termasuk ketersediaan simpul Anda dan komponen lainnya. Gunakan Analitik Log untuk mengidentifikasi kesalahan ketersediaan apa pun di log yang Dikumpulkan.
Buat pengaturan diagnostik untuk mengumpulkan log sarana kontrol untuk kluster AKS. AKS menerapkan log sarana kontrol sebagai log sumber daya di Azure Monitor. Buat pengaturan diagnostik untuk mengirim log ini ke ruang kerja Analitik Log sehingga Anda dapat menggunakan kueri log untuk mengidentifikasi kesalahan dan masalah yang memengaruhi ketersediaan.
Aktifkan pemberitahuan Prometheus yang direkomendasikan. Pemberitahuan di Azure Monitor secara proaktif memberi tahu Anda saat masalah terdeteksi. Mulailah dengan sekumpulan aturan pemberitahuan Prometheus yang direkomendasikan yang mendeteksi masalah ketersediaan dan performa paling umum dengan kluster Anda. Berpotensi menambahkan pemberitahuan pencarian log menggunakan data yang dikumpulkan oleh wawasan Kontainer.
Pastikan ketersediaan ruang kerja Analitik Log yang mendukung wawasan Kontainer. Wawasan kontainer bergantung pada ruang kerja Analitik Log. Lihat Praktik terbaik untuk Log Azure Monitor untuk rekomendasi guna memastikan keandalan ruang kerja.

Keamanan

Keamanan adalah salah satu aspek terpenting dari arsitektur apa pun. Azure Monitor menyediakan fitur untuk menggunakan prinsip hak istimewa paling sedikit dan pertahanan secara mendalam. Gunakan informasi berikut untuk memantau kluster Kubernetes Anda dan pastikan bahwa hanya pengguna yang berwenang yang mengakses data yang dikumpulkan.

Daftar periksa desain

  • Gunakan autentikasi identitas terkelola untuk kluster Anda untuk menyambungkan ke wawasan Kontainer.
  • Pertimbangkan untuk menggunakan tautan privat Azure untuk kluster Anda untuk menyambungkan ke ruang kerja Azure Monitor Anda menggunakan titik akhir privat.
  • Gunakan analitik lalu lintas untuk memantau lalu lintas jaringan ke dan dari kluster Anda.
  • Aktifkan pengamatan jaringan.
  • Pastikan keamanan ruang kerja Analitik Log yang mendukung wawasan Kontainer.

Rekomendasi konfigurasi

Rekomendasi Keuntungan
Gunakan autentikasi identitas terkelola untuk kluster Anda untuk menyambungkan ke wawasan Kontainer. Autentikasi identitas terkelola adalah default untuk kluster baru. Jika Anda menggunakan autentikasi warisan, Anda harus bermigrasi ke identitas terkelola untuk menghapus autentikasi lokal berbasis sertifikat.
Pertimbangkan untuk menggunakan tautan privat Azure untuk kluster Anda untuk menyambungkan ke ruang kerja Azure Monitor Anda menggunakan titik akhir privat. Layanan terkelola Azure untuk Prometheus menyimpan datanya di ruang kerja Azure Monitor yang menggunakan titik akhir publik secara default. Koneksi ke titik akhir publik diamankan dengan enkripsi end-to-end. Jika Anda memerlukan titik akhir privat, Anda dapat menggunakan tautan privat Azure untuk memungkinkan kluster Anda terhubung ke ruang kerja melalui jaringan privat yang diotorisasi. Tautan privat juga dapat digunakan untuk memaksa penyerapan data ruang kerja melalui ExpressRoute atau VPN.

Lihat Private Link untuk penyerapan data untuk prometheus terkelola dan ruang kerja Azure Monitor untuk detail tentang mengonfigurasi kluster Anda untuk tautan privat. Lihat Menggunakan titik akhir privat untuk ruang kerja Prometheus Terkelola dan Azure Monitor untuk detail tentang mengkueri data Anda menggunakan tautan privat.
Gunakan analitik lalu lintas untuk memantau lalu lintas jaringan ke dan dari kluster Anda. Analitik lalu lintas menganalisis log alur NSG Azure Network Watcher untuk memberikan wawasan tentang arus lalu lintas di cloud Azure Anda. Gunakan alat ini untuk memastikan tidak ada penyelundupan data untuk kluster Anda dan untuk mendeteksi apakah ada IP publik yang tidak perlu diekspos.
Aktifkan pengamatan jaringan. Add-on pengamatan jaringan untuk AKS memberikan pengamatan di beberapa lapisan di tumpukan jaringan Kube. memantau dan mengamati akses antar layanan dalam kluster (lalu lintas timur-barat).
Pastikan keamanan ruang kerja Analitik Log yang mendukung wawasan Kontainer. Wawasan kontainer bergantung pada ruang kerja Analitik Log. Lihat Praktik terbaik untuk Log Azure Monitor untuk rekomendasi guna memastikan keamanan ruang kerja.

Pengoptimalan biaya

Pengoptimalan biaya mengacu pada cara untuk mengurangi pengeluaran yang tidak perlu dan meningkatkan efisiensi operasional. Anda dapat secara signifikan mengurangi biaya untuk Azure Monitor dengan memahami berbagai opsi dan peluang konfigurasi Anda untuk mengurangi jumlah data yang dikumpulkannya. Lihat Biaya dan penggunaan Azure Monitor untuk memahami berbagai cara biaya Azure Monitor dan cara melihat tagihan bulanan Anda.

Catatan

Lihat Mengoptimalkan biaya di Azure Monitor untuk rekomendasi pengoptimalan biaya di semua fitur Azure Monitor.

Daftar periksa desain

  • Jangan aktifkan kumpulan wawasan Kontainer metrik Prometheus.
  • Konfigurasikan pengumpulan agen untuk memodifikasi pengumpulan data dalam wawasan Kontainer.
  • Ubah pengaturan untuk pengumpulan data metrik menurut wawasan Kontainer.
  • Nonaktifkan pengumpulan wawasan kontainer data metrik jika Anda tidak menggunakan pengalaman wawasan Kontainer di portal Azure.
  • Jika Anda tidak mengkueri tabel log kontainer secara teratur atau menggunakannya untuk pemberitahuan, konfigurasikan sebagai log dasar.
  • Batasi pengumpulan log sumber daya yang tidak Anda butuhkan.
  • Gunakan pengelogan khusus sumber daya untuk log sumber daya AKS dan konfigurasikan tabel sebagai log dasar.
  • Gunakan OpenCost untuk mengumpulkan detail tentang biaya Kubernetes Anda.

Rekomendasi konfigurasi

Rekomendasi Keuntungan
Jangan aktifkan kumpulan wawasan Kontainer metrik Prometheus di ruang kerja Analitik Log jika Anda telah mengaktifkan pengikisan metrik dengan Prometheus. Selain mengikis metrik Prometheus dari kluster Anda menggunakan layanan terkelola Azure Monitor untuk Prometheus, Anda dapat mengonfigurasi wawasan Kontainer untuk mengumpulkan metrik Prometheus di ruang kerja Analitik Log Anda. Ini berlebihan dengan data di Prometheus Terkelola dan akan menghasilkan biaya tambahan.
Konfigurasikan agen untuk mengubah pengumpulan data dalam wawasan Kontainer. Analisis data yang dikumpulkan oleh wawasan Kontainer seperti yang dijelaskan dalam Mengontrol penyerapan untuk mengurangi biaya dan menyesuaikan konfigurasi Anda untuk menghentikan pengumpulan data yang tidak Anda butuhkan.
Ubah pengaturan untuk pengumpulan data metrik menurut wawasan Kontainer. Lihat Mengaktifkan pengaturan pengoptimalan biaya untuk detail tentang memodifikasi frekuensi pengumpulan data metrik dan namespace yang dikumpulkan oleh wawasan Kontainer.
Nonaktifkan pengumpulan wawasan kontainer data metrik jika Anda tidak menggunakan pengalaman wawasan Kontainer di portal Azure. Wawasan kontainer mengumpulkan banyak nilai metrik yang sama dengan Prometheus Terkelola. Anda dapat menonaktifkan pengumpulan metrik ini dengan mengonfigurasi wawasan Kontainer untuk hanya mengumpulkan Log dan peristiwa seperti yang dijelaskan dalam Mengaktifkan pengaturan pengoptimalan biaya dalam wawasan Kontainer. Konfigurasi ini menonaktifkan pengalaman wawasan Kontainer di portal Azure, tetapi Anda dapat menggunakan Grafana untuk memvisualisasikan metrik Prometheus dan Analitik Log untuk menganalisis data log yang dikumpulkan oleh wawasan Kontainer.
Jika Anda tidak mengkueri tabel log kontainer secara teratur atau menggunakannya untuk pemberitahuan, konfigurasikan sebagai log dasar. Konversikan skema wawasan Kontainer Anda ke ContainerLogV2 yang kompatibel dengan log Dasar dan dapat memberikan penghematan biaya yang signifikan seperti yang dijelaskan dalam Mengontrol penyerapan untuk mengurangi biaya.
Batasi pengumpulan log sumber daya yang tidak Anda butuhkan. Log sarana kontrol untuk kluster AKS diimplementasikan sebagai log sumber daya di Azure Monitor. Buat pengaturan diagnostik untuk mengirim data ini ke ruang kerja Analitik Log. Lihat Mengumpulkan log sarana kontrol untuk kluster AKS untuk rekomendasi kategori mana yang harus Anda kumpulkan.
Gunakan pengelogan khusus sumber daya untuk log sumber daya AKS dan konfigurasikan tabel sebagai log dasar. AKS mendukung mode diagnostik Azure atau mode khusus sumber daya untuk log sumber daya. Tentukan log sumber daya untuk mengaktifkan opsi untuk mengonfigurasi tabel untuk log dasar, yang memberikan pengurangan biaya penyerapan untuk log yang hanya terkadang Anda kueri dan tidak digunakan untuk pemberitahuan.
Gunakan OpenCost untuk mengumpulkan detail tentang biaya Kubernetes Anda. OpenCost adalah proyek sandbox CNCF sumber terbuka dan netral vendor untuk memahami biaya Kubernetes Anda dan mendukung kemampuan Anda untuk visibilitas biaya AKS. Ini mengekspor data biaya terperinci selain harga Azure khusus pelanggan ke penyimpanan Azure untuk membantu administrator kluster dalam menganalisis dan mengategorikan biaya.

Keunggulan operasional

Keunggulan operasional mengacu pada proses operasi yang diperlukan agar layanan tetap berjalan dengan andal dalam produksi. Gunakan informasi berikut untuk meminimalkan persyaratan operasional untuk memantau kluster Kubernetes Anda.

Daftar periksa desain

  • Tinjau panduan untuk memantau semua lapisan lingkungan Kubernetes Anda.
  • Gunakan Kubernetes dengan dukungan Azure Arc untuk memantau kluster Anda di luar Azure.
  • Gunakan layanan terkelola Azure untuk alat asli cloud.
  • Integrasikan kluster AKS ke dalam alat pemantauan yang ada.
  • Gunakan kebijakan Azure untuk mengaktifkan pengumpulan data dari kluster Kubernetes Anda.

Rekomendasi konfigurasi

Rekomendasi Keuntungan
Tinjau panduan untuk memantau semua lapisan lingkungan Kubernetes Anda. Pantau performa kluster Kubernetes Anda dengan wawasan Kontainer mencakup panduan dan praktik terbaik untuk memantau seluruh lingkungan Kubernetes Anda dari jaringan, kluster, dan lapisan aplikasi.
Gunakan Kubernetes dengan dukungan Azure Arc untuk memantau kluster Anda di luar Azure. Kubernetes dengan dukungan Azure Arc memungkinkan kluster Kubernetes yang berjalan di cloud lain untuk dipantau menggunakan alat yang sama dengan kluster AKS Anda, termasuk wawasan Kontainer dan layanan terkelola Azure Monitor untuk Prometheus.
Gunakan layanan terkelola Azure untuk alat asli cloud. Layanan terkelola Azure Monitor untuk Prometheus dan Grafana terkelola Azure mendukung semua fitur alat asli cloud Prometheus dan Grafana tanpa harus mengoperasikan infrastruktur yang mendasarnya. Anda dapat dengan cepat menyediakan alat-alat ini dan onboarding kluster Kubernetes Anda dengan overhead minimal. Layanan ini memungkinkan Anda mengakses pustaka aturan dan dasbor komunitas yang luas untuk memantau lingkungan Kubernetes Anda.
Integrasikan kluster AKS ke dalam alat pemantauan yang ada. Jika Anda memiliki investasi yang ada di Prometheus dan Grafana, integrasikan kluster AKS dan layanan terkelola Azure ke lingkungan yang ada menggunakan panduan di Kluster Monitor Kubernetes menggunakan layanan Azure dan alat asli cloud.
Gunakan kebijakan Azure untuk mengaktifkan pengumpulan data dari kluster Kubernetes Anda. Gunakan Azure Policy untuk mengaktifkan pengumpulan data untuk mengaktifkan metrik Prometheus, wawasan kontainer, dan pengaturan diagnostik. Ini memastikan bahwa setiap kluster baru secara otomatis dipantau dan memberlakukan konfigurasi pemantauan mereka.

Efisiensi kinerja

Efisiensi performa adalah kemampuan beban kerja Anda untuk diskalakan agar memenuhi permintaan yang diberikan oleh pengguna dengan cara yang efisien. Gunakan informasi berikut untuk memantau performa kluster Kubernetes Anda dan pastikan kluster tersebut dikonfigurasi untuk performa maksimum.

Daftar periksa desain

  • Aktifkan pengumpulan metrik Prometheus untuk kluster Anda.
  • Aktifkan wawasan Kontainer untuk melacak performa kluster Anda.
  • Aktifkan pemberitahuan Prometheus yang direkomendasikan.

Rekomendasi konfigurasi

Rekomendasi Keuntungan
Aktifkan pengumpulan metrik Prometheus untuk kluster Anda. Prometheus adalah solusi metrik cloud-native dari Cloud Native Compute Foundation dan alat paling umum yang digunakan untuk mengumpulkan dan menganalisis data metrik dari kluster Kubernetes. Aktifkan Prometheus pada kluster Anda dengan layanan terkelola Azure Monitor untuk Prometheus jika Anda belum memiliki lingkungan Prometheus. Gunakan Azure Managed Grafana untuk menganalisis data Prometheus yang dikumpulkan.

Lihat Menyesuaikan pengikisan metrik Prometheus di layanan terkelola Azure Monitor untuk Prometheus untuk mengumpulkan metrik tambahan di luar konfigurasi default.
Aktifkan wawasan Kontainer untuk melacak performa kluster Anda. Saat mengaktifkan wawasan Kontainer untuk kluster Kubernetes, Anda dapat menggunakan tampilan dan buku kerja untuk melacak performa komponen kluster Anda. Data ini dapat tumpang tindih dengan data yang dikumpulkan oleh Prometheus. Lihat Pengoptimalan biaya untuk rekomendasi mengenai biaya.
Aktifkan pemberitahuan Prometheus yang direkomendasikan. Pemberitahuan di Azure Monitor secara proaktif memberi tahu Anda saat masalah terdeteksi. Mulailah dengan sekumpulan aturan pemberitahuan Prometheus yang direkomendasikan yang mendeteksi masalah ketersediaan dan performa paling umum dengan kluster Anda. Berpotensi menambahkan pemberitahuan pencarian log menggunakan data yang dikumpulkan oleh wawasan Kontainer.

Langkah selanjutnya