Memantau kluster Kubernetes menggunakan layanan Azure dan alat asli cloud

Artikel
09/14/2023

Artikel ini menjelaskan cara memantau kesehatan dan performa kluster Kubernetes Anda dan beban kerja yang berjalan di dalamnya menggunakan Azure Monitor dan layanan asli Azure dan cloud terkait. Ini termasuk kluster yang berjalan di Azure Kubernetes Service (AKS) atau cloud lain seperti AWS dan GCP. Serangkaian panduan yang berbeda disediakan untuk berbagai peran yang biasanya mengelola komponen unik yang membentuk lingkungan Kubernetes.

Penting

Artikel ini memberikan panduan lengkap tentang memantau berbagai lapisan lingkungan Kubernetes berdasarkan kluster Azure Kubernetes Service (AKS) atau Kubernetes di cloud lain. Jika Anda baru saja mulai menggunakan AKS atau Azure Monitor, lihat Memantau AKS untuk informasi dasar untuk mulai memantau kluster AKS.

Lapisan dan peran lingkungan Kubernetes

Berikut ini adalah ilustrasi model umum lingkungan Kubernetes yang khas, mulai dari lapisan infrastruktur hingga melalui aplikasi. Setiap lapisan memiliki persyaratan pemantauan berbeda yang ditangani oleh layanan yang berbeda dan biasanya dikelola oleh peran yang berbeda dalam organisasi.

Tanggung jawab atas berbagai lapisan lingkungan Kubernetes dan aplikasi yang bergantung padanya biasanya ditangani oleh beberapa peran. Tergantung pada ukuran organisasi Anda, peran ini dapat dilakukan oleh orang yang berbeda atau bahkan tim yang berbeda. Tabel berikut ini menjelaskan berbagai peran sementara bagian di bawah ini menyediakan skenario pemantauan yang biasanya akan ditemui masing-masing.

Peran	Deskripsi
Pengembang	Mengembangkan dan memelihara aplikasi yang berjalan pada kluster. Bertanggung jawab atas lalu lintas khusus aplikasi termasuk performa dan kegagalan aplikasi. Mempertahankan keandalan aplikasi sesuai dengan SLA.
Insinyur platform	Bertanggung jawab atas kluster Kubernetes. Menyediakan dan memelihara platform yang digunakan oleh pengembang.
Teknisi jaringan	Bertanggung jawab atas lalu lintas antara beban kerja dan ingress/egress apa pun dengan kluster. Menganalisis lalu lintas jaringan dan melakukan analisis ancaman.

Pemilihan alat pemantauan

Azure menyediakan serangkaian layanan lengkap berdasarkan Azure Monitor untuk memantau kesehatan dan performa berbagai lapisan infrastruktur Kubernetes Anda dan aplikasi yang bergantung padanya. Layanan ini bekerja bersama satu sama lain untuk memberikan solusi pemantauan lengkap dan direkomendasikan baik untuk AKS maupun kluster Kubernetes Anda yang berjalan di cloud lain. Anda mungkin memiliki investasi yang ada dalam teknologi asli cloud yang didukung oleh Cloud Native Computing Foundation, dalam hal ini Anda dapat memilih untuk mengintegrasikan alat Azure ke lingkungan Anda yang ada.

Pilihan alat mana yang akan disebarkan dan konfigurasinya akan bergantung pada persyaratan lingkungan khusus Anda. Misalnya, Anda dapat menggunakan penawaran terkelola di Azure untuk Prometheus dan Grafana, atau Anda dapat memilih untuk menggunakan penginstalan yang ada dari alat-alat ini dengan kluster Kubernetes Anda di Azure. Organisasi Anda juga dapat menggunakan alat alternatif untuk wawasan Kontainer untuk mengumpulkan dan menganalisis log Kubernetes, seperti Splunk atau Datadog.

Penting

Memantau lingkungan yang kompleks seperti Kubernetes melibatkan pengumpulan sejumlah besar telemetri, yang sebagian besar menimbulkan biaya. Anda harus mengumpulkan data yang cukup untuk memenuhi kebutuhan Anda. Ini termasuk jumlah data yang dikumpulkan, frekuensi pengumpulan, dan periode retensi. Jika Anda sangat sadar biaya, Anda dapat memilih untuk menerapkan subset fungsionalitas penuh untuk mengurangi pengeluaran pemantauan Anda.

Teknisi jaringan

Teknisi Jaringan bertanggung jawab atas lalu lintas antara beban kerja dan ingress/egress apa pun dengan kluster. Mereka menganalisis lalu lintas jaringan dan melakukan analisis ancaman.

Layanan Azure untuk administrator jaringan

Tabel berikut mencantumkan layanan yang umum digunakan oleh teknisi jaringan untuk memantau kesehatan dan performa jaringan yang mendukung kluster Kubernetes.

Layanan	Deskripsi
Network Watcher	Rangkaian alat di Azure untuk memantau jaringan virtual yang digunakan oleh kluster Kubernetes Anda dan mendiagnosis masalah yang terdeteksi.
Analitik lalu lintas	Fitur Network Watcher yang menganalisis log alur untuk memberikan wawasan tentang arus lalu lintas.
Wawasan jaringan	Fitur Azure Monitor yang mencakup representasi visual performa dan kesehatan komponen jaringan yang berbeda dan menyediakan akses ke alat pemantauan jaringan yang merupakan bagian dari Network Watcher.

Wawasan jaringan diaktifkan secara default dan tidak memerlukan konfigurasi. Network Watcher juga biasanya diaktifkan secara default di setiap wilayah Azure.

Memantau tingkat 1 - Jaringan

Berikut ini adalah skenario umum untuk memantau jaringan.

Buat log alur untuk mencatat informasi tentang lalu lintas IP yang mengalir melalui grup keamanan jaringan yang digunakan oleh kluster Anda lalu gunakan analitik lalu lintas untuk menganalisis dan memberikan wawasan tentang data ini. Kemungkinan besar Anda akan menggunakan ruang kerja Analitik Log yang sama untuk analitik lalu lintas yang Anda gunakan untuk wawasan Kontainer dan log sarana kontrol Anda.
Dengan menggunakan analitik lalu lintas, Anda dapat menentukan apakah ada lalu lintas yang mengalir baik ke atau dari port tak terduga yang digunakan oleh kluster dan juga jika ada lalu lintas yang mengalir melalui IP publik yang seharusnya tidak diekspos. Gunakan informasi ini untuk menentukan apakah aturan jaringan Anda memerlukan modifikasi.
Untuk kluster AKS, gunakan add-on Network Observability untuk AKS (pratinjau) untuk memantau dan mengamati akses antar layanan dalam kluster (lalu lintas timur-barat).

Insinyur platform

Insinyur platform, juga dikenal sebagai administrator kluster, bertanggung jawab atas kluster Kubernetes itu sendiri. Mereka menyediakan dan memelihara platform yang digunakan oleh pengembang. Mereka perlu memahami kesehatan kluster dan komponennya, dan dapat memecahkan masalah yang terdeteksi. Mereka juga perlu memahami biaya untuk mengoperasikan kluster dan berpotensi untuk dapat mengalokasikan biaya ke tim yang berbeda.

Organisasi besar mungkin juga memiliki arsitek armada, yang mirip dengan insinyur platform tetapi bertanggung jawab atas beberapa kluster. Mereka membutuhkan visibilitas di seluruh lingkungan dan harus melakukan tugas administratif dalam skala besar. Rekomendasi dalam skala besar disertakan dalam panduan di bawah ini. Lihat Apa itu Azure Kubernetes Fleet Manager (pratinjau)? untuk detail tentang membuat sumber daya Armada untuk skenario multi-kluster dan dalam skala besar.

Layanan Azure untuk insinyur platform

Tabel berikut mencantumkan layanan Azure bagi teknisi platform untuk memantau kesehatan dan performa kluster Kubernetes dan komponennya.

Layanan	Deskripsi
Wawasan Kontainer	Layanan Azure untuk kluster Kubernetes dengan dukungan AKS dan Azure Arc yang menggunakan versi kontainer agen Azure Monitor untuk mengumpulkan log stdout/stderr, metrik performa, dan peristiwa Kubernetes dari setiap simpul di kluster Anda. Ini juga mengumpulkan metrik dari sarana kontrol Kubernetes dan menyimpannya di ruang kerja. Anda dapat menampilkan data di portal Azure atau mengkuerinya menggunakan Analitik Log.
Layanan terkelola Azure Monitor untuk Prometheus	Prometheus adalah solusi metrik cloud-native dari Cloud Native Compute Foundation dan alat paling umum yang digunakan untuk mengumpulkan dan menganalisis data metrik dari kluster Kubernetes. Layanan terkelola Azure Monitor untuk Prometheus adalah solusi terkelola penuh yang kompatibel dengan bahasa kueri Prometheus (PromQL) dan pemberitahuan Prometheus dan terintegrasi dengan Azure Managed Grafana untuk visualisasi. Layanan ini mendukung investasi Anda dalam alat sumber terbuka tanpa kompleksitas mengelola lingkungan Prometheus Anda sendiri.
Kubernetes berkemampuan Azure Arc	Memungkinkan Anda untuk melampirkan ke kluster Kubernetes yang berjalan di cloud lain sehingga Anda dapat mengelola dan mengonfigurasinya di Azure. Dengan agen Arc yang diinstal, Anda dapat memantau kluster AKS dan hibrid bersama-sama menggunakan metode dan alat yang sama, termasuk wawasan Kontainer dan Prometheus.
Azure Managed Grafana	Implementasi Grafana yang dikelola sepenuhnya, yang merupakan platform visualisasi data sumber terbuka yang umumnya digunakan untuk menyajikan Prometheus dan data lainnya. Beberapa dasbor Grafana yang telah ditentukan tersedia untuk memantau Kubernetes dan pemecahan masalah tumpukan penuh.

Mengonfigurasi pemantauan untuk insinyur platform

Bagian di bawah ini mengidentifikasi langkah-langkah untuk pemantauan lengkap lingkungan Kubernetes Anda menggunakan layanan Azure dalam tabel di atas. Fungsionalitas dan opsi integrasi disediakan untuk masing-masing untuk membantu Anda menentukan di mana Anda mungkin perlu memodifikasi konfigurasi ini untuk memenuhi persyaratan khusus Anda.

Mengaktifkan pengikisan metrik Prometheus

Penting

Untuk menggunakan layanan terkelola Azure Monitor untuk Prometheus, Anda harus memiliki ruang kerja Azure Monitor. Untuk informasi tentang pertimbangan desain untuk konfigurasi ruang kerja, lihat Arsitektur ruang kerja Azure Monitor.

Aktifkan pengikisan metrik Prometheus oleh layanan terkelola Azure Monitor untuk Prometheus dari kluster Anda menggunakan salah satu metode berikut:

Pilih opsi Aktifkan metrik Prometheus saat Anda membuat kluster AKS.
Pilih opsi Aktifkan metrik Prometheus saat Anda mengaktifkan wawasan Kontainer pada kluster AKS yang ada atau kluster Kubernetes dengan dukungan Azure Arc.
Aktifkan untuk kluster AKS yang ada atau kluster Kubernetes berkemampuan Arc (pratinjau).

Jika Anda sudah memiliki lingkungan Prometheus yang ingin Anda gunakan untuk kluster AKS Anda, aktifkan layanan terkelola Azure Monitor untuk Prometheus lalu gunakan tulis jarak jauh untuk mengirim data ke lingkungan Prometheus yang ada. Anda juga dapat menggunakan tulis jarak jauh untuk mengirim data dari lingkungan Prometheus yang dikelola sendiri yang ada ke layanan terkelola Azure Monitor untuk Prometheus.

Lihat Konfigurasi metrik Prometheus default di Azure Monitor untuk detail tentang metrik yang dikumpulkan secara default dan frekuensi pengumpulannya. Jika Anda ingin menyesuaikan konfigurasi, lihat Menyesuaikan pengikisan metrik Prometheus di layanan terkelola Azure Monitor untuk Prometheus.

Mengaktifkan Grafana untuk analisis data Prometheus

Buat instans Managed Grafana dan tautkan ke ruang kerja Azure Monitor sehingga Anda dapat menggunakan data Prometheus anda sebagai sumber data. Anda juga dapat melakukan konfigurasi ini secara manual menggunakan tambahkan layanan terkelola Azure Monitor untuk Prometheus sebagai sumber data. Berbagai dasbor bawaan tersedia untuk memantau kluster Kubernetes termasuk beberapa yang menyajikan informasi serupa seperti tampilan wawasan Kontainer.

Jika Anda memiliki lingkungan Grafana yang sudah ada, maka Anda dapat terus menggunakannya dan menambahkan layanan terkelola Azure Monitor untuk Prometheus sebagai sumber data. Anda juga dapat menambahkan sumber data Azure Monitor ke Grafana untuk menggunakan data yang dikumpulkan oleh wawasan Kontainer di dasbor Grafana kustom. Lakukan konfigurasi ini jika Anda ingin fokus pada dasbor Grafana daripada menggunakan tampilan dan laporan wawasan Kontainer.

Mengaktifkan Container Insights untuk pengumpulan log

Saat Anda mengaktifkan Container Insights untuk kluster Kubernetes, kontainer ini menyebarkan versi kontainer agen Azure Monitor yang mengirim data ke ruang kerja Analitik Log di Azure Monitor. Wawasan kontainer mengumpulkan stdout/stderr kontainer, log infrastruktur, dan data performa. Semua data log disimpan di ruang kerja Analitik Log tempat data dapat dianalisis menggunakan Bahasa Kueri Kusto (KQL).

Lihat Mengaktifkan wawasan Kontainer untuk prasyarat dan opsi konfigurasi untuk onboarding kluster Kubernetes Anda. Onboard menggunakan Azure Policy untuk memastikan bahwa semua kluster mempertahankan konfigurasi yang konsisten.

Setelah wawasan Kontainer diaktifkan untuk kluster, lakukan tindakan berikut untuk mengoptimalkan penginstalan Anda.

Wawasan kontainer mengumpulkan banyak nilai metrik yang sama dengan Prometheus. Anda dapat menonaktifkan pengumpulan metrik ini dengan mengonfigurasi wawasan Kontainer untuk hanya mengumpulkan Log dan peristiwa seperti yang dijelaskan dalam Mengaktifkan pengaturan pengoptimalan biaya dalam wawasan Kontainer. Konfigurasi ini menonaktifkan pengalaman wawasan Kontainer di portal Azure, tetapi Anda dapat menggunakan Grafana untuk memvisualisasikan metrik Prometheus dan Analitik Log untuk menganalisis data log yang dikumpulkan oleh wawasan Kontainer.
Kurangi biaya Anda untuk penyerapan data wawasan Kontainer dengan mengurangi jumlah data yang dikumpulkan.
Untuk meningkatkan pengalaman kueri Anda dengan data yang dikumpulkan oleh wawasan Kontainer dan untuk mengurangi biaya pengumpulan, aktifkan skema ContainerLogV2 untuk setiap kluster. Jika Anda hanya menggunakan log untuk pemecahan masalah sesekali, pertimbangkan untuk mengonfigurasi tabel ini sebagai log dasar.

Jika Anda memiliki solusi yang sudah ada untuk pengumpulan log, ikuti panduan untuk alat tersebut atau aktifkan wawasan Kontainer dan gunakan fitur ekspor data ruang kerja Analitik Log untuk mengirim data ke Azure Event Hubs untuk meneruskan ke sistem alternatif.

Mengumpulkan log sarana kontrol untuk kluster AKS

Log untuk komponen sarana kontrol AKS diimplementasikan di Azure sebagai log sumber daya. Container Insights tidak menggunakan log ini, jadi Anda perlu membuat kueri log Anda sendiri untuk melihat dan menganalisisnya. Untuk detail tentang struktur dan kueri log, lihat Cara mengkueri log dari Container Insights.

Buat pengaturan diagnostik untuk setiap kluster AKS untuk mengirim log sumber daya ke ruang kerja Analitik Log. Gunakan Azure Policy untuk memastikan konfigurasi yang konsisten di beberapa kluster.

Ada biaya untuk mengirim log sumber daya ke ruang kerja, jadi Anda hanya boleh mengumpulkan kategori log yang ingin Anda gunakan. Untuk deskripsi kategori yang tersedia untuk AKS, lihat Log sumber daya. Mulailah dengan mengumpulkan jumlah kategori minimal dan kemudian ubah pengaturan diagnostik untuk mengumpulkan kategori tambahan selagi kebutuhan Anda meningkat dan saat Anda memahami biaya terkait. Anda dapat mengirim log ke akun penyimpanan Azure untuk mengurangi biaya jika Anda perlu menyimpan informasi karena alasan kepatuhan. Untuk detail tentang biaya penyerapan dan penyimpanan data log, lihat Detail harga Log Azure Monitor.

Jika Anda tidak yakin log sumber daya mana yang awalnya akan diaktifkan, gunakan rekomendasi berikut, yang didasarkan pada persyaratan pelanggan yang paling umum. Anda dapat mengaktifkan kategori lain nanti jika perlu.

Kategori	Aktifkan?	Tujuan
kube-apiserver	Aktifkan	Ruang kerja Analitik Log
kube-audit	Aktifkan	Penyimpanan Azure. Hal ini menjaga biaya seminimal mungkin namun mempertahankan log audit jika diperlukan oleh auditor.
kube-audit-admin	Aktifkan	Ruang kerja Analitik Log
kube-controller-manager	Aktifkan	Ruang kerja Analitik Log
penjadwal kube	Nonaktifkan
cluster-autoscaler	Aktifkan jika skala otomatis diaktifkan	Ruang kerja Analitik Log
penjaga	Aktifkan jika ID Microsoft Entra diaktifkan	Ruang kerja Analitik Log
SemuaMetrics	Nonaktifkan karena metrik dikumpulkan di Prometheus Terkelola	Ruang kerja Analitik Log

Jika Anda memiliki solusi yang sudah ada untuk pengumpulan log, ikuti panduan untuk alat tersebut atau aktifkan wawasan Kontainer dan gunakan fitur ekspor data ruang kerja Analitik Log untuk mengirim data ke hub peristiwa Azure untuk diteruskan ke sistem alternatif.

Mengumpulkan log Aktivitas untuk kluster AKS

Perubahan konfigurasi pada kluster AKS Anda disimpan di log Aktivitas. Buat pengaturan diagnostik untuk mengirim data ini ke ruang kerja Analitik Log Anda untuk menganalisisnya dengan data pemantauan lainnya. Tidak ada biaya untuk pengumpulan data ini, dan Anda dapat menganalisis atau memperingatkan data menggunakan Analitik Log.

Memantau tingkat 2 - Komponen tingkat kluster

Tingkat kluster mencakup komponen berikut:

Komponen	Persyaratan pemantauan
Simpul	Pahami status kesiapan dan performa penggunaan CPU, memori, disk, dan IP untuk setiap simpul dan pantau tren penggunaannya secara proaktif sebelum menyebarkan beban kerja apa pun.

Berikut ini adalah skenario umum untuk memantau komponen tingkat kluster.

Wawasan Kontainer

Gunakan tampilan Kluster untuk melihat performa simpul di kluster Anda, termasuk pemanfaatan CPU dan memori.
Gunakan tampilan Node untuk melihat kesehatan setiap simpul dan kesehatan serta performa pod yang berjalan di dalamnya. Untuk informasi selengkapnya tentang menganalisis kesehatan dan performa simpul, lihat Memantau performa kluster Kubernetes Anda dengan Container Insights.
Di bawah Laporan, gunakan buku kerja Pemantauan Simpul untuk menganalisis kapasitas disk, IO disk, dan penggunaan GPU. Untuk informasi selengkapnya tentang buku kerja ini, lihat Buku kerja Pemantauan Simpul.
Di bawah Pemantauan, pilih Buku Kerja, lalu Penggunaan IP Subnet untuk melihat alokasi IP dan penugasan pada setiap simpul untuk rentang waktu yang dipilih.

Dasbor Grafana

Gunakan dasbor bawaan di Managed Grafana untuk Kubelet untuk melihat kesehatan dan performa masing-masing.
Gunakan dasbor Grafana dengan nilai metrik Prometheus yang terkait dengan disk seperti node_disk_io_time_seconds_total dan windows_logical_disk_free_bytes untuk memantau penyimpanan yang terpasang.
Beberapa dasbor Kubernetes tersedia yang memvisualisasikan performa dan kesehatan node Anda berdasarkan data yang disimpan di Prometheus.

Log Analytics

Pilih kategori Kontainer dalam dialog kueri untuk ruang kerja Analitik Log Anda untuk mengakses kueri log bawaan untuk kluster Anda, termasuk kueri log inventaris Gambar yang mengambil data dari tabel ContainerImageInventory yang diisi oleh wawasan Kontainer.

Pemecahan Masalah

Untuk skenario pemecahan masalah, Anda mungkin perlu mengakses simpul secara langsung untuk pemeliharaan atau pengumpulan log segera. Untuk tujuan keamanan, simpul AKS tidak terekspos ke internet tetapi Anda dapat menggunakan kubectl debug perintah untuk SSH ke simpul AKS. Untuk informasi selengkapnya tentang proses ini, lihat Terhubung dengan SSH ke node kluster Azure Kubernetes Service (AKS) untuk pemeliharaan atau pemecahan masalah.

Analisis biaya

Konfigurasikan OpenCost, yang merupakan proyek sandbox CNCF sumber terbuka dan netral vendor untuk memahami biaya Kubernetes Anda, untuk mendukung analisis biaya kluster Anda. Ini mengekspor data biaya terperinci ke penyimpanan Azure.
Gunakan data dari OpenCost untuk memecah penggunaan relatif kluster oleh tim yang berbeda di organisasi Anda sehingga Anda dapat mengalokasikan biaya di antara masing-masing kluster.
Gunakan data dari OpenCost untuk memastikan bahwa kluster menggunakan kapasitas penuh simpulnya dengan mengemas beban kerja dengan padat, menggunakan lebih sedikit simpul besar dibandingkan dengan banyak simpul yang lebih kecil.

Memantau tingkat 3 - Komponen Kubernetes Terkelola

Tingkat Kubernetes terkelola mencakup komponen berikut:

Komponen	Pemantauan
Server API	Pantau status server API dan identifikasi peningkatan beban permintaan dan hambatan jika layanan tidak berfungsi.
Kubelet	Pantau Kubelet untuk membantu memecahkan masalah manajemen pod, pod tidak dimulai, simpul tidak siap, atau pod dimatikan.

Berikut ini adalah skenario umum untuk memantau komponen Kubernetes terkelola Anda.

Wawasan Kontainer

Di bawah Pemantauan, pilih Metrik untuk melihat penghitung Permintaan Dalam Penerbangan.
Di bawah Laporan, gunakan buku kerja Kubelet untuk melihat kesehatan dan performa setiap kubelet. Untuk informasi selengkapnya tentang buku kerja ini, lihat Buku kerja Pemantauan Sumber Daya.

Grafana

Gunakan dasbor bawaan di Managed Grafana untuk Kubelet guna melihat kesehatan dan performa setiap kubelet.
Gunakan dasbor seperti apiserver Kubernetes untuk tampilan lengkap performa server API. Hal ini mencakup nilai-nilai seperti latensi permintaan dan waktu pemrosesan antrean kerja.

Log Analytics

Gunakan kueri log dengan log sumber daya untuk menganalisis log sarana kontrol yang dihasilkan oleh komponen AKS.
Setiap aktivitas konfigurasi untuk AKS dicatat di log Aktivitas. Saat mengirim log Aktivitas ke ruang kerja Analitik Log, Anda dapat menganalisisnya dengan Analitik Log. Misalnya, kueri sampel berikut dapat digunakan untuk mengembalikan rekaman yang mengidentifikasi peningkatan yang berhasil di semua kluster AKS Anda.
```
AzureActivity
| where CategoryValue == "Administrative"
| where OperationNameValue == "MICROSOFT.CONTAINERSERVICE/MANAGEDCLUSTERS/WRITE"
| extend properties=parse_json(Properties_d) 
| where properties.message == "Upgrade Succeeded"
| order by TimeGenerated desc
```

Pemecahan Masalah

Untuk skenario pemecahan masalah, Anda dapat mengakses log kubelet menggunakan proses yang dijelaskan di Mendapatkan log kubelet dari node kluster Azure Kubernetes Service (AKS).

Memantau tingkat 4 - Objek dan beban kerja Kubernetes

Tingkat objek dan beban kerja Kube mencakup komponen berikut:

Komponen	Persyaratan pemantauan
Penyebaran	Pantau status penyebaran yang sebenarnya vs yang diinginkan serta status dan pemanfaatan sumber daya pod yang berjalan di dalamnya.
Pod	Pantau status dan pemanfaatan sumber daya, termasuk CPU dan memori pod yang berjalan dalam kluster AKS Anda.
Kontainer	Pantau pemanfaatan sumber daya, termasuk CPU dan memori, kontainer yang berjalan di kluster AKS Anda.

Berikut ini adalah skenario umum untuk memantau objek dan beban kerja Kubernetes Anda.

Wawasan Kontainer

Gunakan tampilan Simpul dan Pengontrol untuk melihat kesehatan dan performa pod yang berjalan di atasnya dan telusuri paling detail kesehatan dan performa kontainernya.
Gunakan tampilan Kontainer untuk melihat kesehatan dan performa untuk kontainer. Untuk informasi selengkapnya tentang menganalisis kesehatan dan performa kontainer, lihat Memantau performa kluster Kubernetes Anda dengan Container Insights.
Di bawah Laporan, gunakan buku kerja Penyebaran untuk melihat metrik penyebaran. Untuk informasi selengkapnya, lihat Penyebaran & metrik HPA dengan Container Insights.

Dasbor Grafana

Gunakan dasbor bawaan di Managed Grafana untuk Node dan Pod untuk melihat kesehatan dan performanya.
Beberapa dasbor Kubernetes tersedia yang memvisualisasikan performa dan kesehatan node Anda berdasarkan data yang disimpan di Prometheus.

Data langsung

Dalam skenario pemecahan masalah, Container Insights menyediakan akses ke log kontainer AKS langsung (stdout/stderror), peristiwa, dan metrik pod. Untuk informasi selengkapnya tentang fitur ini, lihat Cara melihat log, peristiwa, dan metrik pod Kube secara real time.

Pemberitahuan untuk insinyur platform

Pemberitahuan di Azure Monitor secara proaktif memberi tahu Anda tentang data dan pola yang menarik dalam data pemantauan Anda. Pemberitahuan ini memungkinkan Anda mengidentifikasi dan mengatasi masalah dalam sistem Anda sebelum pelanggan Anda mengetahuinya. Jika Anda memiliki solusi ITSM yang sudah ada untuk pemberitahuan, Anda dapat mengintegrasikannya dengan Azure Monitor. Anda juga dapat mengekspor data ruang kerja untuk mengirim data dari ruang kerja Analitik Log ke lokasi lain yang mendukung solusi pemberitahuan Anda saat ini.

Jenis pemberitahuan

Tabel berikut ini menjelaskan berbagai jenis aturan pemberitahuan kustom yang bisa Anda buat berdasarkan data yang dikumpulkan oleh layanan yang dijelaskan di atas.

Jenis pemberitahuan	Deskripsi
Pemberitahuan Prometheus	Pemberitahuan Prometheus ditulis dalam Prometheus Query Language (Prom QL) dan diterapkan pada metrik Prometheus yang disimpan di layanan terkelola Azure Monitor untuk Prometheus. Pemberitahuan yang direkomendasikan sudah menyertakan pemberitahuan Prometheus yang paling umum, dan Anda dapat membuat aturan pemberitahuan tambahan sesuai kebutuhan.
Aturan pemberitahuan metrik	Aturan pemberitahuan metrik menggunakan nilai metrik yang sama dengan penjelajah Metrik. Bahkan, Anda dapat membuat aturan pemberitahuan langsung dari penjelajah metrik dengan data yang saat ini Anda analisis. Aturan pemberitahuan metrik dapat berguna untuk memperingatkan performa AKS menggunakan salah satu nilai dalam metrik referensi data AKS.
Aturan pemberitahuan pencarian log	Gunakan aturan pemberitahuan pencarian log untuk menghasilkan pemberitahuan dari hasil kueri log. Untuk informasi selengkapnya, lihat Cara membuat pemberitahuan pencarian log dari Container Insights dan Cara mengkueri log dari Container Insights.

Pemberitahuan yang direkomendasikan

Mulailah dengan serangkaian pemberitahuan Prometheus yang direkomendasikan dari aturan pemberitahuan Metrik dalam wawasan Kontainer (pratinjau) yang mencakup kondisi pemberitahuan paling umum untuk kluster Kubernetes. Anda dapat menambahkan lebih banyak aturan pemberitahuan nanti saat mengidentifikasi kondisi pemberitahuan tambahan.

Pengembang

Selain mengembangkan aplikasi, pengembang mempertahankan aplikasi yang berjalan pada kluster. Mereka bertanggung jawab atas lalu lintas khusus aplikasi termasuk performa dan kegagalan aplikasi dan menjaga keandalan aplikasi sesuai dengan SLA yang ditentukan perusahaan.

Layanan Azure untuk pengembang

Tabel berikut mencantumkan layanan yang umumnya digunakan oleh pengembang untuk memantau kesehatan dan performa aplikasi yang berjalan pada kluster.

Layanan	Deskripsi
Application Insights	Fitur Azure Monitor yang menyediakan pemantauan performa aplikasi (APM) untuk memantau aplikasi yang berjalan pada kluster Kubernetes Anda dari pengembangan, melalui pengujian, dan ke dalam produksi. Identifikasi dan mitigasi masalah latensi dan keandalan dengan cepat menggunakan jejak terdistribusi. Mendukung OpenTelemetry untuk instrumentasi vendor-netral.

Lihat Dasar-Dasar Pengumpulan Data Azure Monitor Application Insights untuk opsi tentang mengonfigurasi pengumpulan data dari aplikasi yang berjalan pada kluster Anda dan kriteria keputusan tentang metode terbaik untuk persyaratan khusus Anda.

Monitor tingkat 5 - Aplikasi

Berikut ini adalah skenario umum untuk memantau aplikasi Anda.

Performa aplikasi

Gunakan tampilan Performa di Application insights untuk melihat performa operasi yang berbeda di aplikasi Anda.
Gunakan Profiler untuk mengambil dan melihat jejak performa untuk aplikasi Anda.
Gunakan Peta Aplikasi untuk melihat dependensi antara komponen aplikasi Anda dan mengidentifikasi hambatan apa pun.
Aktifkan pelacakan terdistribusi, yang menyediakan profiler performa yang berfungsi seperti tumpukan panggilan untuk arsitektur cloud dan layanan mikro, untuk mendapatkan pengamatan yang lebih baik ke dalam interaksi antar layanan.

Kegagalan aplikasi

Gunakan tab Kegagalan dari Application insights untuk melihat jumlah permintaan yang gagal dan pengecualian yang paling umum.
Pastikan bahwa pemberitahuan untuk anomali kegagalan yang diidentifikasi dengan deteksi pintar dikonfigurasi dengan benar.

Pemantauan kesehatan

Buat uji Ketersediaan di Application insights untuk membuat pengujian berulang untuk memantau ketersediaan dan responsivitas aplikasi Anda.
Gunakan laporan SLA untuk menghitung dan melaporkan SLA untuk pengujian web.
Gunakan anotasi untuk mengidentifikasi kapan build baru disebarkan sehingga Anda dapat memeriksa perubahan performa secara visual setelah pembaruan.

Log aplikasi

Wawasan kontainer mengirimkan log stdout/stderr ke ruang kerja Analitik Log. Lihat Log sumber daya untuk deskripsi log dan Layanan Kubernetes yang berbeda untuk daftar tabel yang dikirim masing-masing.

Jala layanan

Untuk kluster AKS, sebarkan add-on jala layanan berbasis Istio yang memberikan pengamatan pada arsitektur layanan mikro Anda. Istio adalah jala layanan sumber terbuka yang berlapis secara transparan ke aplikasi terdistribusi yang ada. Add-on membantu dalam penyebaran dan manajemen Istio untuk AKS.

Lihat juga

Lihat Memantau AKS untuk panduan tentang pemantauan khusus untuk Azure Kubernetes Service (AKS).

Bagikan melalui

Memantau kluster Kubernetes menggunakan layanan Azure dan alat asli cloud

Lapisan dan peran lingkungan Kubernetes

Pemilihan alat pemantauan

Teknisi jaringan

Layanan Azure untuk administrator jaringan

Memantau tingkat 1 - Jaringan

Insinyur platform

Layanan Azure untuk insinyur platform

Mengonfigurasi pemantauan untuk insinyur platform

Mengaktifkan pengikisan metrik Prometheus

Mengaktifkan Grafana untuk analisis data Prometheus

Mengaktifkan Container Insights untuk pengumpulan log

Mengumpulkan log sarana kontrol untuk kluster AKS

Mengumpulkan log Aktivitas untuk kluster AKS

Memantau tingkat 2 - Komponen tingkat kluster

Memantau tingkat 3 - Komponen Kubernetes Terkelola

Memantau tingkat 4 - Objek dan beban kerja Kubernetes

Pemberitahuan untuk insinyur platform

Jenis pemberitahuan

Pemberitahuan yang direkomendasikan

Pengembang

Layanan Azure untuk pengembang

Monitor tingkat 5 - Aplikasi

Lihat juga

Saran dan Komentar

Saran dan Komentar

Sumber Daya Tambahan: