Monitorowanie usługi Azure Kubernetes Service (AKS)

Gdy masz aplikacje o krytycznym znaczeniu i procesy biznesowe, które opierają się na zasobach platformy Azure, chcesz monitorować te zasoby pod kątem ich dostępności, wydajności i działania. W tym artykule opisano dane monitorowania generowane przez usługę AKS i analizowane za pomocą usługi Azure Monitor. Jeśli nie znasz funkcji usługi Azure Monitor wspólnych dla wszystkich usług platformy Azure, które z niej korzystają, zapoznaj się z tematem Monitorowanie zasobów platformy Azure za pomocą usługi Azure Monitor.

Ważne

Kubernetes to złożony system rozproszony z wieloma ruchomymi częściami, dlatego wymagane jest monitorowanie na wielu poziomach. Mimo że usługa AKS jest zarządzaną usługą Kubernetes, ta sama rygor monitorowania na wielu poziomach jest nadal wymagana. Ten artykuł zawiera ogólne informacje i najlepsze rozwiązania dotyczące monitorowania klastra usługi AKS. Aby uzyskać dodatkowe informacje, zobacz następujące informacje.

Dane monitorowania

Usługa AKS generuje te same rodzaje danych monitorowania co inne zasoby platformy Azure opisane w temacie Monitorowanie danych z zasobów platformy Azure. Szczegółowe informacje na temat metryk i dzienników utworzonych przez usługę AKS można znaleźć w temacie Monitoring AKS data reference (Monitorowanie danych usługi AKS). Inne usługi i funkcje platformy Azure zbierają inne dane i włączają inne opcje analizy, jak pokazano na poniższym diagramie i w poniższej tabeli.

Diagram of collection of monitoring data from AKS.

Lokalizacja źródłowa opis
Metryki platformy Metryki platformy są automatycznie zbierane dla klastrów usługi AKS bez ponoszenia kosztów. Możesz przeanalizować te metryki za pomocą Eksploratora metryk lub użyć ich do alertów dotyczących metryk.
Metryki rozwiązania Prometheus Po włączeniu złomowania metryk dla klastra metryki Prometheus są zbierane przez usługę zarządzaną Azure Monitor dla rozwiązania Prometheus i przechowywane w obszarze roboczym usługi Azure Monitor. Analizowanie ich za pomocą wstępnie utworzonych pulpitów nawigacyjnych w narzędziu Azure Managed Grafana i alertówrozwiązania Prometheus.
Dzienniki aktywności Dziennik aktywności jest zbierany automatycznie dla klastrów usługi AKS bez ponoszenia kosztów. Te dzienniki śledzą informacje, takie jak po utworzeniu klastra lub zmianie konfiguracji. Wyślij dziennik aktywności do obszaru roboczego usługi Log Analytics, aby przeanalizować go przy użyciu innych danych dziennika.
Dzienniki zasobów Dzienniki płaszczyzny sterowania dla usługi AKS są implementowane jako dzienniki zasobów. Utwórz ustawienie diagnostyczne, aby wysłać je do obszaru roboczego usługi Log Analytics, w którym można analizować je i powiadamiać za pomocą zapytań dzienników w usłudze Log Analytics.
Analizy kontenerów Usługa Container Insights zbiera różne dzienniki i dane wydajności z klastra, w tym strumieni stdout/stderr i przechowuje je w obszarze roboczym usługi Log Analytics i metrykach usługi Azure Monitor. Przeanalizuj te dane za pomocą widoków i skoroszytów zawartych w usłudze Container Insights lub za pomocą usługi Log Analytics i eksploratora metryk.

Strona przeglądu monitorowania w witrynie Azure Portal

Karta Monitorowanie na stronie Przegląd umożliwia szybkie rozpoczęcie przeglądania danych monitorowania w witrynie Azure Portal dla każdego klastra usługi AKS. Obejmuje to wykresy z typowymi metrykami dla klastra oddzielonego pulą węzłów. Kliknij dowolny z tych wykresów, aby dokładniej przeanalizować dane w Eksploratorze metryk.

Strona Przegląd zawiera również linki do zarządzanego rozwiązania Prometheus i szczegółowych informacji o kontenerze dla bieżącego klastra. Jeśli te narzędzia nie zostały jeszcze włączone, zostanie wyświetlony monit o wykonanie tej czynności. W górnej części ekranu może również zostać wyświetlony baner z zaleceniem włączenia innych funkcji w celu ulepszenia monitorowania klastra.

Screenshot of AKS overview page.

Napiwek

Dostęp do funkcji monitorowania dla wszystkich klastrów usługi AKS w ramach subskrypcji z menu Monitorowanie w witrynie Azure Portal lub dla pojedynczego klastra usługi AKS z sekcji Monitorowanie menu usług Kubernetes.

Integracje

Następujące usługi i funkcje platformy Azure usługi Azure Monitor mogą służyć do dodatkowego monitorowania klastrów Kubernetes. Te funkcje można włączyć podczas tworzenia klastra usługi AKS na karcie Integracje w witrynie Azure Portal, interfejsie wiersza polecenia platformy Azure, narzędziu Terraform, usłudze Azure Policy lub dołączeniu klastra do nich później. Każda z tych funkcji może wiązać się z kosztami, dlatego przed ich włączeniem zapoznaj się z informacjami o cenach dla każdej z nich.

Usługa/funkcja opis
Szczegółowe informacje o kontenerze Używa konteneryzowanej wersji agenta usługi Azure Monitor do zbierania dzienników stdout/stderr i zdarzeń Kubernetes z każdego węzła w klastrze, obsługując różne scenariusze monitorowania klastrów usługi AKS. Monitorowanie klastra usługi AKS można włączyć podczas jego tworzenia przy użyciu interfejsu wiersza polecenia platformy Azure, usługi Azure Policy, witryny Azure Portal lub narzędzia Terraform. Jeśli nie włączysz usługi Container Insights podczas tworzenia klastra, zobacz Włączanie szczegółowych informacji o kontenerze dla klastra usługi Azure Kubernetes Service (AKS), aby uzyskać inne opcje jego włączenia.

Usługa Container Insights przechowuje większość swoich danych w obszarze roboczym usługi Log Analytics i zazwyczaj używa tego samego obszaru roboczego usługi Log Analytics co dzienniki zasobów klastra. Zobacz Projektowanie architektury obszaru roboczego usługi Log Analytics, aby uzyskać wskazówki dotyczące liczby obszarów roboczych, których należy używać i gdzie je zlokalizować.
Usługa zarządzana usługi Azure Monitor dla rozwiązania Prometheus Prometheus to natywne dla chmury rozwiązanie metryk z natywnej bazy danych obliczeniowych w chmurze i najbardziej typowe narzędzie używane do zbierania i analizowania danych metryk z klastrów Kubernetes. Usługa zarządzana usługi Azure Monitor dla rozwiązania Prometheus to w pełni zarządzane rozwiązanie do monitorowania zgodnego z rozwiązaniem Prometheus na platformie Azure. Jeśli nie włączysz zarządzanego rozwiązania Prometheus podczas tworzenia klastra, zobacz Zbieranie metryk rozwiązania Prometheus z klastra usługi AKS, aby uzyskać inne opcje, aby je włączyć.

Usługa zarządzana usługi Azure Monitor dla rozwiązania Prometheus przechowuje swoje dane w obszarze roboczym usługi Azure Monitor połączonym z obszarem roboczym Grafana, dzięki czemu można analizować dane za pomocą usługi Azure Managed Grafana.
Azure Managed Grafana W pełni zarządzana implementacja narzędzia Grafana, która jest platformą wizualizacji danych typu open source, często używaną do prezentowania danych Rozwiązania Prometheus. Do monitorowania platformy Kubernetes i rozwiązywania problemów z pełnym stosem jest dostępnych wiele wstępnie zdefiniowanych pulpitów nawigacyjnych narzędzia Grafana. Jeśli nie włączysz zarządzanej aplikacji Grafana podczas tworzenia klastra, zobacz Link a Grafana workspace details on linking it to your Azure Monitor workspace so it can access Prometheus metrics for your cluster (Łączenie szczegółów obszaru roboczego narzędzia Grafana) w celu uzyskania dostępu do metryk rozwiązania Prometheus dla klastra.

Metryki

Metryki odgrywają ważną rolę w monitorowaniu klastra, identyfikowaniu problemów i optymalizowaniu wydajności w klastrach usługi AKS. Metryki platformy są przechwytywane przy użyciu gotowego serwera metryk zainstalowanego w przestrzeni nazw kube-system, która okresowo złomuje metryki ze wszystkich węzłów Kubernetes obsługiwanych przez rozwiązanie Kubelet. Należy również włączyć metryki usługi Azure Managed Prometheus w celu zbierania metryk kontenera i metryk obiektów Kubernetes, takich jak stan obiektu Wdrożenia. Zobacz Zbieranie metryk rozwiązania Prometheus z klastra usługi AKS w celu wysyłania danych do usługi Azure Managed Service for Prometheus.

Screenshot of enabling Managed Prometheus for existing cluster.

Dzienniki

Dzienniki płaszczyzny sterowania/zasobu usługi AKS

Dzienniki płaszczyzny sterowania dla klastrów usługi AKS są implementowane jako dzienniki zasobów w usłudze Azure Monitor. Dzienniki zasobów nie są zbierane i przechowywane do momentu utworzenia ustawienia diagnostycznego w celu kierowania ich do co najmniej jednej lokalizacji. Zazwyczaj będziesz wysyłać je do obszaru roboczego usługi Log Analytics, w którym większość danych na potrzeby szczegółowych informacji o kontenerze jest przechowywana.

Zobacz Tworzenie ustawień diagnostycznych dla szczegółowego procesu tworzenia ustawienia diagnostycznego przy użyciu witryny Azure Portal, interfejsu wiersza polecenia lub programu PowerShell. Podczas tworzenia ustawienia diagnostycznego należy określić kategorie dzienników do zebrania. Kategorie usługi AKS są wymienione w dokumentacji danych monitorowania usługi AKS.

Ważne

W przypadku zbierania dzienników zasobów dla usługi AKS może wystąpić znaczny koszt, szczególnie w przypadku dzienników inspekcji kube-audit . Rozważ następujące zalecenia, aby zmniejszyć ilość zebranych danych:

  • Wyłącz rejestrowanie kube-audit, jeśli nie jest to wymagane.
  • Włącz zbieranie z usługi kube-audit-admin, która wyklucza zdarzenia pobierania i wyświetlania listy zdarzeń inspekcji.
  • Włącz dzienniki specyficzne dla zasobów zgodnie z poniższym opisem i skonfiguruj AKSAudit tabelę jako podstawowe dzienniki.

Zobacz Monitorowanie klastrów Kubernetes przy użyciu usług platformy Azure i narzędzi natywnych dla chmury, aby uzyskać więcej zaleceń i optymalizacji kosztów oraz usługi Azure Monitor , aby uzyskać dalsze strategie zmniejszenia kosztów monitorowania.

Screenshot of AKS diagnostic setting dialog box.

Usługa AKS obsługuje tryb diagnostyki platformy Azure lub tryb specyficzny dla zasobów dla dzienników zasobów. Określa tabele w obszarze roboczym usługi Log Analytics, w którym są wysyłane dane. Tryb diagnostyki platformy Azure wysyła wszystkie dane do tabeli AzureDiagnostics, podczas gdy tryb specyficzny dla zasobów wysyła dane do usługi AKS Audit, AKS Audit Administracja i AKS Control Plane, jak pokazano w tabeli w obszarze Dzienniki zasobów.

Tryb specyficzny dla zasobu jest zalecany dla usługi AKS z następujących powodów:

  • Dane są łatwiejsze do wykonywania zapytań, ponieważ są w poszczególnych tabelach przeznaczonych dla usługi AKS.
  • Obsługuje konfigurację jako podstawowe dzienniki w celu uzyskania znaczących oszczędności kosztów.

Aby uzyskać więcej informacji na temat różnic między trybami kolekcji, w tym sposób zmiany istniejącego ustawienia, zobacz Wybieranie trybu zbierania.

Uwaga

Możliwość wybrania trybu zbierania nie jest jeszcze dostępna w witrynie Azure Portal we wszystkich regionach. W przypadku tych regionów, w których nie jest jeszcze dostępna, użyj interfejsu wiersza polecenia, aby utworzyć ustawienie diagnostyczne za pomocą polecenia takiego jak:

az monitor diagnostic-settings create --name AKS-Diagnostics --resource /subscriptions/xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx/resourceGroups/myresourcegroup/providers/Microsoft.ContainerService/managedClusters/my-cluster --logs '[{""category"": ""kube-audit"",""enabled"": true}, {""category"": ""kube-audit-admin"", ""enabled"": true}, {""category"": ""kube-apiserver"", ""enabled"": true}, {""category"": ""kube-controller-manager"", ""enabled"": true}, {""category"": ""kube-scheduler"", ""enabled"": true}, {""category"": ""cluster-autoscaler"", ""enabled"": true}, {""category"": ""cloud-controller-manager"", ""enabled"": true}, {""category"": ""guard"", ""enabled"": true}, {""category"": ""csi-azuredisk-controller"", ""enabled"": true}, {""category"": ""csi-azurefile-controller"", ""enabled"": true}, {""category"": ""csi-snapshot-controller"", ""enabled"": true}]'  --workspace /subscriptions/xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx/resourcegroups/myresourcegroup/providers/microsoft.operationalinsights/workspaces/myworkspace --export-to-resource-specific true

Przykładowe zapytania dziennika

Ważne

Po wybraniu pozycji Dzienniki z menu klastra usługi AKS usługa Log Analytics zostanie otwarta z zakresem zapytania ustawionym na bieżący klaster. Oznacza to, że zapytania dziennika będą zawierać tylko dane z tego zasobu. Jeśli chcesz uruchomić zapytanie zawierające dane z innych klastrów lub danych z innych usług platformy Azure, wybierz pozycję Dzienniki z menu usługi Azure Monitor . Aby uzyskać szczegółowe informacje, zobacz Zakres zapytań dzienników i zakres czasu w usłudze Azure Monitor Log Analytics .

Jeśli ustawienie diagnostyczne klastra używa trybu diagnostyki platformy Azure, dzienniki zasobów dla usługi AKS są przechowywane w tabeli AzureDiagnostics. Różne dzienniki można odróżnić od kolumny Kategoria . Opis każdej kategorii można znaleźć w artykule AKS reference resource logs (Dzienniki zasobów referencyjnych usługi AKS).

opis Zapytanie dziennika
Zlicz dzienniki dla każdej kategorii
(Tryb diagnostyki platformy Azure)
AzureDiagnostics
| where ResourceType == "MANAGEDCLUSTERS"
| summarize count() by Category
Wszystkie dzienniki serwera interfejsu API
(Tryb diagnostyki platformy Azure)
AzureDiagnostics
| where Category == "kube-apiserver"
Wszystkie dzienniki kube-audit w zakresie czasu
(Tryb diagnostyki platformy Azure)
let starttime = datetime("2023-02-23");
let endtime = datetime("2023-02-24");
AzureDiagnostics
| gdzie TimeGenerated between(starttime.. endtime)
| where Category == "kube-audit"
| extend event = parse_json(log_s)
| extend HttpMethod = tostring(event.verb)
| extend User = tostring(event.user.username)
| extend Apiserver = pod_s
| extend SourceIP = tostring(event.sourceIPs[0])
| project TimeGenerated, Category, HttpMethod, User, Apiserver, SourceIP, OperationName, event
Wszystkie dzienniki inspekcji
(tryb specyficzny dla zasobu)
AKSAudit
Wszystkie dzienniki inspekcji z wyłączeniem zdarzeń pobierania i wyświetlania listy zdarzeń inspekcji
(tryb specyficzny dla zasobu)
AKSAudit Administracja
Wszystkie dzienniki serwera interfejsu API
(tryb specyficzny dla zasobu)
AKSControlPlane
| where Category == "kube-apiserver"

Aby uzyskać dostęp do zestawu wstępnie utworzonych zapytań w obszarze roboczym usługi Log Analytics, zobacz interfejs zapytań usługi Log Analytics i wybierz typ zasobu Kubernetes Services. Aby uzyskać listę typowych zapytań dotyczących szczegółowych informacji o kontenerze, zobacz Zapytania usługi Container Insights.

Płaszczyzna danych usługi AKS/dzienniki Szczegółowe informacje kontenera

Kontener Szczegółowe informacje zbierać różne typy danych telemetrycznych z kontenerów i klastrów Kubernetes, aby ułatwić monitorowanie, rozwiązywanie problemów i uzyskiwanie wglądu w konteneryzowane aplikacje działające w klastrach usługi AKS. Aby uzyskać listę tabel i ich szczegółowe opisy używane przez usługę Container Insights, zobacz dokumentację tabeli usługi Azure Monitor. Wszystkie te tabele są dostępne dla zapytań dzienników.

Ustawienia optymalizacji kosztów umożliwiają dostosowywanie i kontrolowanie danych metryk zebranych za pośrednictwem agenta usługi Container Insights. Ta funkcja obsługuje ustawienia zbierania danych dla poszczególnych opcji tabeli, interwałów zbierania danych i przestrzeni nazw w celu wykluczenia zbierania danych za pomocą reguł zbierania danych (DCR) usługi Azure Monitor. Te ustawienia kontrolują ilość pozyskiwania i zmniejszają koszty monitorowania szczegółowych informacji o kontenerach. Szczegółowe informacje o kontenerach Zebrane dane można dostosować za pomocą witryny Azure Portal, korzystając z następujących opcji. Wybranie wszystkich opcji innych niż Wszystkie (domyślne) prowadzi do niedostępności środowiska szczegółowych informacji o kontenerze.

Grupowanie Tabele Uwagi
Wszystkie (ustawienie domyślne) Wszystkie standardowe tabele szczegółowych informacji o kontenerach Wymagane do włączenia domyślnych wizualizacji szczegółowych informacji o kontenerach
Wydajność Perf, Szczegółowe informacje Metrics
Dzienniki i zdarzenia ContainerLog lub ContainerLogV2, KubeEvents, KubePodInventory Zalecane, jeśli włączono zarządzane metryki rozwiązania Prometheus
Obciążenia, wdrożenia i hpa Szczegółowe informacje Metrics, KubePodInventory, KubeEvents, ContainerInventory, ContainerNodeInventory, KubeNodeInventory, KubeServices
Trwałe woluminy Szczegółowe informacje Metrics, KubePVInventory

Screenshot of AKS data plane logs collection configuration page.

Grupowanie dzienników i zdarzeń przechwytuje dzienniki z tabel ContainerLog lub ContainerLogV2, KubeEvents, KubePodInventory, ale nie z metryk. Zalecaną ścieżką do zbierania metryk jest włączenie usługi zarządzanej usługi Azure Monitor Prometheus dla rozwiązania Prometheus z klastra usługi AKS oraz użycie narzędzia Azure Managed Grafana na potrzeby wizualizacji danych. Aby uzyskać więcej informacji, zobacz Zarządzanie obszarem roboczym usługi Azure Monitor.

Schemat ContainerLogV2

Usługa Azure Monitor Container Szczegółowe informacje udostępnia schemat dzienników kontenerów znanych jako ContainerLogV2, co jest zalecaną opcją. Ten format zawiera następujące pola, które ułatwiają typowe zapytania dotyczące wyświetlania danych związanych z usługami AKS i klastrami Kubernetes z obsługą usługi Azure Arc:

  • NazwaKontenera
  • Nazwa zasobnika
  • PodNamespace

Ponadto ten schemat jest zgodny z planem danych dzienników podstawowych, który oferuje tanią alternatywę dla standardowych dzienników analitycznych. Podstawowy plan danych dziennika pozwala zaoszczędzić na kosztach pozyskiwania i przechowywania pełnych dzienników w obszarze roboczym usługi Log Analytics na potrzeby debugowania, rozwiązywania problemów i inspekcji, ale nie na potrzeby analizy i alertów. Aby uzyskać więcej informacji, zobacz Zarządzanie tabelami w obszarze roboczym usługi Log Analytics. KontenerLogV2 jest zalecanym podejściem i jest domyślnym schematem dla klientów dołączania szczegółowych informacji o kontenerze przy użyciu uwierzytelniania tożsamości zarządzanej przy użyciu usługi ARM, Bicep, Terraform, Zasad i witryny Azure Portal. Aby uzyskać więcej informacji na temat włączania konteneraLogV2 za pomocą reguły zbierania danych klastra (DCR) lub ConfigMap, zobacz Włączanie schematu ContainerLogV2.

Wizualizacja

Wizualizacja danych to podstawowa koncepcja, która ułatwia administratorom systemu i inżynierom operacyjnym korzystanie z zebranych informacji. Zamiast patrzeć na nieprzetworzone dane, mogą używać reprezentacji wizualnych, które szybko wyświetlają dane i ujawniają trendy, które mogą być ukryte podczas przeglądania danych pierwotnych. Do wizualizacji danych można użyć pulpitów nawigacyjnych narzędzia Grafana lub natywnych skoroszytów platformy Azure.

Azure Managed Grafana

Najczęstszym sposobem analizowania i prezentowania danych Rozwiązania Prometheus jest pulpit nawigacyjny narzędzia Grafana. Narzędzie Azure Managed Grafana zawiera wstępnie utworzone pulpity nawigacyjne do monitorowania klastrów Kubernetes, w tym kilka, które przedstawiają podobne informacje jak widoki usługi Container Insights. Istnieją również różne pulpity nawigacyjne utworzone przez społeczność, które umożliwiają wizualizowanie wielu aspektów klastra Kubernetes z metryk zebranych przez rozwiązanie Prometheus.

Screenshot of Grafana.

Skoroszyty

Skoroszyty usługi Azure Monitor to funkcja w usłudze Azure Monitor, która udostępnia elastyczną kanwę do analizy danych i tworzenia zaawansowanych raportów wizualnych. Skoroszyty ułatwiają tworzenie raportów wizualnych, które ułatwiają analizę danych. Raporty w usłudze Container Insights są zalecane jako gotowe do użycia w przypadku skoroszytów platformy Azure. Platforma Azure udostępnia wbudowane skoroszyty dla każdej usługi, w tym usługę Azure Kubernetes Service (AKS), do której można uzyskać dostęp w witrynie Azure Portal. W menu usługi Azure Monitor w witrynie Azure Portal wybierz pozycję Kontenery. W sekcji Monitorowanie wybierz pozycję Szczegółowe informacje, wybierz określony klaster, a następnie wybierz kartę Raporty. Można je również wyświetlić z galerii skoroszytów w usłudze Azure Monitor.

Na przykład skoroszyt optymalizacji klastra zawiera wiele analizatorów, które zapewniają szybki wgląd w kondycję i wydajność klastra Kubernetes. Zawiera on wiele analizatorów, z których każda dostarcza różne informacje związane z klastrem. Skoroszyt nie wymaga konfiguracji po włączeniu usługi Container Insights w klastrze. Istotne możliwości obejmują możliwość wykrywania niepowodzeń sondy na żywo i ich częstotliwości, identyfikowania i anomalii zdarzeń grupy, które wskazują ostatnie wzrosty liczby zdarzeń w celu uzyskania większej dostępności analizy, oraz identyfikowania kontenerów z wysokimi lub niskimi limitami procesora CPU i pamięci oraz żądaniami, wraz z sugerowanymi limitami i wartościami żądań dla tych kontenerów działających w klastrach usługi AKS. Aby uzyskać więcej informacji na temat tych skoroszytów, zobacz Raporty w usłudze Container Insights.

Alerty

Alerty usługi Azure Monitor pomagają wykrywać i rozwiązywać problemy, zanim użytkownicy będą je otrzymywać, proaktywnie powiadamiając o tym, kiedy zebrane dane w usłudze Azure Monitor wskazują, że może wystąpić problem z infrastrukturą lub aplikacją w chmurze. Umożliwiają one identyfikowanie i rozwiązywanie problemów w systemie zanim zauważą je klienci. Alerty dotyczące metryk, dzienników i dziennika aktywności można ustawić. Różne typy alertów mają zalety i wady.

Istnieją dwa typy reguł metryk używanych przez usługę Container Insights na podstawie metryk rozwiązania Prometheus lub metryk platformy.

Alerty oparte na metrykach rozwiązania Prometheus

Po włączeniu zbierania metryk rozwiązania Prometheus dla klastra możesz pobrać kolekcję zalecanych reguł alertów Rozwiązania Prometheus. Obejmuje to następujące reguły:

Poziom Alerty
Poziom zasobnika KubePodCrashLooping
Zadanie nie zostało ukończone w czasie
Kontener zasobnika został uruchomiony ponownie w ciągu ostatnich 1 godziny
Stan gotowości zasobników jest mniejszy niż 80%
Liczba zasobników w stanie niepowodzenia jest większa niż 0
KubePodNotReadyByController
KubeStatefulSetGenerationMismatch
KubeJobNotCompleted
KubeJobFailed
Średnie użycie procesora CPU na kontener jest większe niż 95%
Średnie użycie pamięci na kontener jest większe niż 95%
KubeletPodStartUpLatencyHigh
Na poziomie klastra Średnie użycie pv jest większe niż 80%
KubeDeploymentReplicasMismatch
KubeStatefulSetReplicasMismatch
KubeHpaReplicasMismatch
KubeHpaMaxedOut
KubeCPUQuotaOvercommit
KubeMemoryQuotaOvercommit
KubeVersionMismatch
KubeClientErrors
CPUThrottlingHigh
KubePersistentVolumeFillingUp
KubePersistentVolumeInodesFillingUp
KubePersistentVolumeErrors
Poziom węzła Średnie wykorzystanie procesora CPU węzła jest większe niż 80%
Pamięć zestawu roboczego dla węzła jest większa niż 80%
Liczba zabitych kontenerów OOM jest większa niż 0
KubeNodeUnreachable
KubeNodeNotReady
KubeNodeReadinessFlapping
KubeContainerWaiting
KubeDaemonSetNotScheduled
KubeDaemonSetMisScheduled
KubeletPlegDurationHigh
KubeletServerCertificateExpiration
KubeletClientCertificateRenewalErrors
KubeletServerCertificateRenewalErrors
KubeQuotaAlmostFull
KubeQuotaFullyUsed
KubeQuotaExceeded

Alerty oparte na metryce platformy

W poniższej tabeli wymieniono zalecane reguły alertów dotyczących metryk dla klastrów usługi AKS. Te alerty są oparte na metrykach platformy dla klastra.

Warunek opis
Procent > użycia procesora CPU 95 Uruchamia się, gdy średnie użycie procesora CPU we wszystkich węzłach przekracza próg.
Procent pracy > zestawu roboczego pamięci 100 Uruchamia się, gdy średni zestaw roboczy we wszystkich węzłach przekracza próg.

Alerty oparte na dziennikach

Alerty dzienników umożliwiają alerty dotyczące płaszczyzny danych i dzienników płaszczyzny sterowania. Uruchamianie zapytań w wstępnie zdefiniowanych interwałach i tworzenie alertu na podstawie wyników. Możesz sprawdzić liczbę niektórych rekordów lub wykonać obliczenia na podstawie kolumn liczbowych.

Zobacz How to create log alerts from Container Szczegółowe informacje and How to query logs from Container Szczegółowe informacje (Jak tworzyć alerty dzienników z Szczegółowe informacje kontenera). Alerty dzienników mogą mierzyć dwie różne rzeczy, które mogą służyć do monitorowania w różnych scenariuszach:

  • Liczba wyników: zlicza liczbę wierszy zwracanych przez zapytanie i może służyć do pracy ze zdarzeniami, takimi jak dzienniki zdarzeń systemu Windows, dziennik syslog i wyjątki aplikacji.
  • Obliczanie wartości: tworzy obliczenie na podstawie kolumny liczbowej i może służyć do uwzględnienia dowolnej liczby zasobów. Przykładem jest procent procesora CPU.

W zależności od wymaganego scenariusza zgłaszania alertów należy utworzyć zapytania dziennika porównujące wartość DateTime z bieżącą godziną przy użyciu now operatora i wracając o jedną godzinę. Aby dowiedzieć się, jak tworzyć alerty oparte na dzienniku, zobacz Tworzenie alertów dzienników na podstawie szczegółowych informacji o kontenerze.

Obserwowanie sieci

Obserwowanie sieci jest ważną częścią utrzymania klastra Kubernetes w dobrej kondycji i wydajnego. Zbierając i analizując dane dotyczące ruchu sieciowego, możesz uzyskać wgląd w sposób działania klastra i zidentyfikować potencjalne problemy, zanim spowodują awarie lub spadek wydajności.

Po włączeniu dodatku Do obserwacji sieci zbiera i konwertuje przydatne metryki na format Prometheus, który można zwizualizować w narzędziu Grafana. Po włączeniu zebrane metryki są automatycznie pozyskiwane do usługi zarządzanej Azure Monitor dla rozwiązania Prometheus. Pulpit nawigacyjny narzędzia Grafana jest dostępny w publicznym repozytorium pulpitu nawigacyjnego Grafana w celu wizualizacji metryk widoczności sieci zebranych przez rozwiązanie Prometheus. Aby uzyskać więcej informacji, zobacz Konfiguracja obserwacji sieci, aby uzyskać szczegółowe instrukcje.

Następne kroki

  • Zobacz Monitorowanie dokumentacji danych usługi AKS, aby uzyskać informacje o metrykach, dziennikach i innych ważnych wartościach utworzonych przez usługę AKS.