Monitorare il servizio Azure Kubernetes (AKS)
Quando si usano applicazioni e processi aziendali critici basati sulle risorse di Azure, è consigliabile monitorare tali risorse per verificarne disponibilità, prestazioni e funzionamento. Questo articolo descrive i dati di monitoraggio generati dal servizio Azure Kubernetes e analizzati con Monitoraggio di Azure. Se non si ha familiarità con le funzionalità di Monitoraggio di Azure comuni a tutti i servizi di Azure che la usano, vedere Monitoraggio delle risorse di Azure con Monitoraggio di Azure.
Importante
Kubernetes è un sistema distribuito complesso con molte parti in movimento, quindi è necessario il monitoraggio a più livelli. Anche se il servizio Azure Kubernetes è un servizio Kubernetes gestito, è comunque necessario lo stesso rigore per il monitoraggio a più livelli. Questo articolo fornisce informazioni generali e procedure consigliate per il monitoraggio di un cluster del servizio Azure Kubernetes. Per altri dettagli, vedere quanto segue.
- Per un monitoraggio dettagliato dello stack Kubernetes completo, vedere Monitorare il servizio Azure Kubernetes con Monitoraggio di Azure
- Per la raccolta dei dati delle metriche dai cluster Kubernetes, vedere Servizio gestito di Monitoraggio di Azure per Prometheus.
- Per la raccolta dei log nei cluster Kubernetes, vedere Informazioni dettagliate sui contenitori.
- Per la visualizzazione dei dati, vedere cartelle di lavoro di Azure e Grafana gestita di Azure.
Dati di monitoraggio
Il servizio Azure Kubernetes genera gli stessi tipi di dati di monitoraggio delle altre risorse di Azure descritte in Dati di monitoraggio dalle risorse di Azure. Per informazioni dettagliate sulle metriche e i log creati dal servizio Azure Kubernetes, vedereInformazioni di riferimento sui dati del servizio Azure Kubernetes di monitoraggio. Altri servizi e funzionalità di Azure raccolgono altri dati e abilitano altre opzioni di analisi, come illustrato nel diagramma e nella tabella seguenti.
Origine | Descrizione |
---|---|
Metriche della piattaforma | Le metriche della piattaforma vengono raccolte automaticamente per i cluster del servizio Azure Kubernetes senza costi. È possibile analizzare queste metriche con Esplora metriche o usarle per gli avvisi delle metriche. |
Metriche di Prometheus | Quando si abilita lo scraping delle metriche per il cluster, le metriche di Prometheus vengono raccolte dal servizio gestito di Monitoraggio di Azure per Prometheus e archiviate in un'area di lavoro di Monitoraggio di Azure. Analizzarli con dashboard predefiniti in Grafana gestito di Azure e con gli avvisi di Prometheus. |
Log attività | Il log attività viene raccolto automaticamente per i cluster del servizio Azure Kubernetes senza costi. Questi log tengono traccia delle informazioni, ad esempio quando un cluster viene creato o ha una modifica della configurazione. Inviare il log attività a un'area di lavoro Log Analytics per analizzarla con gli altri dati di log. |
Log risorse | I log del piano di controllo per il servizio Azure Kubernetes vengono implementati come log delle risorse. Creare un'impostazione di diagnostica per inviarle all'area di lavoro Log Analytics in cui è possibile analizzare e inviare avvisi con query di log in Log Analytics. |
Informazioni dettagliate contenitore | Informazioni dettagliate sui contenitori raccoglie vari log e dati sulle prestazioni da un cluster, inclusi i flussi stdout/stderr e li archivia in un'area di lavoro Log Analytics e metriche di Monitoraggio di Azure. Analizzare questi dati con visualizzazioni e cartelle di lavoro incluse in Informazioni dettagliate sui contenitori o con Log Analytics ed Esplora metriche. |
Pagina di panoramica del monitoraggio nel portale di Azure
La scheda Monitoraggio nella pagina Panoramica offre un modo rapido per iniziare a visualizzare i dati di monitoraggio nel portale di Azure per ogni cluster del servizio Azure Kubernetes. Sono inclusi grafici con metriche comuni per il cluster separato dal pool di nodi. Fare clic su uno di questi grafici per analizzare ulteriormente i dati in Esplora metriche.
La pagina Panoramica include anche collegamenti a Prometheus gestito e Informazioni dettagliate contenitore per il cluster corrente. Se questi strumenti non sono già stati abilitati, viene richiesto di farlo. È anche possibile visualizzare un banner nella parte superiore della schermata che consiglia di abilitare altre funzionalità per migliorare il monitoraggio del cluster.
Suggerimento
Accedere alle funzionalità di monitoraggio per tutti i cluster del servizio Azure Kubernetes nella sottoscrizione dal menu Monitoraggio nel portale di Azure o per un singolo cluster del servizio Azure Kubernetes dalla sezione Monitoraggio del menu dei servizi Kubernetes.
Integrazioni
Per il monitoraggio aggiuntivo dei cluster Kubernetes, è possibile usare i servizi e le funzionalità di Monitoraggio di Azure seguenti. È possibile abilitare queste funzionalità durante la creazione del cluster del servizio Azure Kubernetes dalla scheda Integrazioni nel portale di Azure, nell'interfaccia della riga di comando di Azure, in Terraform, in Criteri di Azure o durante l'onboarding del cluster in un secondo momento. Ognuna di queste funzionalità può comportare costi, quindi fare riferimento alle informazioni sui prezzi per ognuna prima di abilitarle.
Servizio/Funzionalità | Descrizione |
---|---|
Informazioni dettagliate contenitore | Usa una versione in contenitori dell'agente di Monitoraggio di Azure per raccogliere i log stdout/stderr e gli eventi Kubernetes da ogni nodo del cluster, supportando una varietà di scenari di monitoraggio per i cluster del servizio Azure Kubernetes. È possibile abilitare il monitoraggio per un cluster del servizio Azure Kubernetes quando viene creato usando l'interfaccia della riga di comando di Azure, Criteri di Azure , il portale di Azure o Terraform. Se non si abilitano informazioni dettagliate sui contenitori quando si crea il cluster, vedere Abilitare Informazioni dettagliate sui contenitori per il cluster del servizio Azure Kubernetes per altre opzioni per abilitarlo. Le informazioni dettagliate sui contenitori archiviano la maggior parte dei dati in un'area di lavoro Log Analytics e in genere si userà la stessa area di lavoro log analytics dei log delle risorse per il cluster. Vedere Progettare un'architettura dell'area di lavoro Log Analytics per indicazioni sul numero di aree di lavoro da usare e sulla posizione in cui individuarle. |
Servizio gestito per Prometheus di Monitoraggio di Azure | Prometheus è una soluzione di metriche nativa del cloud di Cloud Native Compute Foundation e lo strumento più comune usato per raccogliere e analizzare i dati delle metriche dai cluster Kubernetes. Il servizio gestito di Monitoraggio di Azure per Prometheus è una soluzione di monitoraggio completamente gestita compatibile con Prometheus in Azure. Se non si abilita Prometheus gestito quando si crea il cluster, vedere Raccogliere le metriche di Prometheus da un cluster del servizio Azure Kubernetes per altre opzioni per abilitarla. Il servizio gestito di Monitoraggio di Azure per Prometheus archivia i dati in un'area di lavoro di Monitoraggio di Azurecollegata a un'area di lavoro Grafana in modo da poter analizzare i dati con Grafana gestito di Azure. |
Grafana con gestione Azure | Implementazione completamente gestita di Grafana, una piattaforma di visualizzazione dei dati open source comunemente usata per presentare i dati di Prometheus. Sono disponibili più dashboard Grafana predefiniti per il monitoraggio di Kubernetes e la risoluzione dei problemi dello stack completo. Se non si abilita Grafana gestito quando si crea il cluster, vedere Collegamento di un'area di lavoro Grafana per i dettagli sul collegamento all'area di lavoro di Monitoraggio di Azure in modo che possa accedere alle metriche di Prometheus per il cluster. |
Metrica
Le metriche svolgono un ruolo importante nel monitoraggio del cluster, nell'identificazione dei problemi e nell'ottimizzazione delle prestazioni nei cluster del servizio Azure Kubernetes. Le metriche della piattaforma vengono acquisite usando il server delle metriche predefinito installato nello spazio dei nomi kube-system, che elimina periodicamente le metriche da tutti i nodi Kubernetes gestiti da Kubelet. È anche necessario abilitare le metriche di Prometheus gestite di Azure per raccogliere le metriche dei contenitori e le metriche degli oggetti Kubernetes, ad esempio lo stato dell'oggetto delle distribuzioni. Vedere Raccogliere le metriche di Prometheus da un cluster del servizio Azure Kubernetes per inviare dati al servizio gestito di Azure per Prometheus.
Il servizio Azure Kubernetes espone anche le metriche da componenti critici del piano di controllo, ad esempio server API, ETCD, Utilità di pianificazione tramite Prometheus gestito di Azure. Questa funzionalità è attualmente disponibile in anteprima e altri dettagli sono disponibili qui.
Registri
Log del piano di controllo o delle risorse del servizio Azure Kubernetes
I log del piano di controllo per i cluster del servizio Azure Kubernetes vengono implementati come log delle risorse in Monitoraggio di Azure. I log delle risorse non vengono raccolti e archiviati fino a quando non si crea un'impostazione di diagnostica per indirizzarli a una o più posizioni. In genere verranno inviati a un'area di lavoro Log Analytics, in cui è archiviata la maggior parte dei dati per Informazioni dettagliate sui contenitori.
Vedere Creare impostazioni di diagnostica per il processo dettagliato per la creazione di un'impostazione di diagnostica tramite il portale di Azure, l'interfaccia della riga di comando o PowerShell. Quando si crea un'impostazione di diagnostica, specificare le categorie di log da raccogliere. Le categorie per il servizio Azure Kubernetes sono elencate in Informazioni di riferimento sui dati di monitoraggio del servizio Azure Kubernetes.
Importante
La raccolta dei log delle risorse per il servizio Azure Kubernetes può comportare costi significativi, in particolare per i log di controllo kube-audit. Considerare i consigli seguenti per ridurre la quantità di dati raccolti:
- Disabilitare la registrazione kube-audit quando non è necessario.
- Abilitare la raccolta da kube-audit-admin, che esclude gli eventi di controllo get ed list.
- Abilitare i log specifici delle risorse come descritto di seguito e configurare la tabella
AKSAudit
come log di base.
Vedere Monitorare i cluster Kubernetes usando i servizi di Azure e gli strumenti nativi del cloud per altre raccomandazioni e Ottimizzazione dei costi e Monitoraggio di Azure per altre strategie per ridurre i costi di monitoraggio.
Il servizio Azure Kubernetes supporta la modalità diagnostica di Azure o la modalità specifica della risorsa per i log delle risorse. Specifica le tabelle nell'area di lavoro Log Analytics in cui vengono inviati i dati. La modalità diagnostica di Azure invia tutti i dati alla tabella AzureDiagnostics, mentre la modalità specifica della risorsa invia i dati al controllo del servizio Azure Kubernetes, all'amministratore del controllo del servizio Azure Kubernetes e al piano di controllo del servizio Azure Kubernetes, come illustrato nella tabella nei log delle risorse.
La modalità specifica della risorsa è consigliata per il servizio Azure Kubernetes per i motivi seguenti:
- I dati sono più facili da eseguire in query perché si trovano in singole tabelle dedicate al servizio Azure Kubernetes.
- Supporta la configurazione come log di base per un risparmio significativo sui costi.
Per altre informazioni sulla differenza tra le modalità di raccolta, tra cui come modificare un'impostazione esistente, vedere Selezionare la modalità raccolta.
Nota
La possibilità di selezionare la modalità di raccolta non è ancora disponibile nel portale di Azure in tutte le aree. Per le aree in cui non è ancora disponibile, usare l'interfaccia della riga di comando per creare l'impostazione di diagnostica con un comando come il seguente:
az monitor diagnostic-settings create --name AKS-Diagnostics --resource /subscriptions/xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx/resourceGroups/myresourcegroup/providers/Microsoft.ContainerService/managedClusters/my-cluster --logs '[{""category"": ""kube-audit"",""enabled"": true}, {""category"": ""kube-audit-admin"", ""enabled"": true}, {""category"": ""kube-apiserver"", ""enabled"": true}, {""category"": ""kube-controller-manager"", ""enabled"": true}, {""category"": ""kube-scheduler"", ""enabled"": true}, {""category"": ""cluster-autoscaler"", ""enabled"": true}, {""category"": ""cloud-controller-manager"", ""enabled"": true}, {""category"": ""guard"", ""enabled"": true}, {""category"": ""csi-azuredisk-controller"", ""enabled"": true}, {""category"": ""csi-azurefile-controller"", ""enabled"": true}, {""category"": ""csi-snapshot-controller"", ""enabled"": true}]' --workspace /subscriptions/xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx/resourcegroups/myresourcegroup/providers/microsoft.operationalinsights/workspaces/myworkspace --export-to-resource-specific true
Query di log di esempio
Importante
Quando si seleziona Log dal menu per un cluster del servizio Azure Kubernetes, Log Analytics viene aperto con l'ambito di query impostato sul cluster corrente. Ciò significa che le query di log includeranno solo i dati di tale risorsa. Per eseguire una query che include dati di altri cluster o dati di altri servizi di Azure, selezionare Log dal menu Monitoraggio di Azure. Per i dettagli, vedere Ambito e intervallo di tempo delle query su log in Log Analytics di Monitoraggio di Azure.
Se l'impostazione di diagnostica per il cluster usa la modalità diagnostica di Azure, i log delle risorse per il servizio Azure Kubernetes vengono archiviati nella abella AzureDiagnostics. È possibile distinguere log diversi con la colonna Categoria. Per una descrizione di ogni categoria, vedere Log delle risorse di riferimento del servizio Azure Kubernetes.
Descrizione | Query di log |
---|---|
Conteggio dei log per ogni categoria (modalità diagnostica di Azure) |
AzureDiagnostics | dove ResourceType == "MANAGEDCLUSTERS" | riepilogo conteggio() per Categoria |
Tutti i log del server API (modalità diagnostica di Azure) |
AzureDiagnostics | dove Categoria == "kube-apiserver" |
Tutti i log di controllo kube in un intervallo di tempo (modalità diagnostica di Azure) |
let starttime = datetime("2023-02-23"); let endtime = datetime("2023-02-24"); AzureDiagnostics | dove TimeGenerated between(starttime.. endtime) | dove Categoria == "kube-audit" | estendere evento = parse_json(log_s) | estendere HttpMethod = tostring(event.verb) | estendere Utente = tostring(event.user.username) | estendere Apiserver = pod_s | estendere SourceIP = tostring(event.sourceIPs[0]) | progetto TimeGenerated, Categoria, HttpMethod, Utente, Apiserver, SourceIP, OperationName, evento |
Tutti i log di controllo (modalità specifica della risorsa) |
AKSAudit |
Tutti i log di controllo esclusi gli eventi di controllo get ed list (modalità specifica della risorsa) |
AKSAuditAdmin |
Tutti i log del server API (modalità specifica della risorsa) |
AKSControlPlane | dove Categoria == "kube-apiserver" |
Per accedere a un set di query predefinite nell'area di lavoro Log Analytics, vedere l'interfaccia query di Log Analytics e selezionare il tipo di risorsa Servizi Kubernetes. Per un elenco di query comuni per informazioni dettagliate sui contenitori, vedere Query di informazioni dettagliate sui contenitori.
Log del piano dati del servizio Azure Kubernetes/Informazioni dettagliate sui contenitori
Container Insights raccoglie diversi tipi di dati di telemetria dai contenitori e dai cluster Kubernetes per monitorare, risolvere i problemi e ottenere informazioni dettagliate sulle applicazioni in contenitori in esecuzione nei cluster del servizio Azure Kubernetes. Per un elenco di tabelle e le relative descrizioni dettagliate usate da Informazioni dettagliate sui contenitori, vedere le informazioni di riferimento sulla tabella di Monitoraggio di Azure. Tutte queste tabelle sono disponibili per le query di log.
Le impostazioni di ottimizzazione dei costi consentono di personalizzare e controllare i dati delle metriche raccolti tramite l'agente di informazioni dettagliate sui contenitori. Questa funzionalità supporta le impostazioni di raccolta dati per la selezione di singole tabelle, intervalli di raccolta dati e spazi dei nomi per escludere la raccolta dati tramite Regole di raccolta dati di Monitoraggio di Azure. Queste impostazioni controllano il volume di inserimento e riducono i costi di monitoraggio delle informazioni dettagliate sui contenitori. I dati raccolti dai contenitori possono essere personalizzati tramite il portale di Azure, usando le opzioni seguenti. Se si selezionano opzioni diverse da Tutte (impostazione predefinita), l'esperienza di informazioni dettagliate sui contenitori diventa non disponibile.
Raggruppamento | Tabelle | Note |
---|---|---|
Tutte (impostazione predefinita) | Tutte le tabelle di informazioni dettagliate sui contenitori standard | Obbligatorio per abilitare le visualizzazioni predefinite delle informazioni dettagliate sui contenitori |
Prestazioni | Perf, InsightsMetrics | |
Log ed eventi | ContainerLog o ContainerLogV2, KubeEvents, KubePodInventory | Consigliato se sono state abilitate le metriche di Prometheus gestite |
Carichi di lavoro, distribuzioni e HPA | InsightsMetrics, KubePodInventory, KubeEvents, ContainerInventory, ContainerNodeInventory, KubeNodeInventory, KubeServices | |
Volumi permanenti | InsightsMetrics, KubePVInventory |
Il raggruppamento di log ed eventi acquisisce i log dalle tabelle ContainerLog o ContainerLogV2, KubeEvents, KubePodInventory, ma non dalle metriche. Il percorso consigliato per raccogliere le metriche consiste nell'abilitare il servizio gestito di Monitoraggio di Azure Prometheus per Prometheus dal cluster del servizio Azure Kubernetes e usare Grafana gestito di Azure per la visualizzazione dei dati. Per altre informazioni, vedere Gestire un'area di lavoro di Monitoraggio di Azure.
Schema ContainerLogV2
Azure Monitor Container Insights offre uno schema per i log dei contenitori noti come ContainerLogV2, che è l'opzione consigliata. Questo formato include i campi seguenti per facilitare le query comuni per la visualizzazione dei dati correlati al servizio Azure Kubernetes e ai cluster Kubernetes abilitati per Azure Arc:
- ContainerName
- PodName
- PodNamespace
Inoltre, questo schema è compatibile con il piano dati Log di base, che offre un'alternativa a basso costo ai log di analisi standard. Il piano dati di log di base consente di risparmiare sui costi di inserimento e archiviazione di log dettagliati di volumi elevati nell'area di lavoro Log Analytics per il debug, la risoluzione dei problemi e il controllo, ma non per l'analisi e gli avvisi. Per altre informazioni, vedere Gestire le tabelle in un'area di lavoro Log Analytics. ContainerLogV2 è l'approccio consigliato ed è lo schema predefinito per i clienti che eseguono l'onboarding di informazioni dettagliate sui contenitori con l'autenticazione dell'identità gestita usando ARM, Bicep, Terraform, Criteri e il portale di Azure. Per altre informazioni su come abilitare ContainerLogV2 tramite la regola di raccolta dati del cluster o ConfigMap, vedere Abilitare lo schema ContainerLogV2.
Visualizzazione
La visualizzazione dei dati è un concetto essenziale che semplifica l'utilizzo delle informazioni raccolte da parte degli amministratori di sistema e dei tecnici operativi. Invece di esaminare i dati non elaborati, possono usare rappresentazioni visive, che visualizzano rapidamente i dati e rivelano tendenze che potrebbero essere nascoste durante l'analisi dei dati non elaborati. È possibile usare Grafana Dashboard o cartelle di lavoro native di Azure per la visualizzazione dei dati.
Grafana con gestione Azure
Il modo più comune per analizzare e presentare i dati di Prometheus è costituito da un dashboard Grafana. Grafana gestito di Azure include dashboard predefiniti per il monitoraggio dei cluster Kubernetes, tra cui diversi che presentano informazioni simili come le visualizzazioni informazioni dettagliate sui contenitori. Sono disponibili anche vari dashboard creati dalla community per visualizzare più aspetti di un cluster Kubernetes dalle metriche raccolte da Prometheus.
Workbooks
Cartelle di lavoro di Monitoraggio di Azure è una funzionalità di Monitoraggio di Azure che fornisce un canvas flessibile per l'analisi dei dati e la creazione di report visivi avanzati. Le cartelle di lavoro consentono di creare report visivi utili per l'analisi dei dati. I report in Informazioni dettagliate sui contenitori sono consigliati per le cartelle di lavoro di Azure. Azure offre cartelle di lavoro predefinite per ogni servizio, incluso il servizio Azure Kubernetes, accessibile dal portale di Azure. Nel menu Monitoraggio di Azure nel portale di Azure selezionare Contenitori. Nella sezione Monitoraggio selezionare Informazioni dettagliate, scegliere un cluster specifico e quindi selezionare la scheda Report. È anche possibile visualizzarli dalla raccolta di cartelle di lavoro in Monitoraggio di Azure.
Ad esempio, la cartella di lavoro di Ottimizzazione cluster fornisce più analizzatori che offrono una rapida visualizzazione dell'integrità e delle prestazioni del cluster Kubernetes. Include più analizzatori che forniscono informazioni diverse correlate al cluster. La cartella di lavoro non richiede alcuna configurazione dopo l'abilitazione di Informazioni dettagliate sul contenitore nel cluster. Le funzionalità salienti includono la possibilità di rilevare gli errori del probe di attività e le relative frequenze, identificare e raggruppare le anomalie degli eventi che indicano recenti aumenti del volume di eventi per un'analisi più accessibile e identificare i contenitori con limiti e richieste di CPU e memoria elevati o bassi, insieme ai valori di limite e richiesta suggeriti per questi contenitori in esecuzione nei cluster del servizio Azure Kubernetes. Per altre informazioni su queste cartelle di lavoro, vedere Report in Informazioni dettagliate sui contenitori.
Avvisi
Gli avvisi di Monitoraggio di Azure aiutano a rilevare e risolvere i problemi prima che gli utenti li notino, notificando in modo proattivo quando i dati raccolti da Monitoraggio di Azure indicano che si è verificato un problema con l'infrastruttura cloud o l'applicazione. Consentono di identificare e risolvere i problemi del sistema prima che gli utenti li notino. È possibile impostare avvisi su metriche, log e log attività. Ogni tipo di avviso presenta vantaggi e svantaggi.
Esistono due tipi di regole delle metriche usate da Informazioni dettagliate sui contenitori in base alle metriche Prometheus o alle metriche della piattaforma.
Avvisi basati sulle metriche Prometheus
Quando si abilita la raccolta di metriche Prometheus per il cluster, è possibile scaricare una raccolta di regole di avviso Prometheus consigliate. Sono incluse le regole seguenti:
Livello | Avvisi |
---|---|
Livello pod | KubePodCrashLooping Il processo non è stato completato in tempo Contenitore pod riavviato nell'ultima ora Lo stato pronto dei pod è inferiore all'80% Il numero di pod in stato di errore è maggiore di 0 KubePodNotReadyByController KubeStatefulSetGenerationMismatch KubeJobNotCompleted KubeJobFailed L'utilizzo medio della CPU per contenitore è maggiore del 95% L'utilizzo medio della memoria per ogni contenitore è maggiore del 95% KubeletPodStartUpLatencyHigh |
Livello cluster | L'utilizzo medio del PV è maggiore dell'80% KubeDeploymentReplicasMismatch KubeStatefulSetReplicasMismatch KubeHpaReplicasMismatch KubeHpaMaxedOut KubeCPUQuotaOvercommit KubeMemoryQuotaOvercommit KubeVersionMismatch KubeClientErrors CPUThrottlingHigh KubePersistentVolumeFillingUp KubePersistentVolumeInodesFillingUp KubePersistentVolumeErrors |
Livello nodo | L'utilizzo medio della CPU del nodo è maggiore dell'80% La memoria del set di lavoro per un nodo è maggiore dell'80% Il numero di contenitori terminati OOM è maggiore di 0 KubeNodeUnreachable KubeNodeNotReady KubeNodeReadinessFlapping KubeContainerWaiting KubeDaemonSetNotScheduled KubeDaemonSetMisScheduled KubeletPlegDurationHigh KubeletServerCertificateExpiration KubeletClientCertificateRenewalErrors KubeletServerCertificateRenewalErrors KubeQuotaAlmostFull KubeQuotaFullyUsed KubeQuotaExceeded |
Avvisi basati sulle metriche della piattaforma
La tabella seguente elenca le regole di avviso delle metriche consigliate per i cluster del servizio Azure Kubernetes. Questi avvisi sono basati sulle metriche della piattaforma per il cluster.
Condizione | Descrizione |
---|---|
Percentuale di utilizzo CPU > 95 | Viene generato quando l'utilizzo medio della CPU in tutti i nodi supera la soglia. |
Percentuale working set di memoria > 100 | Viene generato quando il working set medio in tutti i nodi supera la soglia. |
Avvisi basati sui log
Gli avvisi del log consentono di inviare avvisi sui log del piano dati e del piano di controllo. Eseguire query a intervalli predefiniti e creare un avviso in base ai risultati. È possibile verificare la presenza del conteggio di determinati record o eseguire calcoli in base alle colonne numeriche.
Vedere Come creare avvisi di log da Container Insights e Come eseguire query sui log da Container Insights. Gli avvisi del log possono misurare due aspetti diversi, che possono essere usati per monitorare in scenari diversi:
- Conteggio risultati: conta il numero di righe restituite dalla query e può essere usato per lavorare con eventi quali registri eventi di Windows, Syslog ed eccezioni dell'applicazione.
- Calcolo di un valore: esegue un calcolo basato su una colonna numerica e può essere usato per includere un numero qualsiasi di risorse. Un esempio è la percentuale di CPU.
A seconda dello scenario di avviso richiesto, è necessario creare query di log confrontando un valore DateTime con l'ora corrente usando l'operatore now
e tornando indietro di un'ora. Per informazioni su come creare avvisi basati su log, vedere Creare avvisi di log da Informazioni dettagliate sui contenitori.
Osservabilità della rete
L'osservabilità della rete è una parte importante della gestione di un cluster Kubernetes integro ed efficiente. Raccogliendo e analizzando i dati sul traffico di rete, è possibile ottenere informazioni dettagliate sul funzionamento del cluster e identificare potenziali problemi prima di causare interruzioni o riduzione delle prestazioni.
Quando il componente aggiuntivo Network Observability è abilitato, raccoglie e converte metriche utili in formato Prometheus, che può essere visualizzato in Grafana. Se abilitata, le metriche raccolte vengono inserite automaticamente nel servizio gestito di Monitoraggio di Azure per Prometheus. Un dashboard di Grafana è disponibile nel repository del dashboard pubblico di Grafana per visualizzare le metriche di osservabilità di rete raccolte da Prometheus. Per altre informazioni, vedere Configurazione di Network Observability per istruzioni dettagliate.
Passaggi successivi
- Per informazioni di riferimento sulle metriche, i log e altri valori importanti creati dal servizio Azure Kubernetes, vedere Informazioni di riferimento sui dati del servizio Azure Kubernetes.