Linee guida per la risoluzione dei problemi per l'agente di Monitoraggio di Azure in macchine virtuali Linux e set di scalabilità
Panoramica dell'agente di Monitoraggio di Azure
Prima di leggere altre informazioni, è necessario avere familiarità con l'agente di Monitoraggio di Azure e le regole di raccolta dati.
Terminologia
Nome | Acronimo | Descrizione |
---|---|---|
Agente di Monitoraggio di Azure | AMA | Nuovo agente di Monitoraggio di Azure |
Regole di raccolta dati | DCR | Regole per configurare la raccolta di dati dall'agente, ad esempio cosa raccogliere, dove inviare e altro ancora |
Servizio di configurazione di Monitoraggio di Azure | AMCS | Servizio a livello di area ospitato in Azure, che controlla la raccolta dei dati per questo agente e altre parti di Monitoraggio di Azure. L'agente chiama in questo servizio per recuperare i controller di dominio. |
Endpoint dei log | -- | Endpoint per l'invio di dati alle aree di lavoro Log Analytics |
Endpoint delle metriche | -- | Endpoint per l'invio di dati ai database delle metriche di Monitoraggio di Azure. |
Servizio metadati dell'istanza e ibrido | IMDS e HIMDS | Servizi ospitati in Azure che forniscono informazioni sulle macchine virtuali attualmente in esecuzione, sui set di scalabilità (tramite IMDS) e sui server abilitati per Arc (tramite HIMDS) rispettivamente |
Area di lavoro Log Analytics | LEGGE | Destinazione in Monitoraggio di Azure a cui è possibile inviare i log raccolti dall'agente |
Metriche personalizzate | -- | Destinazione in Monitoraggio di Azure a cui è possibile inviare le metriche guest raccolte dall'agente |
Procedura di base per la risoluzione dei problemi
Seguire questa procedura per risolvere i problemi relativi alla versione più recente dell'agente di Monitoraggio di Azure in esecuzione nella macchina virtuale Linux:
Esaminare attentamente i prerequisiti qui.
Verificare che l'estensione sia stata installata e di cui è stato eseguito il provisioning, che installa i file binari dell'agente nel computer:
- Aprire portale di Azure > selezionare la macchina > virtuale Apri impostazioni: estensioni e applicazioni dal riquadro a sinistra > "AzureMonitorLinuxAgent" dovrebbe essere visualizzata con Stato: "Provisioning riuscito"
- Se l'estensione non è elencata, controllare se il computer può raggiungere Azure e trovare l'estensione da installare usando il comando seguente:
az vm extension image list-versions --location <machine-region> --name AzureMonitorLinuxAgent --publisher Microsoft.Azure.Monitor
- Attendere 10-15 minuti perché l'estensione potrebbe essere in stato di transizione. Se non viene ancora visualizzato come indicato in precedenza, disinstallare e installare di nuovo l'estensione .
- Controllare se vengono visualizzati errori nei log di estensione presenti
/var/log/azure/Microsoft.Azure.Monitor.AzureMonitorLinuxAgent/
nel computer - Se nessuno dei precedenti è utile, inviare un ticket con Riepilogo come "l'estensione AMA non riesce a installare o effettuare il provisioning" e tipo di problema come "Serve assistenza con l'agente Linux di Monitoraggio di Azure".
Verificare che l'agente sia in esecuzione:
- Controllare se l'agente genera log heartbeat nell'area di lavoro Log Analytics usando la query seguente. Ignorare se "Metriche personalizzate" è l'unica destinazione nel Registro Azure Container:
Heartbeat | where Category == "Azure Monitor Agent" and Computer == "<computer-name>" | take 10
- Controllare se il servizio agente è in esecuzione
systemctl status azuremonitoragent
- Controllare se vengono visualizzati errori nei log dell'agente di base presenti
/var/opt/microsoft/azuremonitoragent/log/mdsd.*
nel computer - Se nessuno dei precedenti risulta utile, inviare un ticket con Riepilogo come "Estensione AMA con provisioning ma non in esecuzione" e Tipo di problema come "Serve assistenza con l'agente Linux di Monitoraggio di Azure".
- Controllare se l'agente genera log heartbeat nell'area di lavoro Log Analytics usando la query seguente. Ignorare se "Metriche personalizzate" è l'unica destinazione nel Registro Azure Container:
Verificare che il DCR esista e sia associato alla macchina virtuale:
- Se si usa l'area di lavoro Log Analytics come destinazione, verificare che DCR esista nella stessa area fisica dell'area di lavoro Log Analytics.
- Aprire portale di Azure > selezionare la regola > di raccolta dati Apri configurazione: risorse dal riquadro a sinistra > Dovrebbe essere visualizzata la macchina virtuale elencata qui.
- Se non è elencato, fare clic su "Aggiungi" e selezionare la macchina virtuale dalla selezione risorse. Ripetere tutti i controller di dominio.
- Se nessuno dei precedenti risulta utile, inviare un ticket con Riepilogo come "DCR non trovato o associato" e Tipo di problema come "Serve aiuto per configurare la raccolta dati da una macchina virtuale".
Verificare che l'agente sia stato in grado di scaricare i DCR associati dal servizio AMCS:
- Controllare se viene visualizzata la versione più recente di DCR scaricata in questo percorso
/etc/opt/microsoft/azuremonitoragent/config-cache/configchunks/
- In caso contrario, inviare un ticket con Riepilogo come "AMA non è in grado di scaricare la configurazione DCR" e tipo di problema come "Serve assistenza con l'agente Linux di Monitoraggio di Azure".
- Controllare se viene visualizzata la versione più recente di DCR scaricata in questo percorso
Problemi durante la raccolta di Syslog
Per altre informazioni su come risolvere i problemi di syslog con l'agente di Monitoraggio di Azure, vedere qui.
Il file
/var/opt/microsoft/azuremonitoragent/log/mdsd.qos
qualità del servizio (QoS) fornisce aggregazioni in formato CSV di 15 minuti degli eventi elaborati e contiene le informazioni sulla quantità di eventi syslog elaborati nell'intervallo di tempo specificato. Questo file è utile per tenere traccia delle gocce di inserimento eventi Syslog.Ad esempio, il frammento seguente mostra che nei 15 minuti precedenti al 2022-02-28T19:55:23.5432920Z, l'agente ha ricevuto 77 eventi syslog con informazioni sul daemon della struttura e sul livello e ha inviato 77 di tali eventi all'attività di caricamento. Inoltre, l'attività di caricamento dell'agente ha ricevuto 77 e caricato correttamente tutti e 77 di questi messaggi daemon.info.
#Time: 2022-02-28T19:55:23.5432920Z #Fields: Operation,Object,TotalCount,SuccessCount,Retries,AverageDuration,AverageSize,AverageDelay,TotalSize,TotalRowsRead,TotalRowsSent ... MaRunTaskLocal,daemon.debug,15,15,0,60000,0,0,0,0,0 MaRunTaskLocal,daemon.info,15,15,0,60000,46.2,0,693,77,77 MaRunTaskLocal,daemon.notice,15,15,0,60000,0,0,0,0,0 MaRunTaskLocal,daemon.warning,15,15,0,60000,0,0,0,0,0 MaRunTaskLocal,daemon.error,15,15,0,60000,0,0,0,0,0 MaRunTaskLocal,daemon.critical,15,15,0,60000,0,0,0,0,0 MaRunTaskLocal,daemon.alert,15,15,0,60000,0,0,0,0,0 MaRunTaskLocal,daemon.emergency,15,15,0,60000,0,0,0,0,0 ... MaODSRequest,https://e73fd5e3-ea2b-4637-8da0-5c8144b670c8_LogManagement,15,15,0,455067,476.467,0,7147,77,77
Passaggi per la risoluzione dei problemi
- Esaminare prima i passaggi generici per la risoluzione dei problemi di Linux AMA . Se l'agente emette heartbeat, procedere con il passaggio 2.
- La configurazione analizzata viene archiviata in
/etc/opt/microsoft/azuremonitoragent/config-cache/configchunks/
. Verificare che la raccolta Syslog sia definita e che le destinazioni di log siano uguali a quella costruita in DCR UI/DCR JSON.- In caso affermativo, procedere con il passaggio 3. In caso contrario, il problema si verifica nel flusso di lavoro di configurazione.
- Esaminare
mdsd.err
imdsd.warn
file/var/opt/microsoft/azuremonitoragent/log
inmdsd.info
per individuare possibili errori di configurazione. - Se nessuno dei precedenti risulta utile, inviare un ticket con Riepilogo come "Syslog DCR non disponibile" e Tipo di problema come "Serve aiuto per configurare la raccolta dati da una macchina virtuale".
- Convalidare il layout del flusso di lavoro della raccolta Syslog per assicurarsi che tutte le parti necessarie siano presenti e accessibili:
- Per
rsyslog
gli utenti, assicurarsi che il/etc/rsyslog.d/10-azuremonitoragent.conf
file sia presente, non sia vuoto ed è accessibile dalrsyslog
daemon (utente syslog).- Controllare la configurazione di rsyslog in
/etc/rsyslog.conf
e/etc/rsyslog.d/*
per verificare se sono presenti input associati a un set di regole non predefinito, poiché i messaggi provenienti da questi input non verranno inoltrati all'agente di Monitoraggio di Azure. Ad esempio, i messaggi di un input configurato con un set di regole non predefinito comeinput(type="imtcp" port="514"
ruleset="myruleset"
)
non verranno inoltrati.
- Controllare la configurazione di rsyslog in
- Per
syslog-ng
gli utenti, assicurarsi che il/etc/syslog-ng/conf.d/azuremonitoragent.conf
file sia presente, non sia vuoto ed è accessibile dalsyslog-ng
daemon (utente syslog). - Verificare che il file
/run/azuremonitoragent/default_syslog.socket
esista e che sia accessibile rispettivamente darsyslog
osyslog-ng
. - Verificare la presenza di un calo corrispondente nel numero di eventi syslog elaborati in
/var/opt/microsoft/azuremonitoragent/log/mdsd.qos
. Se tale eliminazione non è indicata nel file, inviare un ticket con Riepilogo come "Dati Syslog eliminati nella pipeline" e Tipo di problema come "Serve assistenza con l'agente Linux di Monitoraggio di Azure". - Verificare che la coda del daemon syslog non sia in overflow, causando l'esito negativo del caricamento, facendo riferimento alle indicazioni riportate qui: I dati Rsyslog non vengono caricati a causa di un problema di spazio su disco completo nell'agente Linux AMA
- Per
- Per eseguire ulteriormente il debug dell'inserimento di eventi syslog, è possibile aggiungere il flag di traccia -T 0x2002 alla fine di MDSD_OPTIONS nel file
/etc/default/azuremonitoragent
e riavviare l'agente:export MDSD_OPTIONS="-A -c /etc/opt/microsoft/azuremonitoragent/mdsd.xml -d -r $MDSD_ROLE_PREFIX -S $MDSD_SPOOL_DIRECTORY/eh -L $MDSD_SPOOL_DIRECTORY/events -e $MDSD_LOG_DIR/mdsd.err -w $MDSD_LOG_DIR/mdsd.warn -o $MDSD_LOG_DIR/mdsd.info -T 0x2002"
- Dopo aver riprodotto il problema con il flag di traccia attivato, sono disponibili altre informazioni di debug in
/var/opt/microsoft/azuremonitoragent/log/mdsd.info
. Esaminare il file per individuare la possibile causa del problema di raccolta syslog, ad esempio l'analisi/elaborazione/configurazione/errori di caricamento.Avviso
Assicurarsi di rimuovere l'impostazione del flag di traccia -T 0x2002 dopo la sessione di debug, poiché genera molte istruzioni di traccia che potrebbero riempire il disco più rapidamente o rendere visivamente difficile l'analisi del file di log.
- Se nessuno dei precedenti è utile, inviare un ticket con Riepilogo come "AMA non riesce a raccogliere eventi syslog" e tipo di problema come "Serve assistenza con l'agente Linux di Monitoraggio di Azure".
Risoluzione dei problemi nel server abilitato per Arc
Se dopo aver controllato i passaggi di risoluzione dei problemi di base non viene visualizzato l'agente di Monitoraggio di Azure che genera log o viene trovato "Non è stato possibile ottenere il token MSI dall'endpoint IMDS" nel /var/opt/microsoft/azuremonitoragent/log/mdsd.err
file di log, è probabile che syslog
l'utente non sia membro del gruppo himds
. Aggiungere syslog
un utente al himds
gruppo di utenti se l'utente non è membro di questo gruppo. Creare l'utente syslog
e il gruppo syslog
, se necessario, e assicurarsi che l'utente si trova in tale gruppo. Per altre informazioni, vedere Requisiti di autenticazione server abilitati per Azure Arc qui.
Inviare un ticket
- Aprire una regola di raccolta dati e nel menu a sinistra selezionare Nuova richiesta di supporto. È anche possibile aprire il riquadro Guida e supporto e selezionare Crea una richiesta di supporto.
- Selezionare:
- Tipo di problema: tecnico.
- Sottoscrizione: selezionare la sottoscrizione in cui si trovano i computer.
- Tipo di servizio: regole di raccolta dati e agente di Monitoraggio di Azure.
- Il problema è correlato a una risorsa?: Sì. Selezionare il computer usando la selezione risorse.
- Immettere Riepilogo e tipo di problema , come indicato dai passaggi di risoluzione dei problemi. Le informazioni accurate comportano una risoluzione più rapida del problema.
- Selezionare Avanti e esaminare le soluzioni consigliate per verificare se sono utili.
- Se non aiutano, selezionare Avanti e compilare il set successivo di dettagli.
- Selezionare Avanti, esaminare i dettagli finali e selezionare Crea.