Linee guida per la risoluzione dei problemi per l'agente di Monitoraggio di Azure in macchine virtuali Linux e set di scalabilità

Panoramica dell'agente di Monitoraggio di Azure

Prima di leggere altre informazioni, è necessario avere familiarità con l'agente di Monitoraggio di Azure e le regole di raccolta dati.

Terminologia

Nome Acronimo Descrizione
Agente di Monitoraggio di Azure AMA Nuovo agente di Monitoraggio di Azure
Regole di raccolta dati DCR Regole per configurare la raccolta di dati dall'agente, ad esempio cosa raccogliere, dove inviare e altro ancora
Servizio di configurazione di Monitoraggio di Azure AMCS Servizio a livello di area ospitato in Azure, che controlla la raccolta dei dati per questo agente e altre parti di Monitoraggio di Azure. L'agente chiama in questo servizio per recuperare i controller di dominio.
Endpoint dei log -- Endpoint per l'invio di dati alle aree di lavoro Log Analytics
Endpoint delle metriche -- Endpoint per l'invio di dati ai database delle metriche di Monitoraggio di Azure.
Servizio metadati dell'istanza e ibrido IMDS e HIMDS Servizi ospitati in Azure che forniscono informazioni sulle macchine virtuali attualmente in esecuzione, sui set di scalabilità (tramite IMDS) e sui server abilitati per Arc (tramite HIMDS) rispettivamente
Area di lavoro Log Analytics LEGGE Destinazione in Monitoraggio di Azure a cui è possibile inviare i log raccolti dall'agente
Metriche personalizzate -- Destinazione in Monitoraggio di Azure a cui è possibile inviare le metriche guest raccolte dall'agente

Procedura di base per la risoluzione dei problemi

Seguire questa procedura per risolvere i problemi relativi alla versione più recente dell'agente di Monitoraggio di Azure in esecuzione nella macchina virtuale Linux:

  1. Esaminare attentamente i prerequisiti qui.

  2. Verificare che l'estensione sia stata installata e di cui è stato eseguito il provisioning, che installa i file binari dell'agente nel computer:

    1. Aprire portale di Azure > selezionare la macchina > virtuale Apri impostazioni: estensioni e applicazioni dal riquadro a sinistra > "AzureMonitorLinuxAgent" dovrebbe essere visualizzata con Stato: "Provisioning riuscito"
    2. Se l'estensione non è elencata, controllare se il computer può raggiungere Azure e trovare l'estensione da installare usando il comando seguente:
      az vm extension image list-versions --location <machine-region> --name AzureMonitorLinuxAgent --publisher Microsoft.Azure.Monitor
      
    3. Attendere 10-15 minuti perché l'estensione potrebbe essere in stato di transizione. Se non viene ancora visualizzato come indicato in precedenza, disinstallare e installare di nuovo l'estensione .
    4. Controllare se vengono visualizzati errori nei log di estensione presenti /var/log/azure/Microsoft.Azure.Monitor.AzureMonitorLinuxAgent/ nel computer
    5. Se nessuno dei precedenti è utile, inviare un ticket con Riepilogo come "l'estensione AMA non riesce a installare o effettuare il provisioning" e tipo di problema come "Serve assistenza con l'agente Linux di Monitoraggio di Azure".
  3. Verificare che l'agente sia in esecuzione:

    1. Controllare se l'agente genera log heartbeat nell'area di lavoro Log Analytics usando la query seguente. Ignorare se "Metriche personalizzate" è l'unica destinazione nel Registro Azure Container:
      Heartbeat | where Category == "Azure Monitor Agent" and Computer == "<computer-name>" | take 10
      
    2. Controllare se il servizio agente è in esecuzione
      systemctl status azuremonitoragent
      
    3. Controllare se vengono visualizzati errori nei log dell'agente di base presenti /var/opt/microsoft/azuremonitoragent/log/mdsd.* nel computer
    4. Se nessuno dei precedenti risulta utile, inviare un ticket con Riepilogo come "Estensione AMA con provisioning ma non in esecuzione" e Tipo di problema come "Serve assistenza con l'agente Linux di Monitoraggio di Azure".
  4. Verificare che il DCR esista e sia associato alla macchina virtuale:

    1. Se si usa l'area di lavoro Log Analytics come destinazione, verificare che DCR esista nella stessa area fisica dell'area di lavoro Log Analytics.
    2. Aprire portale di Azure > selezionare la regola > di raccolta dati Apri configurazione: risorse dal riquadro a sinistra > Dovrebbe essere visualizzata la macchina virtuale elencata qui.
    3. Se non è elencato, fare clic su "Aggiungi" e selezionare la macchina virtuale dalla selezione risorse. Ripetere tutti i controller di dominio.
    4. Se nessuno dei precedenti risulta utile, inviare un ticket con Riepilogo come "DCR non trovato o associato" e Tipo di problema come "Serve aiuto per configurare la raccolta dati da una macchina virtuale".
  5. Verificare che l'agente sia stato in grado di scaricare i DCR associati dal servizio AMCS:

    1. Controllare se viene visualizzata la versione più recente di DCR scaricata in questo percorso /etc/opt/microsoft/azuremonitoragent/config-cache/configchunks/
    2. In caso contrario, inviare un ticket con Riepilogo come "AMA non è in grado di scaricare la configurazione DCR" e tipo di problema come "Serve assistenza con l'agente Linux di Monitoraggio di Azure".

Problemi durante la raccolta di Syslog

Per altre informazioni su come risolvere i problemi di syslog con l'agente di Monitoraggio di Azure, vedere qui.

  • Il file /var/opt/microsoft/azuremonitoragent/log/mdsd.qos qualità del servizio (QoS) fornisce aggregazioni in formato CSV di 15 minuti degli eventi elaborati e contiene le informazioni sulla quantità di eventi syslog elaborati nell'intervallo di tempo specificato. Questo file è utile per tenere traccia delle gocce di inserimento eventi Syslog.

    Ad esempio, il frammento seguente mostra che nei 15 minuti precedenti al 2022-02-28T19:55:23.5432920Z, l'agente ha ricevuto 77 eventi syslog con informazioni sul daemon della struttura e sul livello e ha inviato 77 di tali eventi all'attività di caricamento. Inoltre, l'attività di caricamento dell'agente ha ricevuto 77 e caricato correttamente tutti e 77 di questi messaggi daemon.info.

    #Time: 2022-02-28T19:55:23.5432920Z
    #Fields: Operation,Object,TotalCount,SuccessCount,Retries,AverageDuration,AverageSize,AverageDelay,TotalSize,TotalRowsRead,TotalRowsSent
    ...
    MaRunTaskLocal,daemon.debug,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.info,15,15,0,60000,46.2,0,693,77,77
    MaRunTaskLocal,daemon.notice,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.warning,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.error,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.critical,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.alert,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.emergency,15,15,0,60000,0,0,0,0,0
    ...
    MaODSRequest,https://e73fd5e3-ea2b-4637-8da0-5c8144b670c8_LogManagement,15,15,0,455067,476.467,0,7147,77,77
    

Passaggi per la risoluzione dei problemi

  1. Esaminare prima i passaggi generici per la risoluzione dei problemi di Linux AMA . Se l'agente emette heartbeat, procedere con il passaggio 2.
  2. La configurazione analizzata viene archiviata in /etc/opt/microsoft/azuremonitoragent/config-cache/configchunks/. Verificare che la raccolta Syslog sia definita e che le destinazioni di log siano uguali a quella costruita in DCR UI/DCR JSON.
    1. In caso affermativo, procedere con il passaggio 3. In caso contrario, il problema si verifica nel flusso di lavoro di configurazione.
    2. Esaminare mdsd.errimdsd.warn file /var/opt/microsoft/azuremonitoragent/log in mdsd.info per individuare possibili errori di configurazione.
    3. Se nessuno dei precedenti risulta utile, inviare un ticket con Riepilogo come "Syslog DCR non disponibile" e Tipo di problema come "Serve aiuto per configurare la raccolta dati da una macchina virtuale".
  3. Convalidare il layout del flusso di lavoro della raccolta Syslog per assicurarsi che tutte le parti necessarie siano presenti e accessibili:
    1. Per rsyslog gli utenti, assicurarsi che il /etc/rsyslog.d/10-azuremonitoragent.conf file sia presente, non sia vuoto ed è accessibile dal rsyslog daemon (utente syslog).
      1. Controllare la configurazione di rsyslog in /etc/rsyslog.conf e /etc/rsyslog.d/* per verificare se sono presenti input associati a un set di regole non predefinito, poiché i messaggi provenienti da questi input non verranno inoltrati all'agente di Monitoraggio di Azure. Ad esempio, i messaggi di un input configurato con un set di regole non predefinito come input(type="imtcp" port="514" ruleset="myruleset") non verranno inoltrati.
    2. Per syslog-ng gli utenti, assicurarsi che il /etc/syslog-ng/conf.d/azuremonitoragent.conf file sia presente, non sia vuoto ed è accessibile dal syslog-ng daemon (utente syslog).
    3. Verificare che il file /run/azuremonitoragent/default_syslog.socket esista e che sia accessibile rispettivamente da rsyslog o syslog-ng .
    4. Verificare la presenza di un calo corrispondente nel numero di eventi syslog elaborati in /var/opt/microsoft/azuremonitoragent/log/mdsd.qos. Se tale eliminazione non è indicata nel file, inviare un ticket con Riepilogo come "Dati Syslog eliminati nella pipeline" e Tipo di problema come "Serve assistenza con l'agente Linux di Monitoraggio di Azure".
    5. Verificare che la coda del daemon syslog non sia in overflow, causando l'esito negativo del caricamento, facendo riferimento alle indicazioni riportate qui: I dati Rsyslog non vengono caricati a causa di un problema di spazio su disco completo nell'agente Linux AMA
  4. Per eseguire ulteriormente il debug dell'inserimento di eventi syslog, è possibile aggiungere il flag di traccia -T 0x2002 alla fine di MDSD_OPTIONS nel file /etc/default/azuremonitoragente riavviare l'agente:
    export MDSD_OPTIONS="-A -c /etc/opt/microsoft/azuremonitoragent/mdsd.xml -d -r $MDSD_ROLE_PREFIX -S $MDSD_SPOOL_DIRECTORY/eh -L $MDSD_SPOOL_DIRECTORY/events -e $MDSD_LOG_DIR/mdsd.err -w $MDSD_LOG_DIR/mdsd.warn -o $MDSD_LOG_DIR/mdsd.info -T 0x2002"
    
  5. Dopo aver riprodotto il problema con il flag di traccia attivato, sono disponibili altre informazioni di debug in /var/opt/microsoft/azuremonitoragent/log/mdsd.info. Esaminare il file per individuare la possibile causa del problema di raccolta syslog, ad esempio l'analisi/elaborazione/configurazione/errori di caricamento.

    Avviso

    Assicurarsi di rimuovere l'impostazione del flag di traccia -T 0x2002 dopo la sessione di debug, poiché genera molte istruzioni di traccia che potrebbero riempire il disco più rapidamente o rendere visivamente difficile l'analisi del file di log.

  6. Se nessuno dei precedenti è utile, inviare un ticket con Riepilogo come "AMA non riesce a raccogliere eventi syslog" e tipo di problema come "Serve assistenza con l'agente Linux di Monitoraggio di Azure".

Risoluzione dei problemi nel server abilitato per Arc

Se dopo aver controllato i passaggi di risoluzione dei problemi di base non viene visualizzato l'agente di Monitoraggio di Azure che genera log o viene trovato "Non è stato possibile ottenere il token MSI dall'endpoint IMDS" nel /var/opt/microsoft/azuremonitoragent/log/mdsd.err file di log, è probabile che syslog l'utente non sia membro del gruppo himds. Aggiungere syslog un utente al himds gruppo di utenti se l'utente non è membro di questo gruppo. Creare l'utente syslog e il gruppo syslog, se necessario, e assicurarsi che l'utente si trova in tale gruppo. Per altre informazioni, vedere Requisiti di autenticazione server abilitati per Azure Arc qui.

Inviare un ticket

  1. Aprire una regola di raccolta dati e nel menu a sinistra selezionare Nuova richiesta di supporto. È anche possibile aprire il riquadro Guida e supporto e selezionare Crea una richiesta di supporto.
  2. Selezionare:
    • Tipo di problema: tecnico.
    • Sottoscrizione: selezionare la sottoscrizione in cui si trovano i computer.
    • Tipo di servizio: regole di raccolta dati e agente di Monitoraggio di Azure.
    • Il problema è correlato a una risorsa?: Sì. Selezionare il computer usando la selezione risorse.
  3. Immettere Riepilogo e tipo di problema , come indicato dai passaggi di risoluzione dei problemi. Le informazioni accurate comportano una risoluzione più rapida del problema.
  4. Selezionare Avanti e esaminare le soluzioni consigliate per verificare se sono utili.
  5. Se non aiutano, selezionare Avanti e compilare il set successivo di dettagli.
  6. Selezionare Avanti, esaminare i dettagli finali e selezionare Crea.