Pokyny k řešení potíží pro agenta Azure Monitoru na virtuálních počítačích s Linuxem a škálovacích sadách

Přehled agenta Služby Azure Monitor

Než budete pokračovat, musíte být obeznámeni s agentem Azure Monitoru a pravidly shromažďování dat.

Terminologie

Name Zkratka Description
Agent Azure Monitoru AMA Nový agent Služby Azure Monitor
Pravidla shromažďování dat DCR Pravidla pro konfiguraci shromažďování dat agentem, tj. co shromažďovat, kam se mají odesílat, a další
Konfigurační služba Azure Monitoru AMCS Regionální služba hostovaná v Azure, která řídí shromažďování dat pro tohoto agenta a další části služby Azure Monitor. Agent volá tuto službu, aby načítá řadiče domény.
Koncový bod protokolů -- Koncový bod pro odesílání dat do pracovních prostorů Služby Log Analytics
Koncový bod metrik -- Koncový bod pro odesílání dat do databází metrik služby Azure Monitor
Služba metadat instance a hybridní IMDS a HIMDS Služby hostované v Azure, které poskytují informace o aktuálně spuštěných virtuálních počítačích, škálovacích sadách (přes IMDS) a serverech s podporou Arc (prostřednictvím HIMDS).
Pracovní prostor služby Log Analytics ZÁKON Cíl ve službě Azure Monitor, do kterého můžete odesílat protokoly shromážděné agentem
Vlastní metriky -- Cíl ve službě Azure Monitor, do kterého můžete odesílat metriky hosta shromážděné agentem

Základní postupy při řešení potíží

Při řešení potíží s nejnovější verzí agenta Azure Monitoru spuštěného na virtuálním počítači s Linuxem postupujte následovně:

  1. Pečlivě si projděte požadavky.

  2. Ověřte, že se rozšíření úspěšně nainstalovalo a zřídilo, což nainstaluje binární soubory agenta na váš počítač:

    1. V levé nabídce > AzureMonitorLinuxAgent by se mělo zobrazit okno Otevřít virtuální počítač>: Rozšíření a aplikace: Zřizování bylo úspěšné.>
    2. Pokud se toto rozšíření nezobrazuje, zkontrolujte, jestli se počítač dostane do Azure, a pomocí následujícího příkazu vyhledejte rozšíření, které se má nainstalovat:
       az vm extension image list-versions --location <machine-region> --name AzureMonitorLinuxAgent --publisher Microsoft.Azure.Monitor
      
    3. Počkejte na 10 až 15 minut, protože rozšíření může být ve stavu přechodu. Pokud se stále nezobrazuje jako výše, odinstalujte a nainstalujte rozšíření znovu.
    4. Zkontrolujte, jestli se v protokolech rozšíření na vašem počítači zobrazují /var/log/azure/Microsoft.Azure.Monitor.AzureMonitorLinuxAgent/ nějaké chyby.
    5. Pokud žádná z výše uvedených možností nepomůže, vytvořte lístek se souhrnem , protože rozšíření AMA se nepodaří nainstalovat nebo zřídit a typ problému jako "Potřebuji pomoc s agentem Azure Monitor Linuxu".
  3. Ověřte, že je agent spuštěný:

    1. Pomocí následujícího dotazu zkontrolujte, jestli agent generuje protokoly prezenčních signálů do pracovního prostoru Služby Log Analytics. Přeskočte, pokud je vlastní metrika jediným cílem v DCR:
       Heartbeat | where Category == "Azure Monitor Agent" and 'Computer' == "<computer-name>" | take 10
      
    2. Zkontrolujte, jestli je spuštěná služba agenta.
       systemctl status azuremonitoragent
      
    3. Zkontrolujte, jestli se v protokolech základního agenta na vašem počítači zobrazují /var/opt/microsoft/azuremonitoragent/log/mdsd.* nějaké chyby.
    4. Pokud žádná z výše uvedených možností nepomůže, vytvořte lístek se souhrnem jako "zřízené rozšíření AMA, ale není spuštěno" a typ problému jako "Potřebuji pomoc s agentem Azure Monitor Linuxu".
  4. Ověřte, že řadič domény existuje a je přidružený k virtuálnímu počítači:

    1. Pokud jako cíl používáte pracovní prostor Služby Log Analytics, ověřte, že řadič domény existuje ve stejné fyzické oblasti jako pracovní prostor Služby Log Analytics.
    2. Otevřete Azure Portal > , vyberte pravidlo > shromažďování dat Otevřít konfiguraci : Okno Prostředky v levé nabídce > : Měli byste vidět virtuální počítač uvedený tady.
    3. Pokud není uvedený, klikněte na Přidat a vyberte virtuální počítač z výběru prostředků. Opakujte napříč všemi řadiči domény.
    4. Pokud žádná z výše uvedených možností nepomůže, vytvořte lístek se souhrnem jako "DCR nebyl nalezen nebo přidružený" a typ problému jako "Potřebuji pomoc s konfigurací shromažďování dat z virtuálního počítače".
  5. Ověřte, že agent mohl stáhnout přidružené řadiče domény ze služby AMCS:

    1. Zkontrolujte, jestli se v tomto umístění zobrazuje nejnovější verze DCR stažená. /etc/opt/microsoft/azuremonitoragent/config-cache/configchunks/
    2. Pokud ne, vytvořte lístek se souhrnem jako "AMA nejde stáhnout konfiguraci DCR" a typ problému jako "Potřebuji pomoc s agentem Azure Monitor Linuxu".

Problémy se shromažďováním čítačů výkonu

Problémy se shromažďováním syslogu

Tady je postup, jak AMA shromažďuje události syslogu:

  • Nástroj AMA během procesu instalace nainstaluje výstupní konfiguraci pro démon systémového syslogu. Konfigurační soubor určuje způsob toku událostí mezi démonem syslogu a AMA.

  • Pro rsyslog (většina distribucí Linuxu) je /etc/rsyslog.d/10-azuremonitoragent.confkonfigurační soubor . Pro syslog-ng, konfigurační soubor je /etc/syslog-ng/conf.d/azuremonitoragent.conf.

  • AMA naslouchá soketu domény unixu pro příjem událostí z rsyslog / syslog-ng. Cesta soketu pro tuto komunikaci je /run/azuremonitoragent/default_syslog.socket

  • Démon syslogu bude používat fronty při zpoždění příjmu AMA nebo když AMA není dosažitelný.

  • AMA ingestuje události syslogu prostřednictvím výše uvedeného soketu a filtruje je na základě kombinace zařízení / závažnosti z konfigurace DCR v /etc/opt/microsoft/azuremonitoragent/config-cache/configchunks/. Všechny facility / severity , které nejsou přítomné v řadiči domény, se zahodí.

  • AMA se pokouší analyzovat události v souladu s RFC3164 a RFC5424. Kromě toho ví, jak parsovat formáty zpráv uvedené zde.

  • AMA identifikuje cílový koncový bod událostí syslogu z konfigurace DCR a pokusí se nahrát události.

    Poznámka

    AMA ve výchozím nastavení používá místní trvalost, všechny události přijaté z rsyslog / syslog-ng fronty se před nahráním zařadí /var/opt/microsoft/azuremonitoragent/events do fronty.

  • Soubor /var/opt/microsoft/azuremonitoragent/log/mdsd.qos QoS (Quality of Service) poskytuje agregace zpracovávaných událostí ve formátu CSV ve formátu 15 minut a obsahuje informace o množství zpracovaných událostí syslogu v daném časovém rámci. Tento soubor je užitečný při sledování poklesů příjmu událostí Syslogu.

    Následující fragment například ukazuje, že v 15 minutách předcházejících 2022-02-02-28T19:55:23.5432920Z agent obdržel 77 událostí syslogu s informacemi o démonu zařízení a úrovní a odeslal 77 z uvedených událostí úkolu nahrávání. Kromě toho úloha nahrání agenta přijala 77 a úspěšně nahrála všech 77 těchto daemon.info zpráv.

      #Time: 2022-02-28T19:55:23.5432920Z
      #Fields: Operation,Object,TotalCount,SuccessCount,Retries,AverageDuration,AverageSize,AverageDelay,TotalSize,TotalRowsRead,TotalRowsSent
      ...
      MaRunTaskLocal,daemon.debug,15,15,0,60000,0,0,0,0,0
      MaRunTaskLocal,daemon.info,15,15,0,60000,46.2,0,693,77,77
      MaRunTaskLocal,daemon.notice,15,15,0,60000,0,0,0,0,0
      MaRunTaskLocal,daemon.warning,15,15,0,60000,0,0,0,0,0
      MaRunTaskLocal,daemon.error,15,15,0,60000,0,0,0,0,0
      MaRunTaskLocal,daemon.critical,15,15,0,60000,0,0,0,0,0
      MaRunTaskLocal,daemon.alert,15,15,0,60000,0,0,0,0,0
      MaRunTaskLocal,daemon.emergency,15,15,0,60000,0,0,0,0,0
      ...
      MaODSRequest,https://e73fd5e3-ea2b-4637-8da0-5c8144b670c8_LogManagement,15,15,0,455067,476.467,0,7147,77,77
    

Postup při řešení potíží

  1. Nejprve si projděte obecné kroky pro řešení potíží s Linuxem AMA . Pokud agent generuje prezenčních signálů, přejděte ke kroku 2.
  2. Analyzovaná konfigurace je uložená na /etc/opt/microsoft/azuremonitoragent/config-cache/configchunks/adrese . Zkontrolujte, že je definovaná kolekce Syslog a cíle protokolů jsou stejné jako vytvořené v uživatelském rozhraní DCR / JSON DCR.
    1. Pokud ano, pokračujte krokem 3. Pokud ne, problém je v pracovním postupu konfigurace.
    2. Prozkoumejte mdsd.errsoubory v části /var/opt/microsoft/azuremonitoragent/log možné chyby konfigurace.mdsd.warnmdsd.info
    3. Pokud žádná z výše uvedených možností nepomůže, vytvořte lístek se souhrnem jako "Syslog DCR není k dispozici" a typ problému jako "Potřebuji pomoc s konfigurací shromažďování dat z virtuálního počítače".
  3. Ověřte rozložení pracovního postupu kolekce Syslog, abyste měli jistotu, že jsou všechny potřebné části na místě a přístupné:
    1. Pro rsyslog uživatele se ujistěte, že /etc/rsyslog.d/10-azuremonitoragent.conf soubor existuje, není prázdný a je přístupný démonem rsyslog (uživatel syslogu).
    2. Pro syslog-ng uživatele se ujistěte, že /etc/syslog-ng/conf.d/azuremonitoragent.conf soubor existuje, není prázdný a je přístupný démonem syslog-ng (uživatel syslogu).
    3. Ujistěte se, že soubor /run/azuremonitoragent/default_syslog.socket existuje a je přístupný podle rsyslog nebo syslog-ng v uvedeném pořadí.
    4. Zkontrolujte odpovídající počet zpracovaných událostí syslogu v /var/opt/microsoft/azuremonitoragent/log/mdsd.qossouboru . Pokud takový pokles není v souboru uvedený, vytvořte lístek se souhrnem dat syslogu v kanálu a typ problému jako "Potřebuji pomoc s agentem Azure Monitor Linuxu".
    5. Zkontrolujte, jestli fronta démona syslogu nepřetéká, což způsobuje selhání nahrávání, a to odkazem na pokyny zde: Data Rsyslog se nenahrála kvůli problému s plným místem na disku v agentovi AMA Linuxu.
  4. Pokud chcete ladit příjem událostí syslogu dál, můžete přidat příznak trasování -T 0x2002 na konci MDSD_OPTIONS v souboru /etc/default/azuremonitoragenta restartovat agenta:
     export MDSD_OPTIONS="-A -c /etc/opt/microsoft/azuremonitoragent/mdsd.xml -d -r $MDSD_ROLE_PREFIX -S $MDSD_SPOOL_DIRECTORY/eh -L $MDSD_SPOOL_DIRECTORY/events -e $MDSD_LOG_DIR/mdsd.err -w $MDSD_LOG_DIR/mdsd.warn -o $MDSD_LOG_DIR/mdsd.info -T 0x2002"
    
  5. Po reprodukování problému s příznakem trasování najdete další informace o ladění./var/opt/microsoft/azuremonitoragent/log/mdsd.info Zkontrolujte soubor s možnou příčinou problému s kolekcí syslogu, například parsováním, zpracováním, konfigurací nebo chybami nahrávání.

    Upozornění

    Zajistěte, aby se po relaci ladění odebralo nastavení příznaku trasování -T 0x2002 , protože generuje mnoho příkazů trasování, které by mohly disk rychleji vyplnit nebo vizuálně analyzovat soubor protokolu.

  6. Pokud žádná z výše uvedených možností nepomůže, vytvořte lístek se souhrnem , protože funkce AMA nemůže shromažďovat události syslogu a typ problému jako "Potřebuji pomoc s agentem Azure Monitor Linuxu".

Vytvoření lístku

  1. Otevřete pravidlo shromažďování dat a v nabídce vlevo vyberte Nová žádost o podporu nebo otevřete okno Nápověda a podpora a vyberte Vytvořit žádost o podporu.
  2. Vyberte
    • Typ problému: Technické
    • Předplatné: Vyberte předplatné, ve kterém se nacházejí vaše počítače.
    • Typ služby: Pravidla shromažďování dat (DCR) a agent (AMA)
    • Souvisí váš problém s prostředkem? Ano (výběr počítače pomocí automaticky otevíraných oken pro výběr prostředků)
  3. Zadejte "Souhrn" a "Typ problému", jak je uvedeno v krocích pro řešení potíží. Přesné podrobnosti vedou k rychlejšímu vyřešení problému.
  4. Klikněte na Další a zkontrolujte doporučená řešení, abyste zjistili, jestli vám pomůžou.
  5. Pokud vám to nepomůže, klikněte na Další a vyplňte další sadu podrobností.
  6. Klikněte na Další, zkontrolujte poslední podrobnosti a stiskněte Vytvořit.