Pokyny k řešení potíží s agentem Azure Monitoru na virtuálních počítačích s Linuxem a škálovacími sadami

Přehled agenta Azure Monitoru

Než budete pokračovat, musíte znát agenta Azure Monitoru a pravidla shromažďování dat.

Terminologie

Název Zkratka Description
Agent Azure Monitoru AMA Nový agent Azure Monitoru
Pravidla shromažďování dat DCR Pravidla pro konfiguraci shromažďování dat agentem, tj. co se má shromažďovat, kam se má odesílat atd.
Konfigurační služba Azure Monitoru AMCS Regionální služba hostovaná v Azure, která řídí shromažďování dat pro tohoto agenta a další části služby Azure Monitor. Agent volá tuto službu, aby načítá data dcr.
Koncový bod protokolů -- Koncový bod pro odesílání dat do pracovních prostorů služby Log Analytics
Koncový bod metrik -- Koncový bod pro odesílání dat do databází metrik Služby Azure Monitor
Služba instance Metadata Service a hybridní IMDS a HIMDS Služby hostované v Azure, které poskytují informace o aktuálně spuštěných virtuálních počítačích, škálovacích sadách (prostřednictvím IMDS) a serverech s podporou Arc (prostřednictvím HIMDS) v uvedeném pořadí
Pracovní prostor služby Log Analytics ZÁKON Cíl ve službě Azure Monitor, do kterého můžete odesílat protokoly shromážděné agentem
Vlastní metriky -- Cíl ve službě Azure Monitor, do kterého můžete odesílat metriky hosta shromážděné agentem

Základní postupy při řešení potíží

Při řešení potíží s nejnovější verzí agenta Azure Monitoru běžícího na virtuálním počítači s Linuxem postupujte následovně:

  1. Pečlivě si projděte požadavky, které najdete tady.

  2. Ověřte, že se rozšíření úspěšně nainstalovalo a zřídilo. Tím se na počítač nainstalují binární soubory agenta:

    1. Otevřete Azure Portal > vyberte virtuální počítač > Open Settings: Extensions + applications (>Rozšíření a aplikace): AzureMonitorLinuxAgent by se měl zobrazit se stavem Zřizování proběhlo úspěšně.
    2. Pokud rozšíření v seznamu nevidíte, pomocí následujícího příkazu zkontrolujte, jestli se počítač může připojit k Azure, a vyhledejte rozšíření k instalaci:
      az vm extension image list-versions --location <machine-region> --name AzureMonitorLinuxAgent --publisher Microsoft.Azure.Monitor
      
    3. Počkejte 10 až 15 minut, protože rozšíření může být ve stavu přechodu. Pokud se stále nezobrazuje jako výše uvedené, odinstalujte a nainstalujte rozšíření znovu.
    4. Zkontrolujte, jestli se v protokolech rozšíření na vašem počítači nezobrazují /var/log/azure/Microsoft.Azure.Monitor.AzureMonitorLinuxAgent/ nějaké chyby.
    5. Pokud žádná z výše uvedených možností nepomůže, vytvořte lístek se souhrnem s informacemi o tom, že se rozšíření AMA nepodařilo nainstalovat nebo zřídit, a typ problému typu Potřebuji pomoc s agentem Azure Monitoru pro Linux.
  3. Ověřte, že je agent spuštěný:

    1. Pomocí následujícího dotazu zkontrolujte, jestli agent generuje protokoly prezenčního signálu do pracovního prostoru služby Log Analytics. Pokud je jediným cílem v DCR vlastní metrika, přeskočte:
      Heartbeat | where Category == "Azure Monitor Agent" and Computer == "<computer-name>" | take 10
      
    2. Kontrola, jestli je služba agenta spuštěná
      systemctl status azuremonitoragent
      
    3. Zkontrolujte, jestli se v protokolech základního agenta na vašem počítači nezobrazují /var/opt/microsoft/azuremonitoragent/log/mdsd.* nějaké chyby.
    4. Pokud žádná z výše uvedených možností nepomůže, vytvořte lístek sesouhrnem rozšíření AMA, které je zřízené, ale není spuštěné, a typ problému typu Potřebuji pomoc s agentem Azure Monitoru pro Linux.
  4. Ověřte, že dcr existuje a je přidružené k virtuálnímu počítači:

    1. Pokud jako cíl používáte pracovní prostor služby Log Analytics, ověřte, že DCR existuje ve stejné fyzické oblasti jako pracovní prostor služby Log Analytics.
    2. Otevřete Azure Portal > vyberte pravidlo > shromažďování dat Open Configuration: Resources (>Otevřít konfiguraci: Prostředky). Tady by se měl zobrazit virtuální počítač.
    3. Pokud v seznamu není, klikněte na Přidat a ve výběru prostředků vyberte svůj virtuální počítač. Tento postup opakujte u všech dcr.
    4. Pokud žádná z výše uvedených možností nepomůže, vytvořte lístek se souhrnem " DCR se nenašlo nebo nepřidružuje" a typ problému typu Potřebuji pomoc s konfigurací shromažďování dat z virtuálního počítače.
  5. Ověřte, že agent mohl stáhnout přidružené dcr ze služby AMCS:

    1. Zkontrolujte, jestli se v tomto umístění nezobrazuje nejnovější stažený dcr. /etc/opt/microsoft/azuremonitoragent/config-cache/configchunks/
    2. Pokud ne, vytvořte lístek se souhrnem jako "AMA nemůže stáhnout konfiguraci DCR" a typ problému jako Potřebuji pomoc s agentem Azure Monitoru pro Linux.

Problémy se shromažďováním syslogu

Další informace o řešení potíží se syslogem pomocí agenta Azure Monitoru najdete tady.

  • Soubor /var/opt/microsoft/azuremonitoragent/log/mdsd.qos QoS (Quality of Service) poskytuje 15minutové agregace zpracovaných událostí ve formátu CSV a obsahuje informace o množství zpracovaných událostí syslogu v daném časovém rámci. Tento soubor je užitečný při sledování poklesů příjmu událostí Syslogu.

    Následující fragment například ukazuje, že během 15 minut před 2022-02-28T19:55:23.5432920Z agent přijal 77 událostí syslogu s informacemi o procesu démona zařízení a úrovni a odeslal 77 uvedených událostí do úlohy nahrávání. Kromě toho úloha nahrávání agenta přijala 77 a úspěšně nahrála všech 77 těchto daemon.info zpráv.

    #Time: 2022-02-28T19:55:23.5432920Z
    #Fields: Operation,Object,TotalCount,SuccessCount,Retries,AverageDuration,AverageSize,AverageDelay,TotalSize,TotalRowsRead,TotalRowsSent
    ...
    MaRunTaskLocal,daemon.debug,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.info,15,15,0,60000,46.2,0,693,77,77
    MaRunTaskLocal,daemon.notice,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.warning,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.error,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.critical,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.alert,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.emergency,15,15,0,60000,0,0,0,0,0
    ...
    MaODSRequest,https://e73fd5e3-ea2b-4637-8da0-5c8144b670c8_LogManagement,15,15,0,455067,476.467,0,7147,77,77
    

Postup při řešení potíží

  1. Nejprve si projděte obecné kroky pro řešení potíží s AMA pro Linux . Pokud agent generuje prezenční signály, pokračujte krokem 2.
  2. Analyzovaná konfigurace je uložená na adrese /etc/opt/microsoft/azuremonitoragent/config-cache/configchunks/. Zkontrolujte, že je definovaná kolekce Syslogu a že cíle protokolu jsou stejné jako cíle vytvořené v uživatelském rozhraní DCR nebo JSON DCR.
    1. Pokud ano, přejděte ke kroku 3. Pokud ne, problém je v pracovním postupu konfigurace.
    2. Prošetřete mdsd.errsoubory ve složce /var/opt/microsoft/azuremonitoragent/log ,mdsd.warnmdsd.info a zjistěte možné chyby konfigurace.
    3. Pokud nic z výše uvedeného nepomůže, vytvořte lístek se souhrnem syslog DCR není k dispozici a typem problému potřebuji pomoc s konfigurací shromažďování dat z virtuálního počítače.
  3. Ověřte rozložení pracovního postupu shromažďování syslogu, abyste měli jistotu, že jsou všechny potřebné součásti na svém místě a přístupné:
    1. U rsyslog uživatelů se ujistěte, že /etc/rsyslog.d/10-azuremonitoragent.conf je soubor přítomen, není prázdný a je přístupný pro rsyslog proces démon (uživatel syslogu).
      1. Zkontrolujte konfiguraci rsyslogu na adrese /etc/rsyslog.conf a a /etc/rsyslog.d/* zjistěte, jestli nemáte nějaké vstupy vázané na jinou než výchozí sadu pravidel, protože zprávy z těchto vstupů se nebudou předávat agentovi Azure Monitoru. Například zprávy ze vstupu nakonfigurovaného s nevýchozí sadou pravidel, jako input(type="imtcp" port="514" ruleset="myruleset") je, se nepřesměrovávat.
    2. U syslog-ng uživatelů se ujistěte, že /etc/syslog-ng/conf.d/azuremonitoragent.conf je soubor přítomen, není prázdný a je přístupný pro syslog-ng proces démon (uživatel syslogu).
    3. Ujistěte se, že soubor /run/azuremonitoragent/default_syslog.socket existuje a je přístupný pro nebo rsyslogsyslog-ng v uvedeném pořadí.
    4. Zkontrolujte odpovídající pokles počtu zpracovaných událostí syslogu v /var/opt/microsoft/azuremonitoragent/log/mdsd.qos. Pokud takové vyřazení není v souboru uvedené, vytvořte lístek se souhrnem dat vyřazených v kanálu a typem problému potřebuji pomoc s linuxovým agentem služby Azure Monitor.
    5. Zkontrolujte, že fronta démonů syslogu nepřeteče, což způsobuje selhání nahrávání. Projděte si doprovodné materiály: Data Rsyslog se nenahrála kvůli problému s plným místem na disku v agentovi AMA pro Linux.
  4. Pokud chcete dále ladit příjem událostí syslogu, můžete na konec MDSD_OPTIONS v souboru /etc/default/azuremonitoragentpřipojit příznak trasování -T 0x2002 a restartovat agenta:
    export MDSD_OPTIONS="-A -c /etc/opt/microsoft/azuremonitoragent/mdsd.xml -d -r $MDSD_ROLE_PREFIX -S $MDSD_SPOOL_DIRECTORY/eh -L $MDSD_SPOOL_DIRECTORY/events -e $MDSD_LOG_DIR/mdsd.err -w $MDSD_LOG_DIR/mdsd.warn -o $MDSD_LOG_DIR/mdsd.info -T 0x2002"
    
  5. Po reprodukování problému se zapnutým příznakem trasování najdete další informace o ladění v /var/opt/microsoft/azuremonitoragent/log/mdsd.info. Zkontrolujte, jestli soubor neobsahuje možnou příčinu problému s shromažďováním syslogu, jako jsou chyby analýzy, zpracování, konfigurace nebo nahrávání.

    Upozornění

    Po ladicí relaci nezapomeňte odebrat nastavení příznaku trasování -T 0x2002 , protože generuje mnoho příkazů trasování, které by mohly disk zaplnit rychleji nebo ztížit vizuální analýzu souboru protokolu.

  6. Pokud žádná z výše uvedených možností nepomůže, vytvořte lístek se souhrnem s informacemi o tom, že AMA neshromažďuje události syslogu a typ problému potřebuji pomoc s agentem Azure Monitoru pro Linux.

Řešení potíží na serveru s podporou arc

Pokud se po kontrole základních kroků při řešení potíží nezobrazí, že agent Azure Monitor generuje protokoly, nebo v /var/opt/microsoft/azuremonitoragent/log/mdsd.err souboru protokolu zjistíte chyby Nepodařilo se získat token MSI z koncového bodu IMDS, je pravděpodobnésyslog, že uživatel není členem skupiny himds. Pokud uživatel není členem této skupiny, přidejte syslog uživatele do himds skupiny uživatelů. V případě potřeby vytvořte uživatele syslog a skupinu sysloga ujistěte se, že je uživatel v této skupině. Další informace najdete tady v tématu Požadavky na ověřování serverů s podporou služby Azure Arc.

Vytvoření lístku

  1. Otevřete pravidlo shromažďování dat a v nabídce na levé straně vyberte Nová žádost o podporu. Můžete také otevřít podokno Nápověda a podpora a vybrat Vytvořit žádost o podporu.
  2. Vyberte:
    • Typ problému: Technický.
    • Předplatné: Vyberte předplatné, ve kterém se nacházejí vaše počítače.
    • Typ služby: Pravidla shromažďování dat a agent Azure Monitoru.
    • Souvisí váš problém s prostředkem?: Ano. Pomocí nástroje pro výběr prostředků vyberte svůj počítač.
  3. Zadejte Souhrn a Typ problému , jak je uvedeno v krocích pro řešení potíží. Přesné informace vedou k rychlejšímu řešení problému.
  4. Vyberte Další a projděte si doporučená řešení, abyste zjistili, jestli pomáhají.
  5. Pokud vám nepomůže, vyberte Další a vyplňte další sadu podrobností.
  6. Vyberte Další, zkontrolujte poslední podrobnosti a vyberte Vytvořit.