Hibaelhárítási útmutató Linux rendszerű virtuális gépeken és méretezési csoportokon futó Azure Monitor-ügynökhöz

Az Azure Monitor-ügynök áttekintése

A további információk elolvasásához ismernie kell az Azure Monitor-ügynököt és az adatgyűjtési szabályokat.

Terminológia

Name Betűszó Description
Azure Monitor-ügynök Ama Az új Azure Monitor-ügynök
Adatgyűjtési szabályok Dcr Az ügynök általi adatgyűjtés konfigurálására vonatkozó szabályok, azaz a gyűjtendő adatok, a küldés helye és egyebek
Azure Monitor konfigurációs szolgáltatás AMCS Az Azure-ban üzemeltetett regionális szolgáltatás, amely az ügynök és az Azure Monitor egyéb részei adatgyűjtését szabályozza. Az ügynök behívja ezt a szolgáltatást a DCR-ek lekéréséhez.
Naplóvégpont -- Végpont adatok Log Analytics-munkaterületekre való küldéséhez
Metrikavégpont -- Végpont az adatok Azure Monitor Metrics-adatbázisokba való küldéséhez.
Példány metaadatainak szolgáltatása és hibrid IMDS és HIMDS Az Azure-ban üzemeltetett szolgáltatások, amelyek információt nyújtanak a jelenleg futó virtuális gépekről, méretezési csoportokról (IMDS-en keresztül) és Arc-kompatibilis kiszolgálókról (HIMDS-en keresztül)
Log Analytics-munkaterület Törvény Az Azure Monitor azon célja, amellyel az ügynök által gyűjtött naplókat elküldheti a következő címre:
Egyéni metrikák -- Az Azure Monitor azon célja, amellyel az ügynök által gyűjtött vendégmetrikákat elküldheti a következő címre:

Alapvető hibaelhárítási lépések

Kövesse az alábbi lépéseket a Linux rendszerű virtuális gépen futó Azure Monitor-ügynök legújabb verziójának hibaelhárításához:

  1. Gondosan tekintse át az előfeltételeket itt.

  2. Ellenőrizze, hogy a bővítmény telepítése és kiépítése sikeresen megtörtént-e, amely telepíti az ügynök bináris fájljait a számítógépre:

    1. Nyissa meg Azure Portal > válassza ki a virtuális gépet > A bal oldali > "AzureMonitorLinuxAgent" panelen válassza a Beállítások megnyitása: Bővítmények + alkalmazások lehetőséget, és a következő állapot jelenik meg: "Sikeres kiépítés"
    2. Ha nem látja a listában a bővítményt, ellenőrizze, hogy a gép el tudja-e érni az Azure-t, és keresse meg a telepíteni kívánt bővítményt az alábbi paranccsal:
       az vm extension image list-versions --location <machine-region> --name AzureMonitorLinuxAgent --publisher Microsoft.Azure.Monitor
      
    3. Várjon 10–15 percet, mivel a bővítmény átmeneti állapotban lehet. Ha továbbra sem jelenik meg a fenti módon, távolítsa el és telepítse újra a bővítményt .
    4. Ellenőrizze, hogy lát-e hibákat a számítógépen található /var/log/azure/Microsoft.Azure.Monitor.AzureMonitorLinuxAgent/ bővítménynaplókban
    5. Ha a fentiek egyike sem segít, küldjön egy "Az AMA-bővítmény telepítése vagy kiépítése sikertelen" vagy "Segítségre van szükségem az Azure Monitor Linux-ügynökkel" típusú hibajegyet.
  3. Ellenőrizze, hogy az ügynök fut-e:

    1. Ellenőrizze, hogy az ügynök szívverési naplókat bocsát-e ki a Log Analytics-munkaterületre az alábbi lekérdezéssel. Hagyja ki, ha az "Egyéni metrikák" az egyetlen célhely a DCR-ben:
       Heartbeat | where Category == "Azure Monitor Agent" and 'Computer' == "<computer-name>" | take 10
      
    2. Ellenőrizze, hogy fut-e az ügynökszolgáltatás
       systemctl status azuremonitoragent
      
    3. Ellenőrizze, hogy lát-e hibákat a gépén /var/opt/microsoft/azuremonitoragent/log/mdsd.* található alapvető ügynöknaplókban
    4. Ha a fentiek közül egyik sem segít, küldjön egy "Kiépített, de nem futó AMA-bővítmény" és "Segítségre van szükségem az Azure Monitor Linux-ügynökkel" típusúhibajegyet.
  4. Ellenőrizze, hogy a DCR létezik-e, és a virtuális géphez van-e társítva:

    1. Ha a Log Analytics-munkaterületet használja célként, ellenőrizze, hogy a DCR ugyanabban a fizikai régióban található-e, mint a Log Analytics-munkaterület.
    2. Nyissa meg Azure Portal > válassza ki az adatgyűjtési szabályt > Open Configuration : Resources (Erőforrások) lehetőséget a bal oldali > panelen. Itt láthatja a virtuális gépet.
    3. Ha nem szerepel a listában, kattintson a Hozzáadás gombra, és válassza ki a virtuális gépet az erőforrás-választóból. Ismételje meg a műveletet az összes tartományvezérlőn.
    4. Ha a fentiek egyike sem segít, küldjön egy " DCR nem található vagy társított" összefoglaló és problématípusú jegyet a következőként: "Segítségre van szükségem az adatgyűjtés virtuális gépről történő konfigurálásához".
  5. Ellenőrizze, hogy az ügynök le tudta-e tölteni a társított DCR-eket az AMCS szolgáltatásból:

    1. Ellenőrizze, hogy megjelenik-e a legújabb DCR letöltve erre a helyre /etc/opt/microsoft/azuremonitoragent/config-cache/configchunks/
    2. Ha nem, küldjön egy "Az AMA nem tudja letölteni a DCR-konfigurációt" vagy a "Segítségre van szükségem az Azure Monitor Linux-ügynökkel" típusú hibajegyet.

Teljesítményszámlálók gyűjtésével kapcsolatos problémák

A Syslog gyűjtésével kapcsolatos problémák

Az AMA így gyűjti össze a syslog-eseményeket:

  • Az AMA a telepítési folyamat során telepíti a rendszer syslog démonának kimeneti konfigurációját. A konfigurációs fájl határozza meg, hogy az események hogyan áramlanak a syslog démon és az AMA között.

  • A (legtöbb Linux-disztribúció) esetében rsyslog a konfigurációs fájl a következő /etc/rsyslog.d/10-azuremonitoragent.conf: . A esetében syslog-nga konfigurációs fájl a következő /etc/syslog-ng/conf.d/azuremonitoragent.conf: .

  • Az AMA egy UNIX-tartományi szoftvercsatornát figyel, hogy eseményeket fogadjon a-tól rsyslog / syslog-ng. A kommunikáció szoftvercsatorna-elérési útja a következő: /run/azuremonitoragent/default_syslog.socket

  • A syslog démon üzenetsorokat fog használni, ha az AMA betöltése késik, vagy ha az AMA nem érhető el.

  • Az AMA a fent említett szoftvercsatornán keresztül betölti a syslog-eseményeket, és a DCR konfigurációjából származó létesítmény/súlyosság kombináció alapján szűri őket a fájlban /etc/opt/microsoft/azuremonitoragent/config-cache/configchunks/. A DCR-ben nem található elemeket facility / severity a rendszer elveti.

  • Az AMA megpróbálja elemezni az eseményeket az RFC3164 és az RFC5424 szerint. Emellett tudja, hogyan elemezheti az itt felsorolt üzenetformátumokat.

  • Az AMA azonosítja a Syslog-események célvégpontját a DCR-konfigurációból, és megpróbálja feltölteni az eseményeket.

    Megjegyzés

    Az AMA alapértelmezés szerint helyi adatmegőrzést használ, a rendszer a feltöltés előtt minden fogadott rsyslog / syslog-ng eseményt várólistára /var/opt/microsoft/azuremonitoragent/events helyez.

  • A szolgáltatásminőségi (QoS)-fájl /var/opt/microsoft/azuremonitoragent/log/mdsd.qos CSV formátumú, 15 perces összesítéseket biztosít a feldolgozott eseményekről, és tartalmazza a feldolgozott syslog-események mennyiségére vonatkozó információkat az adott időkeretben. Ez a fájl hasznos a Syslog eseménybetöltési csökkenéseinek nyomon követéséhez.

    Az alábbi töredék például azt mutatja, hogy a 2022-02-28T19:55:23.5432920Z előtti 15 percben az ügynök 77 syslog eseményt kapott létesítménydémonnal és szintadatokkal, és az említett események közül 77-et küldött a feltöltési feladatnak. Emellett az ügynök feltöltési feladata 77-et kapott, és sikeresen feltöltötte mind a 77 ilyen daemon.info üzenetet.

      #Time: 2022-02-28T19:55:23.5432920Z
      #Fields: Operation,Object,TotalCount,SuccessCount,Retries,AverageDuration,AverageSize,AverageDelay,TotalSize,TotalRowsRead,TotalRowsSent
      ...
      MaRunTaskLocal,daemon.debug,15,15,0,60000,0,0,0,0,0
      MaRunTaskLocal,daemon.info,15,15,0,60000,46.2,0,693,77,77
      MaRunTaskLocal,daemon.notice,15,15,0,60000,0,0,0,0,0
      MaRunTaskLocal,daemon.warning,15,15,0,60000,0,0,0,0,0
      MaRunTaskLocal,daemon.error,15,15,0,60000,0,0,0,0,0
      MaRunTaskLocal,daemon.critical,15,15,0,60000,0,0,0,0,0
      MaRunTaskLocal,daemon.alert,15,15,0,60000,0,0,0,0,0
      MaRunTaskLocal,daemon.emergency,15,15,0,60000,0,0,0,0,0
      ...
      MaODSRequest,https://e73fd5e3-ea2b-4637-8da0-5c8144b670c8_LogManagement,15,15,0,455067,476.467,0,7147,77,77
    

Hibaelhárítási lépések

  1. Először tekintse át a Linux AMA általános hibaelhárítási lépéseit . Ha az ügynök szívveréseket bocsát ki, folytassa a 2. lépéstel.
  2. Az elemzett konfiguráció tárolása a következő helyen történik: /etc/opt/microsoft/azuremonitoragent/config-cache/configchunks/. Ellenőrizze, hogy a Syslog-gyűjtemény definiálva van-e, és a naplócélok megegyeznek-e a DCR felhasználói felületén /DCR JSON-ban létrehozottval.
    1. Ha igen, folytassa a 3. lépésben. Ha nem, a probléma a konfigurációs munkafolyamatban van.
    2. Vizsgálja meg a ()mdsd.warn fájlokat, és vizsgálja meg mdsd.erra mdsd.info következő fájlokat/var/opt/microsoft/azuremonitoragent/log: lehetséges konfigurációs hibák.
    3. Ha a fentiek egyike sem segít, küldjön egy "Syslog DCR nem érhető el" összefoglaló és "Segítségre van szükségem az adatgyűjtés virtuális gépről történő konfigurálásához" típusú hibajegyet.
  3. Ellenőrizze a Syslog-gyűjtemény munkafolyamatának elrendezését, hogy az összes szükséges elem a helyén legyen és elérhető legyen:
    1. A felhasználók esetében rsyslog győződjön meg arról, hogy a /etc/rsyslog.d/10-azuremonitoragent.conf fájl jelen van, nem üres, és a rsyslog démon (syslog-felhasználó) is elérheti.
      1. Ellenőrizze az rsyslog konfigurációját a és /etc/rsyslog.d/* a címen/etc/rsyslog.conf, és ellenőrizze, hogy vannak-e olyan bemenetek, amelyek nem alapértelmezett szabálykészlethez vannak kötve, mivel ezekből a bemenetekből érkező üzenetek nem lesznek továbbítva az Azure Monitor-ügynöknek. Például egy nem alapértelmezett szabálykészlettel (például input(type="imtcp" port="514" ruleset="myruleset") ) konfigurált bemenet üzenetei nem lesznek továbbítva.
    2. A felhasználók esetében syslog-ng győződjön meg arról, hogy a /etc/syslog-ng/conf.d/azuremonitoragent.conf fájl jelen van, nem üres, és a syslog-ng démon (syslog-felhasználó) is elérheti.
    3. Győződjön meg arról, hogy a fájl /run/azuremonitoragent/default_syslog.socket létezik, és elérhető a vagy syslog-ng az rsyslog által.
    4. Ellenőrizze, hogy van-e megfelelő csökkenés a feldolgozott syslog-események számában a-ben /var/opt/microsoft/azuremonitoragent/log/mdsd.qos. Ha az ilyen csökkenés nem szerepel a fájlban, küldjön egy "Syslog-adatok elvetve a folyamatban" vagy a "Segítségre van szükségem az Azure Monitor Linux-ügynökkel" típusú hibajegyet.
    5. Ellenőrizze, hogy a syslog démonsor nem túlcsordul-e, és a feltöltés meghiúsul. Ehhez tekintse meg a következő útmutatót: Az Rsyslog-adatok feltöltése nem sikerült az AMA Linux-ügynök teljes lemezterületével kapcsolatos probléma miatt
  4. A syslog-események betöltésének további hibakereséséhez hozzáfűzheti a -T 0x2002 nyomkövetési jelzőt a fájl /etc/default/azuremonitoragentMDSD_OPTIONS végén, majd újraindíthatja az ügynököt:
     export MDSD_OPTIONS="-A -c /etc/opt/microsoft/azuremonitoragent/mdsd.xml -d -r $MDSD_ROLE_PREFIX -S $MDSD_SPOOL_DIRECTORY/eh -L $MDSD_SPOOL_DIRECTORY/events -e $MDSD_LOG_DIR/mdsd.err -w $MDSD_LOG_DIR/mdsd.warn -o $MDSD_LOG_DIR/mdsd.info -T 0x2002"
    
  5. Miután a nyomkövetési jelzővel reprodukálta a problémát, további hibakeresési információkat talál a fájlban /var/opt/microsoft/azuremonitoragent/log/mdsd.info. Vizsgálja meg a fájlban a syslog-gyűjtési probléma lehetséges okát, például elemzési/ feldolgozási/ konfigurációs / feltöltési hibákat.

    Figyelmeztetés

    Győződjön meg arról, hogy a hibakeresési munkamenet után el szeretné távolítani a -T 0x2002 nyomkövetési jelzőbeállítást, mivel számos olyan nyomkövetési utasítást generál, amelyek gyorsabban kitölthetik a lemezt, vagy megnehezíthetik a naplófájl vizuális elemzését.

  6. Ha a fentiek egyike sem segít, küldjön egy "Az AMA nem tudja összegyűjteni a syslog-eseményeket" vagy a "Segítségre van szükségem az Azure Monitor Linux-ügynökkel" típusú hibajegyet.

Jegy küldése

  1. Nyisson meg egy adatgyűjtési szabályt, és válassza az Új támogatási kérelem lehetőséget a bal oldali menüben, VAGY nyissa meg a "Súgó + támogatás" panelt, és válassza a Támogatási kérelem létrehozása lehetőséget
  2. Válassza ezt:
    • Problématípus: Technikai
    • Előfizetés: Válassza ki azt az előfizetést, amelyben a gépek találhatók
    • Szolgáltatás típusa: Adatgyűjtési szabályok (DCR) és ügynök (AMA)
    • A probléma egy erőforráshoz kapcsolódik? Igen (Válassza ki a gépet az erőforrás-választó előugró ablakával)
  3. Adja meg az "Összefoglalás" és a "Probléma típusa" kifejezést a hibaelhárítási lépések alapján. A pontos részletek a probléma gyorsabb megoldásához vezetnek.
  4. Kattintson a Tovább gombra, és tekintse át az ajánlott megoldásokat, és ellenőrizze, hogy segítenek-e.
  5. Ha nem segítenek, kattintson a Tovább gombra, és töltse ki a következő részleteket.
  6. Kattintson a Tovább gombra, tekintse át a végső részleteket, és nyomja le a "Létrehozás" elemet.