Batch-metrikák, riasztások és naplók diagnosztikai kiértékeléshez és monitorozáshoz

Az Azure Monitor metrikákat és diagnosztikai naplókat gyűjt az Azure Batch-fiókjában található erőforrásokhoz.

Ezeket az adatokat többféleképpen is összegyűjtheti és felhasználhatja a Batch-fiók monitorozásához és a problémák diagnosztizálásához. Metrikariasztásokat is konfigurálhat, hogy értesítéseket kapjon, amikor egy metrika eléri a megadott értéket.

Batch-metrikák

A metrikák olyan Azure-beli telemetriai adatok (más néven teljesítményszámlálók), amelyeket az Azure-erőforrások bocsátanak ki és az Azure Monitor szolgáltatás használ fel. A Batch-fiók metrikái közé tartoznak például a készlet-létrehozási események, a Low-Priority a csomópontok száma és a tevékenység befejezett eseményei. Ezek a metrikák segíthetnek azonosítani a trendeket, és adatelemzéshez használhatók.

Tekintse meg a támogatott Batch-metrikák listáját.

A metrikák a következők:

  • Alapértelmezés szerint engedélyezve van minden Batch-fiókban további konfiguráció nélkül
  • 1 percenként generálva
  • Nem őrizhető meg automatikusan, de 30 napos gördülő előzményei vannak. A diagnosztikai naplózás részeként megőrizheti a tevékenységmetrikákat.

Batch-metrikák megtekintése

A Azure Portal a Batch-fiók Áttekintés lapján alapértelmezés szerint megjelennek a fő csomópontok, a magok és a tevékenységek metrikái.

Batch-fiók további metrikáinak megtekintése:

  1. A Azure Portal válassza a Mindenszolgáltatásbatch-fiók> lehetőséget, majd válassza ki a Batch-fiók nevét.
  2. A Figyelés területen kattintson a Metrikák elemre.
  3. Válassza a Metrika hozzáadása lehetőséget, majd válasszon ki egy metrikát a legördülő listából.
  4. Válasszon egy összesítési lehetőséget a metrika számára. A darabszám-alapú metrikákhoz (például "Dedikált magok száma" vagy "Alacsony prioritású csomópontok száma" ) használja az átlagos összesítést . Eseményalapú metrikák (például "Készlet átméretezése teljes események" esetén) használja a Count (Darabszám) összesítést. Kerülje az Összeg aggregáció használatát, amely összeadja a diagram időszakában kapott összes adatpont értékét.
  5. További metrikák hozzáadásához ismételje meg a 3. és a 4. lépést.

A metrikákat programozott módon is lekérheti az Azure Monitor API-kkal. Példa: Azure Monitor-metrikák lekérése a .NET-tel.

Megjegyzés

Az elmúlt 3 percben kibocsátott metrikák továbbra is összesítve lehetnek, ezért előfordulhat, hogy az értékek nem lesznek jelentve ebben az időkeretben. A metrika kézbesítése nem garantált, és ez hatással lehet a rendelésen kívüli kézbesítésre, az adatvesztésre vagy a duplikálásra.

Batch-metrikariasztások

Közel valós idejű metrikariasztásokat konfigurálhat, amelyek akkor aktiválnak, ha egy adott metrika értéke átlép egy hozzárendelt küszöbértéket. A riasztás értesítést küld, ha a riasztás "Aktiválva" állapotú (a küszöbérték átlépésekor és a riasztási feltétel teljesülésekor), valamint "Feloldva" állapotban (amikor a küszöbértéket ismét átlépik, és a feltétel már nem teljesül).

Mivel a metrikák kézbesítése inkonzisztenciákhoz, például rendelésen kívüli kézbesítéshez, adatvesztéshez vagy duplikációhoz vezethet, javasoljuk, hogy kerülje az egyetlen adatponton aktiváló riasztásokat. Ehelyett használjon küszöbértékeket az esetleges inkonzisztenciák, például a rendelésen kívüli kézbesítés, az adatvesztés és a duplikáció egy adott időszakban történő figyelembe vételéhez.

Előfordulhat például, hogy metrikariasztást szeretne konfigurálni, ha az alacsony prioritású magok száma egy bizonyos szintre esik, így módosíthatja a készletek összetételét. A legjobb eredmény érdekében állítson be egy 10 vagy több perces időszakot, ahol a riasztás akkor aktiválódik, ha az alacsony prioritású magok átlagos száma a teljes időszak küszöbértéke alá esik. Ez lehetővé teszi a metrikák összesítését, hogy pontosabb eredményeket kapjon.

Metrikariasztás konfigurálása a Azure Portal:

  1. Válassza az ÖsszesservicesBatch-fiók> lehetőséget, majd válassza ki a Batch-fiók nevét.
  2. A Figyelés területen válassza a Riasztások, majd az Új riasztási szabály lehetőséget.
  3. Válassza a Feltétel hozzáadása lehetőséget, majd válasszon ki egy metrikát.
  4. Válassza ki a diagramidőszak, a küszöbérték, az operátor és az összesítés típusának kívánt értékeit.
  5. Adjon meg egy küszöbértéket , és válassza ki a küszöbérték egységét . Ezután válassza a Done (Kész) elemet.
  6. Műveletcsoport hozzáadása a riasztáshoz egy meglévő műveletcsoport kiválasztásával vagy egy új műveletcsoport létrehozásával.
  7. A Riasztási szabály részletei szakaszban adja meg a riasztási szabály nevét és leírását. Ha azt szeretné, hogy a riasztás azonnal engedélyezve legyen, győződjön meg arról, hogy a riasztás engedélyezése szabály a létrehozáskor jelölőnégyzet be van jelölve.
  8. Válassza a Riasztási szabály létrehozása lehetőséget.

A metrikariasztások létrehozásával kapcsolatos további információkért tekintse meg, hogyan működnek a metrikariasztások az Azure Monitorban, és hogyan hozhat létre, tekinthet meg és kezelhet metrikariasztásokat az Azure Monitor használatával.

Közel valós idejű riasztást is konfigurálhat az Azure Monitor REST API-val. További információt az Microsoft Azure riasztásainak áttekintésében talál. Ha feladat-, feladat- vagy készletspecifikus információkat szeretne szerepeltetni a riasztásokban, tekintse meg az Azure Monitor naplóriasztásokat.

Batch-diagnosztika

A diagnosztikai naplók az Azure-erőforrások által kibocsátott információkat tartalmaznak, amelyek az egyes erőforrások működését írják le. A Batch esetében a következő naplókat gyűjtheti:

  • ServiceLog: a Batch szolgáltatás által egy adott erőforrás, például készlet vagy tevékenység élettartama során kibocsátott események.
  • AllMetrics: Metrikák a Batch-fiók szintjén.

Explicit módon engedélyeznie kell a diagnosztikai beállításokat minden figyelni kívánt Batch-fiókhoz.

Naplócél beállításai

Gyakori forgatókönyv egy Azure-Storage-fiók kiválasztása naplócélként. A naplók Azure Storage-ban való tárolásához hozza létre a fiókot a naplók gyűjtésének engedélyezése előtt. Ha tárfiókot társított a Batch-fiókhoz, ezt a fiókot választhatja naplócélként.

Másik lehetőségként:

  • Batch diagnosztikai naplóesemények streamelése egy Azure-eseményközpontba. Az Event Hubs másodpercenként több millió eseményt képes feldolgozni, amelyeket aztán bármilyen valós idejű elemzési szolgáltatóval átalakíthat és tárolhat.
  • Diagnosztikai naplókat küldhet az Azure Monitor-naplókba, ahol elemezheti őket, vagy exportálhatja őket elemzésre Power BI vagy Excel.

Megjegyzés

A diagnosztikai naplóadatok Azure-szolgáltatásokkal való tárolásához vagy feldolgozásához további költségek merülhetnek fel.

Batch diagnosztikai naplók gyűjtésének engedélyezése

Ha új diagnosztikai beállítást szeretne létrehozni a Azure Portal, kövesse az alábbi lépéseket.

  1. A Azure Portal válassza a Mindenszolgáltatásbatch-fiók> lehetőséget, majd válassza ki a Batch-fiók nevét.
  2. A Monitorozás területen kattintson a Diagnosztikai beállítások elemre.
  3. A Diagnosztikai beállítások területen válassza a Diagnosztikai beállítás hozzáadása lehetőséget.
  4. Adja meg a beállítás nevét.
  5. Válasszon ki egy célhelyet: Küldés a Log Analyticsbe, archiválás tárfiókba vagy Stream egy eseményközpontba. Ha tárfiókot választ, megadhatja, hogy hány napig őrizze meg az adatokat az egyes naplókhoz. Ha nem ad meg több napot a megőrzésre, az adatok a tárfiók élettartama alatt lesznek megőrizve.
  6. Válassza a ServiceLog, az AllMetrics vagy mindkettő lehetőséget.
  7. Válassza a Mentés lehetőséget a diagnosztikai beállítás létrehozásához.

A naplógyűjtést úgy is engedélyezheti, hogy diagnosztikai beállításokat hoz létre a Azure Portal, Resource Manager sablont, vagy Azure PowerShell vagy az Azure CLI-t használja. További információ: Az Azure platformnaplóinak áttekintése.

Diagnosztikai naplók elérése a tárolóban

Ha a Batch diagnosztikai naplóit egy tárfiókban archiválja, a tárfiókban azonnal létrejön egy tároló, amint egy kapcsolódó esemény bekövetkezik. A blobok az alábbi elnevezési minta szerint jönnek létre:

insights-{log category name}/resourceId=/SUBSCRIPTIONS/{subscription ID}/
RESOURCEGROUPS/{resource group name}/PROVIDERS/MICROSOFT.BATCH/
BATCHACCOUNTS/{Batch account name}/y={four-digit numeric year}/
m={two-digit numeric month}/d={two-digit numeric day}/
h={two-digit 24-hour clock hour}/m=00/PT1H.json

Például:

insights-metrics-pt1m/resourceId=/SUBSCRIPTIONS/XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX/
RESOURCEGROUPS/MYRESOURCEGROUP/PROVIDERS/MICROSOFT.BATCH/
BATCHACCOUNTS/MYBATCHACCOUNT/y=2018/m=03/d=05/h=22/m=00/PT1H.json

Minden PT1H.json blobfájl JSON-formátumú eseményeket tartalmaz, amelyek a blob URL-címében megadott órán belül történtek (például h=12). A jelen órában a rendszer az eseményeket a PT1H.json fájlhoz fűzi, amint bekövetkeznek. A percérték (m=00) mindig 00az, mivel a diagnosztikai naplóesemények óránként külön blobokba vannak bontva. (Minden időpont UTC-ben van megadva.)

Az alábbi példában PoolResizeCompleteEvent egy bejegyzés látható egy PT1H.json naplófájlban. Információkat tartalmaz a dedikált és alacsony prioritású csomópontok aktuális és célszámáról, valamint a művelet kezdési és befejezési időpontjáról:

{ "Tenant": "65298bc2729a4c93b11c00ad7e660501", "time": "2019-08-22T20:59:13.5698778Z", "resourceId": "/SUBSCRIPTIONS/XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX/RESOURCEGROUPS/MYRESOURCEGROUP/PROVIDERS/MICROSOFT.BATCH/BATCHACCOUNTS/MYBATCHACCOUNT/", "category": "ServiceLog", "operationName": "PoolResizeCompleteEvent", "operationVersion": "2017-06-01", "properties": {"id":"MYPOOLID","nodeDeallocationOption":"Requeue","currentDedicatedNodes":10,"targetDedicatedNodes":100,"currentLowPriorityNodes":0,"targetLowPriorityNodes":0,"enableAutoScale":false,"isAutoPool":false,"startTime":"2019-08-22 20:50:59.522","endTime":"2019-08-22 20:59:12.489","resultCode":"Success","resultMessage":"The operation succeeded"}}

A tárfiók naplóinak programozott eléréséhez használja a Storage API-kat.

Szolgáltatásnapló-események

Azure Batch szolgáltatásnaplók olyan eseményeket tartalmaznak, amelyeket a Batch szolgáltatás bocsát ki egy adott Batch-erőforrás, például egy készlet vagy tevékenység élettartama során. A Batch által kibocsátott minden esemény JSON formátumban van naplózva. Ez például egy mintakészlet létrehozási eseményének törzse:

{
    "id": "myPool1",
    "displayName": "Production Pool",
    "vmSize": "Standard_F1s",
    "imageType": "VirtualMachineConfiguration",
    "cloudServiceConfiguration": {
        "osFamily": "3",
        "targetOsVersion": "*"
    },
    "networkConfiguration": {
        "subnetId": " "
    },
    "virtualMachineConfiguration": {
          "imageReference": {
            "publisher": " ",
            "offer": " ",
            "sku": " ",
            "version": " "
          },
          "nodeAgentId": " "
        },
    "resizeTimeout": "300000",
    "targetDedicatedNodes": 2,
    "targetLowPriorityNodes": 2,
    "taskSlotsPerNode": 1,
    "vmFillType": "Spread",
    "enableAutoScale": false,
    "enableInterNodeCommunication": false,
    "isAutoPool": false
}

A Batch szolgáltatás által kibocsátott szolgáltatásnapló-események a következők:

Következő lépések