Megosztás a következőn keresztül:


Az Azure Batch monitorozása

Ez a cikk a következőket ismerteti:

  • A szolgáltatáshoz gyűjthető monitorozási adatok típusai.
  • Az adatok elemzésének módjai.

Feljegyzés

Ha már ismeri ezt a szolgáltatást és/vagy az Azure Monitort, és csak tudni szeretné, hogyan elemezheti a figyelési adatokat, tekintse meg a cikk végén található Elemzés szakaszt.

Ha olyan kritikus alkalmazásokkal és üzleti folyamatokkal rendelkezik, amelyek Az Azure-erőforrásokra támaszkodnak, figyelnie kell és riasztásokat kell kapnia a rendszeréről. Az Azure Monitor szolgáltatás a rendszer minden összetevőjéből gyűjti és összesíti a metrikákat és naplókat. Az Azure Monitor áttekintést nyújt a rendelkezésre állásról, a teljesítményről és a rugalmasságról, és értesíti Önt a problémákról. A monitorozási adatok beállításához és megtekintéséhez használhatja az Azure Portalt, a PowerShellt, az Azure CLI-t, a REST API-t vagy az ügyfélkódtárakat.

Erőforrástípusok

Az Azure az erőforrástípusok és azonosítók fogalmát használja az előfizetések minden elemének azonosítására. Az erőforrástípusok az Azure-ban futó összes erőforrás erőforrásazonosítóinak is részét képezik. A virtuális gépek egyik erőforrástípusa például az Microsoft.Compute/virtualMachines. A szolgáltatások és a hozzájuk kapcsolódó erőforrástípusok listáját az Erőforrás-szolgáltatók című témakörben találja.

Az Azure Monitor hasonlóan rendszerezi az alapvető monitorozási adatokat metrikákba és naplókba az erőforrástípusok, más néven névterek alapján. Különböző metrikák és naplók érhetők el a különböző erőforrástípusokhoz. Előfordulhat, hogy a szolgáltatás több erőforrástípushoz is társítva van.

A Batch erőforrástípusairól további információt a Batch monitorozási adathivatkozásában talál.

Adattárolás

Azure Monitor esetén:

  • A metrikák adatait az Azure Monitor metrikák adatbázisa tárolja.
  • A naplóadatok tárolása az Azure Monitor naplók tárolójában történik. A Log Analytics egy eszköz az Azure Portalon, amely le tudja kérdezni ezt az áruházat.
  • Az Azure-tevékenységnapló egy külön tároló, amelynek saját felülete van az Azure Portalon.

A metrikák és a tevékenységnaplók adatait igény szerint átirányíthatja az Azure Monitor-naplók tárolójába. Ezután a Log Analytics használatával lekérdezheti az adatokat, és összehasonlíthatja azokat más naplóadatokkal.

Számos szolgáltatás diagnosztikai beállításokkal küldhet metrikákat és naplóadatokat az Azure Monitoron kívüli más tárolóhelyekre. Ilyenek például az Azure Storage, a üzemeltetett partnerrendszerek és a nem Azure-beli partnerrendszerek az Event Hubs használatával.

Az Azure Monitor adatainak tárolásáról az Azure Monitor adatplatformja nyújt részletes tájékoztatást.

Diagnosztikai naplók elérése a tárolóban

Ha a Batch diagnosztikai naplóit egy tárfiókban archiválja, a rendszer azonnal létrehoz egy tárolót a tárfiókban, amint egy kapcsolódó esemény bekövetkezik. A blobok a következő elnevezési minta szerint jönnek létre:

insights-{log category name}/resourceId=/SUBSCRIPTIONS/{subscription ID}/
RESOURCEGROUPS/{resource group name}/PROVIDERS/MICROSOFT.BATCH/
BATCHACCOUNTS/{Batch account name}/y={four-digit numeric year}/
m={two-digit numeric month}/d={two-digit numeric day}/
h={two-digit 24-hour clock hour}/m=00/PT1H.json

Példa:

insights-metrics-pt1m/resourceId=/SUBSCRIPTIONS/XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX/
RESOURCEGROUPS/MYRESOURCEGROUP/PROVIDERS/MICROSOFT.BATCH/
BATCHACCOUNTS/MYBATCHACCOUNT/y=2018/m=03/d=05/h=22/m=00/PT1H.json

Minden PT1H.json blobfájl JSON formátumú eseményeket tartalmaz, amelyek a blob URL-címében megadott órán belül történtek (például h=12). A jelen órában az eseményeket a rendszer hozzáfűzi a PT1H.json fájlhoz. A percérték (m=00) mindig 00az, mivel a diagnosztikai napló eseményei óránként külön blobokra vannak bontva. Minden időpont a UTC időzónában van megadva.

Az alábbi példa egy bejegyzést PoolResizeCompleteEvent mutat be egy PT1H.json naplófájlban. A bejegyzés információkat tartalmaz a dedikált és alacsony prioritású csomópontok aktuális és célszámáról, valamint a művelet kezdési és befejezési időpontjáról.

{ "Tenant": "65298bc2729a4c93b11c00ad7e660501", "time": "2019-08-22T20:59:13.5698778Z", "resourceId": "/SUBSCRIPTIONS/XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX/RESOURCEGROUPS/MYRESOURCEGROUP/PROVIDERS/MICROSOFT.BATCH/BATCHACCOUNTS/MYBATCHACCOUNT/", "category": "ServiceLog", "operationName": "PoolResizeCompleteEvent", "operationVersion": "2017-06-01", "properties": {"id":"MYPOOLID","nodeDeallocationOption":"Requeue","currentDedicatedNodes":10,"targetDedicatedNodes":100,"currentLowPriorityNodes":0,"targetLowPriorityNodes":0,"enableAutoScale":false,"isAutoPool":false,"startTime":"2019-08-22 20:50:59.522","endTime":"2019-08-22 20:59:12.489","resultCode":"Success","resultMessage":"The operation succeeded"}}

A tárfiók naplóinak programozott eléréséhez használja a Storage API-kat.

Az Azure Monitor platformmetrikái

Az Azure Monitor platformmetrikát biztosít a legtöbb szolgáltatáshoz. Ezek a metrikák a következők:

  • Egyedileg definiálva minden névtérhez.
  • Az Azure Monitor idősoros metrikák adatbázisában tárolva.
  • Könnyű és képes közel valós idejű riasztások támogatására.
  • Egy erőforrás teljesítményének nyomon követésére szolgál az idő függvényében.

Gyűjtemény: Az Azure Monitor automatikusan gyűjti a platformmetrikákat. Nem igényel konfigurálást.

Útválasztás: A platformmetrikákat általában az Azure Monitor-naplókhoz/Log Analyticshez is átirányíthatja, így más naplóadatokkal is lekérdezheti őket. További információt a Metrikák diagnosztikai beállításában talál. A szolgáltatás diagnosztikai beállításainak konfigurálásához lásd : Diagnosztikai beállítások létrehozása az Azure Monitorban.

Az Azure Monitor összes erőforrásához gyűjthető metrikák listájáért tekintse meg az Azure Monitor támogatott metrikáit.

A Batch-fiókok metrikái közé tartoznak például a készlet-létrehozási események, az alacsony prioritású csomópontok száma és a tevékenység befejezésének eseményei. Ezek a metrikák segíthetnek azonosítani a trendeket, és adatelemzésre használhatók.

Feljegyzés

Előfordulhat, hogy az elmúlt 3 percben kibocsátott metrikák továbbra is összesítve lesznek, ezért előfordulhat, hogy az értékek alulbejelentkeznek ebben az időkeretben. A metrika kézbesítése nem garantált, és ezt befolyásolhatja a rendelésen kívüli kézbesítés, az adatvesztés vagy a duplikáció.

A Batchhez elérhető metrikák teljes listájáért tekintse meg a Batch monitorozási adatreferenciáját.

Azure Monitor-erőforrásnaplók

Az erőforrásnaplók betekintést nyújtanak az Azure-erőforrások által végrehajtott műveletekbe. A naplók automatikusan jönnek létre, de a mentésükhöz vagy lekérdezésükhöz az Azure Monitor naplóihoz kell irányítani őket. A naplók kategóriákba vannak rendezve. Egy adott névtér több erőforrásnapló-kategóriával is rendelkezhet.

Gyűjtemény: Az erőforrásnaplók csak akkor lesznek összegyűjtve és tárolva, ha diagnosztikai beállítást hoz létre, és a naplókat egy vagy több helyre irányítja. Diagnosztikai beállítás létrehozásakor meg kell adnia, hogy milyen kategóriájú naplókat kíván gyűjteni. A diagnosztikai beállításokat többféleképpen is létrehozhatja és karbantarthatja, beleértve az Azure Portalt is, programozott módon, és bár az Azure Policyt.

Útválasztás: A javasolt alapértelmezett beállítás az erőforrásnaplók Azure Monitor-naplókba való átirányítása, hogy más naplóadatokkal is lekérdezhesse őket. Más helyek is elérhetők, például az Azure Storage, az Azure Event Hubs és bizonyos Microsoft monitorozási partnerek. További információ: Azure-erőforrásnaplók és erőforrásnapló-célhelyek.

Az erőforrásnaplók gyűjtésével, tárolásával és útválasztásával kapcsolatos részletes információkért tekintse meg az Azure Monitor diagnosztikai beállításait.

Az Azure Monitor összes elérhető erőforrásnapló-kategóriájának listáját lásd: Támogatott erőforrásnaplók az Azure Monitorban.

Az Azure Monitor összes erőforrásnaplója ugyanazokkal a fejlécmezőkkel rendelkezik, amelyeket a szolgáltatásspecifikus mezők követnek. A közös sémát az Azure Monitor erőforrásnapló-sémája ismerteti.

Az elérhető erőforrásnapló-kategóriákról, a hozzájuk tartozó Log Analytics-táblákról és a Batch naplós sémáiról lásd : Batch monitorozási adatok referenciája.

Explicit módon engedélyeznie kell a diagnosztikai beállításokat minden figyelni kívánt Batch-fiókhoz.

A Batch szolgáltatáshoz a következő naplókat gyűjtheti:

  • ServiceLog: A Batch szolgáltatás által egy adott erőforrás, például készlet vagy tevékenység élettartama során kibocsátott események.
  • AllMetrics: Metrikák a Batch-fiók szintjén.

Az alábbi képernyőképen egy példa diagnosztikai beállítás látható, amely az allLogs és az AllMetrics szolgáltatást egy Log Analytics-munkaterületre küldi.

Képernyőkép a Diagnosztikai beállítás lapról, amely egy példát mutat be.

Azure Batch-készlet létrehozásakor a következő monitorozással kapcsolatos bővítmények bármelyikét telepítheti a számítási csomópontokra az adatok gyűjtéséhez és elemzéséhez:

A különböző bővítmények és ügynökök, valamint az általuk gyűjtött adatok összehasonlításához tekintse meg az ügynökök összehasonlítása című témakört.

Azure-tevékenységnapló

A tevékenységnapló előfizetésszintű eseményeket tartalmaz, amelyek nyomon követik az egyes Azure-erőforrások műveleteit az adott erőforráson kívülről látható módon; például új erőforrás létrehozása vagy virtuális gép indítása.

Gyűjtemény: A tevékenységnapló-események automatikusan létrejönnek, és egy külön tárolóban lesznek összegyűjtve az Azure Portalon való megtekintéshez.

Útválasztás: Tevékenységnapló-adatokat küldhet az Azure Monitor-naplókba, hogy más naplóadatokkal együtt elemezhesse azokat. Más helyek is elérhetők, például az Azure Storage, az Azure Event Hubs és bizonyos Microsoft monitorozási partnerek. A tevékenységnapló irányításával kapcsolatos további információkért tekintse meg az Azure-tevékenységnapló áttekintését.

A Batch-fiókok esetében a tevékenységnapló összegyűjti a fióklétrehozáshoz, a törléshez és a kulcskezeléshez kapcsolódó eseményeket.

Monitorozási adatok elemzése

A monitorozási adatok elemzésére számos eszköz áll rendelkezésre.

Azure Monitor-eszközök

Az Azure Monitor a következő alapvető eszközöket támogatja:

Az összetettebb vizualizációt lehetővé tevő eszközök a következők:

  • Irányítópultok , amelyek lehetővé teszik, hogy különböző típusú adatokat egyesítsen egyetlen panelen az Azure Portalon.
  • Az Azure Portalon létrehozható munkafüzetek, testreszabható jelentések. A munkafüzetek tartalmazhatnak szöveget, metrikákat és napló lekérdezéseket.
  • Grafana, egy nyíltplatformos eszköz, amely kiválóan működik az irányítópultokon. A Grafana használatával olyan irányítópultokat hozhat létre, amelyek az Azure Monitoron kívül több forrásból származó adatokat is tartalmaznak.
  • A Power BI egy üzleti elemzési szolgáltatás, amely interaktív vizualizációkat biztosít különböző adatforrásokban. A Power BI-t úgy konfigurálhatja, hogy automatikusan importálja a naplóadatokat az Azure Monitorból a vizualizációk előnyeinek kihasználásához.

A darabszámalapú Batch-metrikák, például a dedikált magok száma vagy az alacsony prioritású csomópontok száma elemzéséhez használja az Avg aggregációt. Az olyan eseményalapú metrikák esetében, mint a Készlet átméretezése befejezett események, használja a Darabszám aggregációt. Kerülje a Sum aggregáció használatát, amely összeadja a diagram időszaka során kapott összes adatpont értékét.

Az Azure Monitor exportálási eszközei

Az Azure Monitorból más eszközökre is lekérheti az adatokat az alábbi módszerekkel:

Az Azure MonitorHOZ készült REST API használatának megkezdéséhez tekintse meg az Azure monitoring REST API-útmutatót.

Kusto-lekérdezések

A monitorozási adatokat az Azure Monitor Naplók/ Log Analytics-tárolóban a Kusto lekérdezési nyelv (KQL) használatával elemezheti.

Fontos

Amikor a portálon a szolgáltatás menüjében a Naplók lehetőséget választja, megnyílik a Log Analytics, és a lekérdezés hatóköre az aktuális szolgáltatásra van állítva. Ez a hatókör azt jelenti, hogy a napló lekérdezései csak az adott típusú erőforrásból származó adatokat tartalmazzák. Ha más Azure-szolgáltatásokból származó adatokat tartalmazó lekérdezést szeretne futtatni, válassza a Naplók lehetőséget az Azure Monitor menüjében. A részletekért tekintse meg az Azure Monitor Log Analytics napló lekérdezési hatókörét és időtartományát.

A szolgáltatások gyakori lekérdezéseinek listáját a Log Analytics lekérdezési felületén találja.

Minta lekérdezések

Íme néhány mintanapló-lekérdezés a Batchhez:

Készlet átméretezése: Készlet és eredménykód (sikeres vagy sikertelen) szerint sorolja fel az átméretezés idejét:

AzureDiagnostics
| where OperationName=="PoolResizeCompleteEvent"
| summarize operationTimes=make_list(startTime_s) by poolName=id_s, resultCode=resultCode_s

Tevékenység időtartama: Másodpercek alatt adja meg a tevékenységek eltelt idejét a tevékenység kezdetétől a tevékenység befejezéséig.

AzureDiagnostics
| where OperationName=="TaskCompleteEvent"
| extend taskId=id_s, ElapsedTime=datetime_diff('second', executionInfo_endTime_t, executionInfo_startTime_t) // For longer running tasks, consider changing 'second' to 'minute' or 'hour'
| summarize taskList=make_list(taskId) by ElapsedTime

Feladatonként meghiúsult tevékenységek: A sikertelen feladatokat szülőfeladat szerint listázza.

AzureDiagnostics
| where OperationName=="TaskFailEvent"
| summarize failedTaskList=make_list(id_s) by jobId=jobId_s, ResourceId

Riasztások

Az Azure Monitor-riasztások proaktív módon értesítik, ha adott feltételek találhatók a monitorozási adatokban. A riasztások lehetővé teszik a rendszer problémáinak azonosítását és kezelését, mielőtt az ügyfelek észrevennénk őket. További információ: Azure Monitor-riasztások.

Az Azure-erőforrásokra vonatkozó gyakori riasztások számos forrásból állnak. Az Azure-erőforrásokra vonatkozó gyakori riasztások példáiért lásd a naplóriasztási lekérdezéseket. Az Azure Monitor Alapszintű riasztások (AMBA) webhelye félautomata módszert biztosít a fontos platformmetrika-riasztások, irányítópultok és irányelvek implementálására. A webhely az Azure-szolgáltatások folyamatosan bővülő részhalmazára vonatkozik, beleértve az Azure Landing Zone (ALZ) részét képező összes szolgáltatást is.

A gyakori riasztási séma szabványosítja az Azure Monitor riasztási értesítéseinek használatát. További információ: Gyakori riasztási séma.

Riasztások típusai

Az Azure Monitor adatplatformon bármilyen metrika- vagy naplóadatforrásról riasztást készíthet. A figyelt szolgáltatásoktól és a gyűjtött monitorozási adatoktól függően számos különböző típusú riasztás létezik. A különböző típusú riasztások különböző előnyökkel és hátrányokkal rendelkeznek. További információ: A megfelelő figyelési riasztástípus kiválasztása.

Az alábbi lista a létrehozható Azure Monitor-riasztások típusait ismerteti:

  • A metrikariasztások rendszeres időközönként értékelik ki az erőforrásmetrikákat. A metrikák lehetnek platformmetrikák, egyéni metrikák, az Azure Monitorból metrikákká konvertált naplók vagy Application Insights-metrikák. A metrikariasztások több feltételt és dinamikus küszöbértéket is alkalmazhatnak.
  • A naplóriasztások lehetővé teszik, hogy a felhasználók Log Analytics-lekérdezéssel kiértékeljék az erőforrásnaplókat egy előre meghatározott gyakorisággal.
  • A tevékenységnapló-riasztások akkor aktiválnak, ha egy új tevékenységnapló-esemény következik be, amely megfelel a megadott feltételeknek. A Resource Health-riasztások és a Service Health-riasztások olyan tevékenységnapló-riasztások, amelyek jelentést jelentenek a szolgáltatásról és az erőforrás állapotáról.

Egyes Azure-szolgáltatások intelligens észlelési riasztásokat, Prometheus-riasztásokat vagy ajánlott riasztási szabályokat is támogatnak.

Egyes szolgáltatások esetében nagy léptékben monitorozhat, ha ugyanazt a metrikariasztási szabályt több, azonos típusú erőforrásra alkalmazza, amelyek ugyanabban az Azure-régióban léteznek. Minden figyelt erőforráshoz külön értesítéseket küld a rendszer. A támogatott Azure-szolgáltatásokról és felhőkről lásd : Több erőforrás monitorozása egyetlen riasztási szabmánnyal.

Feljegyzés

Ha olyan alkalmazást hoz létre vagy futtat, amely a szolgáltatáson fut, az Azure Monitor alkalmazáselemzései több típusú riasztást is kínálhatnak.

Batch-riasztási szabályok

Mivel a metrika kézbesítése olyan inkonzisztenciáktól függhet, mint például a rendelésen kívüli kézbesítés, az adatvesztés vagy a duplikáció, kerülnie kell az egyetlen adatponton aktiváló riasztásokat. Ehelyett használjon küszöbértékeket ezeknek az inkonzisztenciáknak a figyelembe vételéhez egy adott időszakban.

Előfordulhat például, hogy metrikariasztást szeretne konfigurálni, ha az alacsony prioritású magok száma egy bizonyos szintre esik. Ezt a riasztást a készletek összetételének módosításához használhatja. A legjobb eredmény érdekében állítson be egy 10 vagy több perces időszakot, ahol a riasztás akkor aktiválódik, ha az alacsony prioritású magok átlagos száma alacsonyabb, mint a teljes időszak küszöbértéke. Ez az időszak lehetővé teszi a metrikák összesítését, hogy pontosabb eredményeket kapjon.

Az alábbi táblázat felsorol néhány riasztási szabály eseményindítót a Batchhez. Ezek a riasztási szabályok csak példák. Riasztásokat állíthat be a Batch monitorozási adatreferenciájában felsorolt metrikákhoz, naplóbejegyzésekhez vagy tevékenységnapló-bejegyzésekhez.

Riasztástípus Feltétel Leírás
Metrika Használhatatlan csomópontok száma Ha a használhatatlan csomópontok száma 0-nál nagyobb
Metrika Feladatütemezési események Ha a teljes feladathibás esemény nagyobb, mint a dinamikus küszöbérték

Az Advisor javaslatai

Egyes szolgáltatások esetében, ha az erőforrás-műveletek során kritikus feltételek vagy közelgő változások lépnek fel, riasztás jelenik meg a portál szolgáltatásáttekintő lapján. A riasztással kapcsolatos további információkat és javasolt javításokat a bal oldali menü Figyelés területén található Advisor-javaslatok között találja. Normál műveletek során nem jelennek meg tanácsadói javaslatok.

Az Azure Advisorról további információt az Azure Advisor áttekintésében talál.

Egyéb Batch-figyelési lehetőségek

A Batch Explorer egy ingyenes, gazdag funkcionalitású, önálló ügyféleszköz az Azure Batch-alkalmazások létrehozásához, hibakereséséhez és monitorozásához. Az Azure Batch Insights és a Batch Explorer használatával rendszerstatisztikákat kérhet le a Batch-csomópontokhoz, például virtuális gépek teljesítményszámlálóit.

A Batch-alkalmazásokban a Batch .NET-kódtár használatával figyelheti vagy lekérdezheti az erőforrások állapotát, beleértve a feladatokat, feladatokat, csomópontokat és készleteket. Példa:

  • A tevékenység állapotának figyelése.
  • A csomópont állapotának figyelése.
  • A készlet állapotának figyelése.
  • A fiók készlethasználatának figyelése.
  • Készletcsomópontok megszámlálása állapot szerint.

A Batch API-k használatával lista lekérdezéseket hozhat létre a Batch-feladatokhoz, feladatokhoz, számítási csomópontokhoz és egyéb erőforrásokhoz. A lista típusú lekérdezések szűréséről további információt a Batch-erőforrások hatékony listázására szolgáló lekérdezések létrehozása című témakörben talál.

Vagy a nagy mennyiségű tevékenységről vagy csomópontról részletes információkat visszagyűjtő, időigényes lista lekérdezések helyett a Tevékenységszám és a Listakészlet csomópontszámának lekérése művelettel lekérheti a Batch-tevékenységek és számítási csomópontok számát. További információ: Batch-megoldások monitorozása feladatok és csomópontok állapot szerinti számlálásával.

Elemzések

Az Azure egyes szolgáltatásai beépített monitorozási irányítópulttal rendelkeznek az Azure Portalon, amely kiindulópontot biztosít a szolgáltatás monitorozásához. Ezeket az irányítópultokat elemzéseknek nevezzük, és az Azure Monitor Insights Hubjában, az Azure Portalon találhatja meg őket.

Application Insights

Az Application Insightst az Azure Batch-alkalmazásokkal integrálhatja a kód egyéni metrikákkal és nyomkövetéssel való kialakításához. Részletes útmutató az Application Insights Batch .NET-megoldáshoz való hozzáadásáról, az eszközalkalmazás kódjáról, az alkalmazás Azure Portalon való figyeléséről és egyéni irányítópultok készítéséről: Azure Batch .NET-alkalmazások monitorozása és hibakeresése az Application Insights és a hozzá tartozó kódminta használatával.