Monitorování výkonu, stavu a využití Azure Data Explorer pomocí metrik
Metriky Azure Data Explorer poskytují klíčové ukazatele stavu a výkonu prostředků clusteru Azure Data Explorer. Metriky popsané v tomto článku použijte k monitorování využití, stavu a výkonu clusteru Azure Data Explorer ve vašem konkrétním scénáři jako samostatné metriky. Metriky můžete použít také jako základ pro provozní řídicí panely Azure a upozornění Azure.
Další informace o Průzkumníku metrik Azure najdete v tématu Průzkumník metrik.
Požadavky
- Předplatné Azure. Vytvořte si bezplatný účet Azure.
- Cluster a databáze Azure Data Explorer. Vytvořte cluster a databázi.
Monitorování prostředků Azure Data Explorer pomocí metrik
- Přihlaste se k webu Azure Portal.
- V levém podokně clusteru Azure Data Explorer vyhledejte metriky.
- Výběrem možnosti Metriky otevřete podokno metrik a zahájíte analýzu clusteru.
Práce v podokně metrik
V podokně metrik vyberte konkrétní metriky, které chcete sledovat, zvolte způsob agregace dat a vytvořte grafy metrik pro zobrazení na řídicím panelu.
Pro cluster Azure Data Explorer jsou předem vybrané nástroje pro výběr oboru názvůprostředků a metrik. Čísla na následujícím obrázku odpovídají číslovanýmu seznamu níže. Provedou vás různými možnostmi nastavení a zobrazení metrik.
- Pokud chcete vytvořit graf metriky, vyberte Název metriky a odpovídající Agregace na metriku. Další informace o různých metrikách najdete v tématu Podporované metriky Azure Data Explorer.
- Vyberte Přidat metriku , pokud chcete zobrazit více metrik vykreslených ve stejném grafu.
- Pokud chcete zobrazit více grafů v jednom zobrazení, vyberte + Nový graf .
- Pomocí nástroje pro výběr času změňte časový rozsah (výchozí hodnota: posledních 24 hodin).
- Pro metriky, které mají dimenze, použijte Přidat filtr a Použít rozdělení .
- Vyberte Připnout na řídicí panel a přidejte konfiguraci grafu na řídicí panely, abyste si ho mohli znovu zobrazit.
- Nastavením nového pravidla upozornění můžete metriky vizualizovat pomocí nastavených kritérií. Nové pravidlo upozornění bude zahrnovat váš cílový prostředek, metriku, rozdělení a filtrovací dimenze z vašeho grafu. Upravte tato nastavení v podokně vytváření pravidla upozornění.
Podporované metriky Azure Data Explorer
Metriky Azure Data Explorer poskytují přehled o celkovém výkonu a využití prostředků a také informace o konkrétních akcích, jako je příjem dat nebo dotazování. Metriky v tomto článku jsou seskupené podle typu využití.
Typy metrik jsou:
- Metriky clusteru
- Export metrik
- Metriky příjmu dat
- Metriky ingestování streamování
- Metriky dotazů
- Metriky materializovaného zobrazení
Abecední seznam metrik služby Azure Monitor pro Průzkumníky dat Azure najdete v tématu Podporované metriky clusteru Azure Data Explorer.
Metriky clusteru
Metriky clusteru sledují obecný stav clusteru. Například využití prostředků a příjmu dat a rychlost odezvy.
Metrika | Jednotka | Agregace | Popis metriky | Dimenze |
---|---|---|---|---|
Využití mezipaměti (zastaralé) | Procento | Avg, Max, Min | Procento přidělených prostředků mezipaměti, které v clusteru jsou aktuálně používány. Mezipaměť je velikost jednotky SSD přidělená pro aktivity uživatelů podle definovaných zásad mezipaměti. Průměrné využití mezipaměti na úrovni 80 % nebo méně znamená pro cluster udržitelný stav. Pokud je průměrné využití mezipaměti vyšší než 80 %, měl by být cluster vertikálně navýšit kapacitu na cenovou úroveň optimalizovanou pro úložiště nebo horizontální navýšení kapacity na více instancí. Případně můžete upravit zásady mezipaměti na méně dní v mezipaměti. Pokud je využití mezipaměti vyšší než 100 %, velikost dat, která se mají ukládat do mezipaměti, je větší než celková velikost mezipaměti v clusteru. Tato metrika je zastaralá a prezentuje se pouze pro zpětnou kompatibilitu. Místo toho použijte metriku Faktor využití mezipaměti. |
Žádné |
Faktor využití mezipaměti | Procento | Avg, Max, Min | Procento využitého místa na disku vyhrazeného pro horkou mezipaměť v clusteru 100 % znamená optimální využití místa na disku přiřazeného horkým datům. Není potřeba žádná akce a cluster je zcela v pořádku. Méně než 100 % znamená, že místo na disku přiřazené pro horká data není plně využito. Více než 100 % znamená, že místo na disku clusteru není dostatečně velké, aby bylo možné pojmout horká data, jak jsou definovány zásadami ukládání do mezipaměti. Aby bylo zajištěno, že je pro všechna horká data k dispozici dostatek místa, je potřeba snížit množství horkých dat nebo škálovat cluster. Doporučujeme povolit automatické škálování. | Žádné |
Procesor | Procento | Avg, Max, Min | Procento přidělených výpočetních prostředků, které jsou aktuálně používány počítači v clusteru. Průměrná hodnota CPU na úrovni 80 % nebo méně je pro cluster udržitelná. Maximální hodnota CPU je 100 %. Znamená, že nejsou k dispozici žádné další výpočetní prostředky pro zpracování dat. Pokud cluster nefunguje dobře, zkontrolujte maximální hodnotu procesoru a zjistěte, jestli nejsou blokované konkrétní procesory. |
Žádné |
Využití příjmu dat | Procento | Avg, Max, Min | Procento prostředků využitých k příjmu dat z celkových prostředků pro realizaci příjmu dat přidělených v rámci zásad kapacity. Výchozími zásadami kapacity je maximálně 512 souběžných operací příjmu dat nebo 75 % prostředků clusteru zapojených do příjmu dat. Průměrné využití příjmu dat na úrovni 80 % nebo méně znamená pro cluster udržitelný stav. Maximální hodnota využití příjmu dat je 100 %. Znamená, že se využívá veškerá schopnost clusteru ingestovat data a výsledkem může být fronta pro příjem dat. |
Žádné |
InstanceCount | Počet | Průměr | Celkový počet instancí. | |
Udržovat při životě | Počet | Průměr | Sleduje rychlost odezvy clusteru. Plně responzivní cluster vrátí hodnotu 1 a blokovaný nebo odpojený cluster vrátí hodnotu 0. |
|
Celkový počet omezených příkazů | Počet | Avg, Max, Min, Sum | Počet omezených (odmítnutých) příkazů v clusteru od dosažení maximálního povoleného počtu souběžných (paralelních) příkazů. | Žádné |
Celkový počet rozsahů | Počet | Avg, Max, Min, Sum | Celkový počet rozsahů dat v clusteru Změny v této metrice mohou znamenat rozsáhlé změny struktury dat a vysoké zatížení clusteru, protože slučování rozsahů dat je aktivita náročná na procesor. |
Žádné |
Latence sledování | Milisekund | Avg, Max, Min | Databáze sledujících synchronizují změny v vodicích databázích. Kvůli synchronizaci dochází k prodlevě dat v dostupnosti několika sekund až několika minut. Tato metrika měří délku časové prodlevy. Časová prodleva závisí na několika faktorech, jako jsou: celková velikost a rychlost přijatých dat do vedoucí instance, počet sledovaných databází, míra interních operací prováděných s vedoucí instancí (operace sloučení/opětovného sestavení). Toto je metrika na úrovni clusteru: sledující zachytávají metadata všech databází, které se sledují. Tato metrika představuje latenci procesu. |
Žádné |
Export metrik
Metriky exportu sledují obecný stav a výkon operací exportu, jako jsou zpoždění, výsledky, počet záznamů a využití.
Metrika | Jednotka | Agregace | Popis metriky | Dimenze |
---|---|---|---|---|
Počet exportovaných záznamů pro průběžný export | Počet | Sum | Počet exportovaných záznamů ve všech úlohách průběžného exportu. | ContinuousExportName |
Maximální zpoždění průběžného exportu | Počet | Maximum | Zpoždění (v minutách) hlášené úlohami průběžného exportu v clusteru | Žádné |
Počet čekajících na průběžný export | Počet | Maximum | Počet čekajících úloh průběžného exportu Tyto úlohy jsou připravené ke spuštění, ale čekají ve frontě, pravděpodobně kvůli nedostatečné kapacitě). | |
Výsledek průběžného exportu | Počet | Počet | Výsledek selhání nebo úspěchu každého spuštění průběžného exportu | ContinuousExportName |
Využití exportu | Procento | Maximum | Využitá kapacita exportu z celkové kapacity pro export v clusteru (od 0 do 100) | Žádné |
Metriky příjmu dat
Metriky příjmu dat sledují obecný stav a výkon operací příjmu dat, jako je latence, výsledky a objem. Upřesnění analýzy:
- Použijte filtry na grafy k vykreslení částečných dat podle dimenzí. Můžete například prozkoumat příjem dat do konkrétního
Database
. - Použití rozdělení na graf k vizualizaci dat podle různých součástí Tento proces je užitečný pro analýzu metrik, které jsou hlášeny jednotlivými kroky kanálu příjmu dat, například
Blobs received
.
Metrika | Jednotka | Agregace | Popis metriky | Dimenze |
---|---|---|---|---|
Počet objektů blob služby Batch | Počet | Avg, Max, Min | Počet zdrojů dat v dokončené dávce pro příjem dat | Databáze |
Doba trvání dávky | Sekundy | Avg, Max, Min | Doba trvání fáze dávkování v toku příjmu dat. | Databáze |
Velikost dávky | Bajty | Avg, Max, Min | Nekomprimovaná očekávaná velikost dat v agregované dávce pro příjem dat | Databáze |
Zpracované dávky | Počet | Součet, maximum, minimum | Počet dokončených dávek pro příjem dat Batching Type : Aktivační událost pro zapečetění dávky. Úplný seznam typů dávkování najdete v tématu Typy dávkování. |
Databáze, typ dávkování |
Přijaté objekty blob | Počet | Součet, maximum, minimum | Počet objektů blob přijatých ze vstupního streamu komponentou K analýze jednotlivých komponent použijte rozdělení . |
Databáze, typ komponenty, název komponenty |
Zpracované objekty blob | Počet | Součet, maximum, minimum | Počet objektů blob zpracovaných komponentou K analýze jednotlivých komponent použijte rozdělení . |
Databáze, typ komponenty, název komponenty |
Zahozené objekty blob | Počet | Součet, Maximum, Min | Počet objektů blob trvale vynechaných komponentou Pro každý takový objekt blob se Ingestion result odešle metrika s důvodem selhání. K analýze jednotlivých komponent použijte funkci použít rozdělení . |
Databáze, typ komponenty, název komponenty |
Latence zjišťování | Sekundy | Průměr | Doba od zařazení do fronty dat až do zjišťování dat datovými připojeními. Tato doba není zahrnutá v latenci fáze ani v metrikách latence příjmu dat . Latence zjišťování se může zvýšit v následujících situacích:
|
Typ komponenty, název komponenty |
Přijaté události | Počet | Součet, Maximum, Min | Počet událostí přijatých datovými připojeními ze vstupního datového proudu | Typ komponenty, název komponenty |
Zpracované události | Počet | Součet, Maximum, Min | Počet událostí zpracovaných datovými připojeními | Typ komponenty, název komponenty |
Vynechané události | Počet | Součet, Maximum, Min | Počet událostí trvale ukončených datovými připojeními Pro každou takovou událost se Ingestion result odešle metrika s důvodem selhání. |
Typ komponenty, název komponenty |
Zpracované události (pro event/IoT Hubs) (zastaralé) | Počet | Max, Min, Součet | Celkový počet událostí přečtených z centra událostí / IoT Hub a zpracovaných clusterem Tyto události je možné rozdělit podle stavu: Přijato, Odmítnuto, Zpracováno. Tato metrika je zastaralá a prezentuje se pouze pro zpětnou kompatibilitu. Místo toho použijte metriky Events received (Přijaté události), Events processed (Zpracované události) a Events dropped (Události vyřazené). | Stav |
Latence příjmu dat | Sekundy | Avg, Max, Min | Latence přijatých dat, od okamžiku, kdy byla data v clusteru přijata, až do doby, kdy jsou připravena pro dotazy. Období latence příjmu dat závisí na scénáři příjmu dat.Ingestion Kind : Příjem dat streamování nebo příjem dat ve frontě |
Druh příjmu dat |
Výsledek příjmu dat | Počet | Sum | Celkový počet zdrojů, které selhaly nebo byly úspěšně přijaty.Status : Úspěch úspěšného příjmu dat nebo kategorie selhání pro selhání. Úplný seznam možných kategorií selhání najdete v tématu Kódy chyb příjmu dat v Azure Data Explorer. Failure Status Type : Určuje, jestli je selhání trvalé nebo přechodné. Pro úspěšné příjem dat je None tato dimenze .Poznámka:
|
Stav, typ stavu selhání |
Objem příjmu dat (v MB) | Počet | Max, Sum | Celková velikost dat přijatých do clusteru (v MB) před kompresí | Databáze |
Délka fronty | Počet | Průměr | Počet čekajících zpráv ve vstupní frontě komponenty Komponenta správce dávek má jednu zprávu pro každý objekt blob. Komponenta správce příjmu dat má jednu zprávu pro každou dávku. Dávka je jeden příkaz ingestování s jedním nebo více objekty blob. | Typ komponenty |
Nejstarší zpráva ve frontě | Sekundy | Průměr | Čas v sekundách od vložení nejstarší zprávy ve vstupní frontě komponenty. | Typ komponenty |
Bajty velikosti přijatých dat | Bajty | Průměr, Součet | Velikost dat přijatých datovými připojeními ze vstupního streamu | Typ komponenty, název komponenty |
Latence fáze | Sekundy | Průměr | Čas od přijetí zprávy službou Azure Data Explorer až do přijetí jejího obsahu komponentou pro příjem dat ke zpracování. Pokud chcete zobrazit celkovou latenci příjmu dat, použijte použít filtry a vyberte Typ > komponenty StorageEngine . |
Databáze, typ komponenty |
Metriky ingestování streamování
Metriky streamování ingestování sledují streamovaná data příjmu dat a četnost požadavků, dobu trvání a výsledky.
Metrika | Jednotka | Agregace | Popis metriky | Dimenze |
---|---|---|---|---|
Datová rychlost příjmu streamování | Počet | RateRequestsPerSecond | Celkový objem dat přijatých do clusteru | Žádné |
Doba trvání příjmu streamování | Milisekund | Avg, Max, Min | Celková doba trvání všech požadavků na příjem dat streamování | Žádné |
Četnost požadavků příjmu streamování | Počet | Count, Avg, Max, Min, Sum | Celkový počet požadavků na příjem dat streamování | Žádné |
Výsledek příjmu streamování | Počet | Průměr | Celkový počet požadavků na příjem streamovaných dat podle typu výsledku | Výsledek |
Metriky dotazů
Metriky výkonu dotazů sledují dobu trvání dotazů a celkový počet souběžných nebo omezených dotazů.
Metrika | Jednotka | Agregace | Popis metriky | Dimenze |
---|---|---|---|---|
Doba trvání dotazu | Milisekund | Avg, Min, Max, Sum | Celková doba do přijetí výsledků dotazu (nezahrnuje latenci sítě) | QueryStatus |
QueryResult | Počet | Počet | Celkový počet dotazů | QueryStatus |
Celkový počet souběžných dotazů | Počet | Avg, Max, Min, Sum | Počet dotazů spuštěných paralelně v clusteru Tato metrika představuje dobrý způsob, jak odhadnout zatížení clusteru. | Žádné |
Celkový počet omezených dotazů | Počet | Avg, Max, Min, Sum | Počet omezených (odmítnutých) dotazů v clusteru Maximální povolený počet souběžných (paralelních) dotazů je definovaný v zásadách omezení četnosti požadavků. | Žádné |
Metriky materializovaného zobrazení
Metrika | Jednotka | Agregace | Popis metriky | Dimenze |
---|---|---|---|---|
MaterializedViewHealth | 1, 0 | Průměr | Hodnota je 1, pokud je zobrazení považováno za dobré, jinak 0. | Database, MaterializedViewName |
MaterializedViewAgeSeconds | Sekundy | Průměr | Zobrazení age je definováno aktuálním časem minus čas posledního příjmu dat zpracovaných zobrazením. Hodnota metriky je čas v sekundách (nižší hodnota je, zobrazení je "zdravější"). |
Database, MaterializedViewName |
MaterializedViewResult | 1 | Průměr | Metrika zahrnuje Result dimenzi označující výsledek posledního cyklu materializace (podrobnosti o možných hodnotách najdete v metrice MaterializedViewResult ). Hodnota metriky se vždy rovná 1. |
Database, MaterializedViewName, Result |
MaterializedViewRecordsInDelta | Počet záznamů | Průměr | Počet záznamů aktuálně v nezpracované části zdrojové tabulky. Další informace najdete v tématu o tom, jak fungují materializovaná zobrazení. | Database, MaterializedViewName |
MaterializedViewExtentsRebuild | Počet rozsahů | Průměr | Počet rozsahů, které vyžadovaly aktualizace v cyklu materializace. | Database, MaterializedViewName |
MaterializedViewDataLoss | 1 | Maximum | Metrika se aktivuje, když se nezpracovaná zdrojová data blíží k uchovávání. Označuje, že materializované zobrazení není v pořádku. | Database, MaterializedViewName, Kind |
Související obsah
Váš názor
https://aka.ms/ContentUserFeedback.
Připravujeme: V průběhu roku 2024 budeme postupně vyřazovat problémy z GitHub coby mechanismus zpětné vazby pro obsah a nahrazovat ho novým systémem zpětné vazby. Další informace naleznete v tématu:Odeslat a zobrazit názory pro