Sdílet prostřednictvím


Monitorování clusterů HDInsight s využitím dotazování protokolů služby Azure Monitor

Seznamte se s některými základními scénáři použití protokolů služby Azure Monitor k monitorování clusterů Azure HDInsight:

Poznámka:

Tento článek byl nedávno aktualizován tak, aby místo Log Analytics používal termín protokoly služby Azure Monitor. Data protokolů jsou stále uložená v pracovním prostoru služby Log Analytics a stále se shromažďují a analyzují stejnou službou Log Analytics. Aktualizujeme terminologii tak, aby lépe odrážela roli protokolů ve službě Azure Monitor. Podrobnosti najdete v tématu Změny terminologie služby Azure Monitor.

Požadavky

Musíte mít nakonfigurovaný cluster HDInsight tak, aby používal protokoly služby Azure Monitor, a přidali do pracovního prostoru řešení monitorování protokolů specifické pro cluster HDInsight. Pokyny najdete v tématu Použití protokolů služby Azure Monitor s clustery HDInsight.

Analýza metrik clusteru HDInsight

Zjistěte, jak hledat konkrétní metriky pro cluster HDInsight.

  1. Na webu Azure Portal otevřete pracovní prostor služby Log Analytics přidružený ke clusteru HDInsight.

  2. V části Obecné vyberte Protokoly.

  3. Zadáním následujícího dotazu do vyhledávacího pole vyhledejte všechny metriky pro všechny dostupné metriky pro všechny clustery HDInsight nakonfigurované tak, aby používaly protokoly služby Azure Monitor, a pak vyberte Spustit. Zkontrolujte výsledky.

    search *
    

    Analýzy Apache Ambari prohledávají všechny metriky.

  4. V nabídce vlevo vyberte kartu Filtr .

  5. V části Typ vyberte Prezenčních signálů. Pak vyberte Použít a spustit.

    Metriky specifické pro prohledávání log Analytics

  6. Všimněte si, že se dotaz v textovém poli změní na:

    search *
    | where Type == "Heartbeat"
    
  7. Podrobnější možnosti můžete prozkoumat pomocí možností dostupných v nabídce vlevo. Příklad:

    • Zobrazení protokolů z určitého uzlu:

      Vyhledejte konkrétní chyby ve výstupu 1.

    • Zobrazení protokolů v určitých časech:

      Vyhledejte konkrétní chyby ve výstupu2.

  8. Vyberte Použít a spustit a zkontrolujte výsledky. Všimněte si také, že dotaz byl aktualizován na:

    search *
    | where Type == "Heartbeat"
    | where (Computer == "zk2-myhado") and (TimeGenerated == "2019-12-02T23:15:02.69Z" or TimeGenerated == "2019-12-02T23:15:08.07Z" or TimeGenerated == "2019-12-02T21:09:34.787Z")
    

Další ukázkové dotazy

Ukázkový dotaz založený na průměru prostředků použitých v 10minutovém intervalu rozdělený do kategorií podle názvu clusteru:

search in (metrics_resourcemanager_queue_root_default_CL) * 
| summarize AggregatedValue = avg(UsedAMResourceMB_d) by ClusterName_s, bin(TimeGenerated, 10m)

Místo upřesnění na základě průměru použitých prostředků můžete pomocí následujícího dotazu upřesnit výsledky na základě toho, kdy se v 10minutovém intervalu použily maximální prostředky (a také 90. a 95. percentil):

search in (metrics_resourcemanager_queue_root_default_CL) * 
| summarize ["max(UsedAMResourceMB_d)"] = max(UsedAMResourceMB_d), ["pct95(UsedAMResourceMB_d)"] = percentile(UsedAMResourceMB_d, 95), ["pct90(UsedAMResourceMB_d)"] = percentile(UsedAMResourceMB_d, 90) by ClusterName_s, bin(TimeGenerated, 10m)

Vytváření upozornění pro sledování událostí

Prvním krokem k vytvoření výstrahy je přijetí dotazu na základě toho, na kterém se výstraha aktivuje. Můžete použít libovolný dotaz, který chcete vytvořit výstrahu.

  1. Na webu Azure Portal otevřete pracovní prostor služby Log Analytics přidružený ke clusteru HDInsight.

  2. V části Obecné vyberte Protokoly.

  3. Spusťte následující dotaz, na kterém chcete vytvořit výstrahu, a pak vyberte Spustit.

    metrics_resourcemanager_queue_root_default_CL | where AppsFailed_d > 0
    

    Dotaz poskytuje seznam neúspěšných aplikací spuštěných v clusterech HDInsight.

  4. V horní části stránky vyberte Nové pravidlo upozornění.

    Nové pravidlo upozornění

  5. V okně Vytvořit pravidlo zadejte dotaz a další podrobnosti a vytvořte výstrahu a pak vyberte Vytvořit pravidlo upozornění.

    Definujte podmínku upozornění.

Úprava nebo odstranění existující výstrahy

  1. Otevřete pracovní prostor Služby Log Analytics na webu Azure Portal.

  2. V nabídce vlevo v části Monitorování vyberte Výstrahy.

  3. Nahoře vyberte Spravovat pravidla upozornění.

  4. Vyberte upozornění, které chcete upravit nebo odstranit.

  5. Máte následující možnosti: Uložit, Zahodit, Zakázat a Odstranit.

    Úprava odstranění upozornění na protokoly služby HDInsight Ve službě Azure Monitor

Další informace najdete v tématu Vytváření, zobrazování a správa upozornění metrik pomocí služby Azure Monitor.

Viz také