Monitorování stavu záloh pomocí metrik služby Azure Backup (Preview)

Služba Azure Backup prostřednictvím služby Azure Monitor nabízí sadu předdefinovaných metrik, které umožňují monitorovat stav zálohování. Umožňuje také nakonfigurovat pravidla upozornění, která se aktivují, když metriky překročí definované prahové hodnoty.

Azure Backup nabízí následující klíčové funkce:

  • Možnost zobrazit předefinované metriky související se zálohováním a obnovením stavu zálohovaných položek spolu s přidruženými trendy
  • Schopnost psát vlastní pravidla upozornění na tyto metriky za účelem efektivního monitorování stavu zálohovaných položek
  • Možnost směrovat aktivovaná upozornění na metriky do různých kanálů oznámení podporovaných službou Azure Monitor, jako jsou e-mail, ITSM, webhook, aplikace logiky a další.

Přečtěte si další informace o metrikách služby Azure Monitor.

Podporované scénáře

  • Podporuje integrované metriky pro následující typy úloh:

    • Virtuální počítač Azure, databáze SQL na virtuálním počítači Azure
    • Databáze SAP HANA na virtuálním počítači Azure
    • Soubory Azure
    • Azure Blobs:

    Metriky pro typ úlohy instance HANA se v současné době nepodporují.

  • Metriky je možné zobrazit pro všechny trezory služby Recovery Services v každé oblasti a předplatném najednou. Zobrazení metrik pro větší rozsah na webu Azure Portal se v současné době nepodporuje. Stejná omezení platí i pro konfiguraci pravidel upozornění na metriky.

Podporované předdefinované metriky

Služba Azure Backup v současné době podporuje následující metriky:

  • Události stavu zálohování: Hodnota této metriky představuje počet událostí stavu týkajících se stavu úloh zálohování, které se pro trezor aktivovaly v určitém časovém období. Po dokončení úlohy zálohování služba Azure Backup vytvoří událost stavu zálohování. V závislosti na stavu úlohy (např. Úspěch nebo Selhání) se liší dimenze přidružené k události.

  • Události stavu obnovení: Hodnota této metriky představuje počet událostí stavu týkajících se stavu úloh obnovení, které se pro trezor aktivovaly v určitém časovém období. Po dokončení úlohy obnovení služba Azure Backup vytvoří událost stavu obnovení. V závislosti na stavu úlohy (např. Úspěch nebo Selhání) se liší dimenze přidružené k události.

Poznámka:

Události obnovení stavu podporujeme jenom pro úlohy Azure Blobs, protože zálohy jsou průběžné a tady neexistuje žádný pojem o úlohách zálohování.

Ve výchozím nastavení se počty zobrazují na úrovni trezoru. Pokud chcete zobrazit počty konkrétní zálohované položky a stavu úlohy, můžete metriky filtrovat podle některé z podporovaných dimenzí.

Následující tabulka uvádí dimenze, které podporují události stavu zálohování a metriky obnovení událostí stavu:

Název dimenze Popis
ID zdroje dat Jedinečné ID zdroje dat přidruženého k úloze.

  • Pro prostředky Azure, jako jsou virtuální počítače a soubory, obsahuje ID Azure Resource Manageru (ID ARM) prostředku.
    Například /subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/testRG/providers/Microsoft.Compute/virtualMachines/testVM


  • U databází SQL/HANA uvnitř virtuálních počítačů obsahuje ID ARM virtuálního počítače následované podrobnostmi o databázi.
    Například /subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/testRG/providers/Microsoft.Compute/virtualMachines/testVM/providers/Microsoft.RecoveryServices/backupProtectedItem/SQLDataBase;mssqlserver;msdb


V případě zálohování databáze skupiny dostupnosti SQL je pole ID zdroje dat prázdné, protože v takových scénářích neexistuje žádný zdroj dat. Pokud chcete zobrazit metriky pro konkrétní databázi v rámci skupiny dostupnosti, použijte pole ID instance zálohování.
Typ zdroje dat Typ zdroje dat přidruženého k úloze. Následují podporované typy zdrojů dat:

  • Microsoft.Compute/virtualMachines (Azure Virtual Machines)


  • Microsoft.Storage/storageAccounts/fileServices/shares (Soubory Azure)


  • SQLDatabase (SQL na virtuálním počítači Azure)


  • SAPHANADataBase (SAP HANA na virtuálním počítači Azure)
ID instance zálohování ID ARM instance zálohování přidružené k úloze.

Například /subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/testRG/providers/Microsoft.RecoveryServices/vaults/testVault/backupFabrics/Azure/protectionContainers/IaasVMContainer;iaasvmcontainerv2;testRG;testVM/protectedItems/VM;iaasvmcontainerv2;testRG;testVM
Název instance zálohování Popisný název instance zálohování pro snadnou čitelnost. Je to formát {protectedContainerName};{backupItemFriendlyName}.

Například testStorageAccount;testFileShare
Stav Představuje stav zálohované položky po dokončení úlohy. Může to trvat jednu z následujících hodnot: V pořádku, Přechodné špatné, Trvalé špatné, Přechodné degradované, Trvalé snížení výkonu.

  • Pokud je úloha zálohování nebo obnovení úspěšná, zobrazí se událost stavu se stavem V pořádku .


  • Zdá se, že selhání úloh není v pořádku kvůli chybám služby a kvůli chybám uživatelů se zdá, že došlo k selháním degradovaného stavu.


  • Pokud u stejné zálohované položky dojde opakovaně ke stejné chybě, změní se stav z přechodného stavu, který není v pořádku nebo degradovaný na trvalý stav není v pořádku nebo degradován.

Scénáře monitorování

Zobrazení metrik na webu Azure Portal

Pokud chcete zobrazit metriky na webu Azure Portal, postupujte následovně:

  1. Přejděte do Centra zálohování na webu Azure Portal a v nabídce klikněte na Metriky .

    Screenshot showing to select Metrics in Backup center.

  2. Vyberte trezor nebo skupinu trezorů, pro které chcete zobrazit metriky.

    V současné době je maximální rozsah, pro který můžete zobrazit metriky: Všechny trezory služby Recovery Services v určitém předplatném a oblasti. Například všechny trezory služby Recovery Services v oblasti USA – východ v podsítě TestSubscription1.

  3. Vyberte metriku pro zobrazení událostí stavu zálohování nebo obnovení událostí stavu.

    Tím se vykreslí graf zobrazící počet událostí stavu pro trezory. Časový rozsah a agregaci můžete upravit pomocí filtrů v horní části obrazovky.

    Screenshot showing the process to select a metric.

  4. Pokud chcete filtrovat metriky podle různých dimenzí, klikněte na tlačítko Přidat filtr a vyberte příslušné hodnoty dimenzí.

    • Pokud například chcete zobrazit počty událostí stavu pouze pro zálohy virtuálních počítačů Azure, přidejte filtr Datasource Type = Microsoft.Compute/virtualMachines.
    • Pokud chcete zobrazit události stavu pro konkrétní zdroj dat nebo záložní instanci v rámci trezoru, použijte filtry ID zdroje dat nebo ID instance zálohování.
    • Pokud chcete zobrazit události stavu pouze pro neúspěšné zálohování, použijte filtr stavu stav tak, že vyberete hodnoty odpovídající stavu, které nejsou v pořádku nebo mají snížený stav.

    Screenshot showing the process to filter metrics by different dimensions.

Konfigurace upozornění a oznámení pro metriky

Pokud chcete nakonfigurovat upozornění a oznámení pro metriky, postupujte takto:

  1. V horní části grafů metrik klikněte na Nové pravidlo upozornění.

  2. Vyberte obor, pro který chcete vytvořit výstrahy.

    Omezení rozsahu jsou stejná jako limity popsané v části Zobrazit metriky .

  3. Vyberte podmínku, na které se má výstraha aktivovat.

    Ve výchozím nastavení jsou některá pole předem vyplněná na základě výběru v grafu metrik. Parametry můžete upravit podle potřeby. Pokud chcete vygenerovat jednotlivá upozornění pro každý zdroj dat v trezoru, použijte výběr dimenzí v pravidle upozornění metrik. Následuje několik scénářů:

    • Aktivace upozornění na neúspěšné úlohy zálohování pro každý zdroj dat:

      Pravidlo upozornění: Aktivuje upozornění, pokud události > stavu zálohování 0 za posledních 24 hodin:

      • Dimenze["HealthStatus"]= "Trvalý stav není v pořádku / Přechodný stav není v pořádku"
      • Dimenze["DatasourceId"]= "Všechny aktuální a budoucí hodnoty"
    • Upozornění se aktivují, pokud byly všechny zálohy v trezoru pro tento den úspěšné:

      Pravidlo upozornění: Aktivuje upozornění, pokud události stavu < zálohování 1 za posledních 24 hodin:

      • Dimenze["HealthStatus"]="Trvalý stav není v pořádku / Přechodný stav není v pořádku / Trvalý snížený výkon / Přechodný snížený výkon"

    Screenshot showing the option to select the condition on which the alert should be fired.

    Poznámka:

    Pokud jako součást podmínky pravidla upozornění vyberete více dimenzí, zvýší se náklady (to je úměrné počtu jedinečných kombinací hodnot dimenzí). Výběr dalších dimenzí umožňuje získat více kontextu aktivovaného upozornění.

  4. Pokud chcete nakonfigurovat oznámení pro tyto výstrahy pomocí skupin akcí, nakonfigurujte skupinu akcí jako součást pravidla upozornění nebo vytvořte samostatné pravidlo akce.

    Podporujeme různé kanály oznámení, jako jsou e-maily, ITSM, webhook, aplikace logiky, SMS. Přečtěte si další informace o skupinách akcí.

    Screenshot showing the process to configure notifications for these alerts using Action Groups.

  5. Konfigurace chování automatického řešení – Upozornění na metriky můžete nakonfigurovat jako bezstavová nebo stavová podle potřeby.

    • Pokud chcete vygenerovat upozornění na každé selhání úlohy bez ohledu na selhání, je příčinou stejné základní příčiny (bezstavové chování), zrušte výběr možnosti Automaticky vyřešit výstrahy v pravidle upozornění.
    • Pokud chcete také nakonfigurovat výstrahy jako stavové, zaškrtněte stejné políčko. Proto když se v oboru aktivuje upozornění na metriku, další selhání nevytvoří nové upozornění na metriku. Výstraha se automaticky vyřeší, pokud se podmínka generování výstrahy vyhodnotí jako nepravda pro tři po sobě jdoucí zkušební cykly. Pokud se podmínka vyhodnotí jako pravdivá, vygenerují se nová upozornění.

Přečtěte si další informace o stavovém a bezstavovém chování upozornění metrik služby Azure Monitor.

Screenshot showing the process to configure auto-resolution behavior.

Správa upozornění

Pokud chcete zobrazit aktivovaná upozornění na metriky, postupujte takto:

  1. Přejděte na Upozornění centra>zálohování.

  2. Filtrování pro metriku typu = signálu a typ = výstrahy je nakonfigurovaný.

  3. Kliknutím na výstrahu zobrazíte další podrobnosti o upozornění a změníte jeho stav.

    Screenshot showing the process to view your fired metric alerts.

Poznámka:

Výstraha má dvě pole – stav monitorování (aktivovaný/vyřešený) a stav výstrahy (Nový/Ack/Uzavřeno).

  • Stav upozornění: Toto pole můžete upravit (jak je znázorněno na následujícím snímku obrazovky).
  • Podmínka monitorování: Toto pole nelze upravit. Toto pole se používá více ve scénářích, kdy samotná služba výstrahu vyřeší. Například chování automatického řešení v upozorněních na metriky používá k vyřešení výstrahy pole Podmínka monitorování.

Výstrahy zdroje dat a globální výstrahy

V závislosti na konfiguraci pravidel upozornění se aktivovaná výstraha zobrazí v části Upozornění zdroje dat nebo v centru zálohování v části Globální výstrahy :

  • Pokud má výstraha přidruženou dimenzi ID zdroje dat, zobrazí se aktivovaná výstraha v části Výstrahy zdroje dat.
  • Pokud výstraha nemá přidruženou dimenzi ID zdroje dat, zobrazí se aktivovaná výstraha v části Globální výstrahy , protože nejsou k dispozici žádné informace, které propojí výstrahu s konkrétním zdroji dat.

Další informace o zdroji dat a globálních upozorněních najdete tady.

Poznámka:

V současné době se v případě výstrah obnovení objektů blob zobrazí výstrahy v upozorněních zdroje dat pouze v případě, že při vytváření pravidla upozornění vyberete obě dimenze – datasourceId a datasourceType . Pokud nejsou vybrané nějaké dimenze, zobrazí se výstrahy v rámci globálních upozornění.

Přístup k metrikám prostřednictvím kódu programu

Pro přístup k funkcím metrik můžete použít různé programové klienty, jako je PowerShell, rozhraní příkazového řádku nebo rozhraní REST API. Další podrobnosti najdete v dokumentaci k rozhraní REST API služby Azure Monitor.

Ukázkové scénáře upozornění

Aktivujte jedno upozornění, pokud se všechny aktivované zálohy trezoru za posledních 24 hodin úspěšně aktivovaly.

Pravidlo upozornění: Aktivuje upozornění, pokud události < stavu zálohování 1 za posledních 24 hodin:

Dimenze["HealthStatus"] != "V pořádku"

Aktivace upozornění po každé neúspěšné úloze zálohování

Pravidlo upozornění: Aktivuje upozornění, pokud události stavu > zálohování 0 za posledních 5 minut po dobu:

  • Dimenze["HealthStatus"]!= "V pořádku"
  • Dimenze["DatasourceId"]= "Všechny aktuální a budoucí hodnoty"

Aktivace výstrahy, pokud za posledních 24 hodin došlo k selháním po sobě jdoucího zálohování pro stejnou položku

Pravidlo upozornění: Aktivuje upozornění, pokud události > stavu zálohování 1 za posledních 24 hodin:

  • Dimenze["HealthStatus"]!= "V pořádku"
  • Dimenze["DatasourceId"]= "Všechny aktuální a budoucí hodnoty"

Aktivace upozornění, pokud se za posledních 24 hodin nespustí žádná úloha zálohování pro položku

Pravidlo upozornění: Aktivuje upozornění, pokud události stavu < zálohování 1 za posledních 24 hodin:

Dimenze["DatasourceId"]= "Všechny aktuální a budoucí hodnoty"

Další kroky