Monitorowanie kondycji kopii zapasowych przy użyciu metryk usługi Azure Backup (wersja zapoznawcza)

Usługa Azure Backup udostępnia zestaw wbudowanych metryk za pośrednictwem usługi Azure Monitor, która umożliwia monitorowanie kondycji kopii zapasowych. Umożliwia to również konfigurowanie reguł alertów wyzwalanych, gdy metryki przekraczają zdefiniowane progi.

Usługa Azure Backup oferuje następujące kluczowe możliwości:

  • Możliwość wyświetlania wbudowanych metryk związanych z tworzeniem kopii zapasowej i przywracaniem kondycji elementów kopii zapasowej wraz ze skojarzonymi trendami
  • Możliwość pisania niestandardowych reguł alertów dotyczących tych metryk w celu wydajnego monitorowania kondycji elementów kopii zapasowej
  • Możliwość kierowania wyzwolonych alertów metryk do różnych kanałów powiadomień obsługiwanych przez usługę Azure Monitor, takich jak poczta e-mail, ITSM, element webhook, aplikacje logiki itd.

Dowiedz się więcej o metrykach usługi Azure Monitor.

Obsługiwane scenariusze

  • Obsługuje wbudowane metryki dla następujących typów obciążeń:

    • Maszyna wirtualna platformy Azure, bazy danych SQL na maszynie wirtualnej platformy Azure
    • Bazy danych SAP HANA na maszynie wirtualnej platformy Azure
    • Azure Files
    • Azure Blobs.

    Metryki dla typu obciążenia wystąpienia platformy HANA nie są obecnie obsługiwane.

  • Metryki można wyświetlać dla wszystkich magazynów usługi Recovery Services w każdym regionie i subskrypcji naraz. Wyświetlanie metryk dla większego zakresu w witrynie Azure Portal nie jest obecnie obsługiwane. Te same limity mają również zastosowanie do konfigurowania reguł alertów dotyczących metryk.

Obsługiwane metryki wbudowane

Obecnie usługa Azure Backup obsługuje następujące metryki:

  • Zdarzenia kondycji kopii zapasowej: wartość tej metryki reprezentuje liczbę zdarzeń kondycji związanych z kondycją zadania tworzenia kopii zapasowej, które zostały wyzwolone dla magazynu w określonym czasie. Po zakończeniu zadania tworzenia kopii zapasowej usługa Azure Backup tworzy zdarzenie kondycji kopii zapasowej. Na podstawie stanu zadania (na przykład powodzenie lub niepowodzenie) wymiary skojarzone ze zdarzeniem różnią się.

  • Zdarzenia kondycji przywracania: wartość tej metryki reprezentuje liczbę zdarzeń kondycji związanych z kondycją zadania przywracania, które zostały wyzwolone dla magazynu w określonym czasie. Po zakończeniu zadania przywracania usługa Azure Backup tworzy zdarzenie kondycji przywracania. Na podstawie stanu zadania (na przykład powodzenie lub niepowodzenie) wymiary skojarzone ze zdarzeniem różnią się.

Uwaga

Obsługujemy zdarzenia przywracania kondycji tylko dla obciążenia obiektów blob platformy Azure, ponieważ kopie zapasowe są ciągłe i nie ma tutaj pojęcia zadań tworzenia kopii zapasowych.

Domyślnie liczby są wyświetlane na poziomie magazynu. Aby wyświetlić liczby dla określonego elementu kopii zapasowej i stanu zadania, można filtrować metryki dla dowolnego z obsługiwanych wymiarów.

W poniższej tabeli wymieniono wymiary obsługiwane przez metryki Zdarzenia kondycji kopii zapasowej i Zdarzenia przywracania kondycji:

Nazwa wymiaru Opis
Identyfikator źródła danych Unikatowy identyfikator źródła danych skojarzony z zadaniem.

  • W przypadku zasobów platformy Azure, takich jak maszyny wirtualne i pliki, zawiera identyfikator usługi Azure Resource Manager (IDENTYFIKATOR ARM) zasobu.
    Na przykład /subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/testRG/providers/Microsoft.Compute/virtualMachines/testVM


  • W przypadku baz danych SQL/HANA na maszynach wirtualnych zawiera on identyfikator usługi ARM maszyny wirtualnej, a następnie szczegóły bazy danych.
    Na przykład /subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/testRG/providers/Microsoft.Compute/virtualMachines/testVM/providers/Microsoft.RecoveryServices/backupProtectedItem/SQLDataBase;mssqlserver;msdb


W przypadku kopii zapasowej bazy danych grupy dostępności SQL pole Identyfikator źródła danych jest puste, ponieważ w takich scenariuszach nie ma źródła danych (VM). Aby wyświetlić metryki dla określonej bazy danych w ramach grupy dostępności, użyj pola Identyfikator wystąpienia kopii zapasowej.
Typ źródła danych Typ źródła danych skojarzonego z zadaniem. Poniżej przedstawiono obsługiwane typy źródeł danych:

  • Microsoft.Compute/virtualMachines (Azure Virtual Machines)


  • Microsoft.Storage/storageAccounts/fileServices/shares (Azure Files)


  • SQLDatabase (SQL na maszynie wirtualnej platformy Azure)


  • SAPHANADataBase (SAP HANA na maszynie wirtualnej platformy Azure)
Identyfikator wystąpienia kopii zapasowej Identyfikator arm wystąpienia kopii zapasowej skojarzonego z zadaniem.

Na przykład /subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/testRG/providers/Microsoft.RecoveryServices/vaults/testVault/backupFabrics/Azure/protectionContainers/IaasVMContainer;iaasvmcontainerv2;testRG;testVM/protectedItems/VM;iaasvmcontainerv2;testRG;testVM
Nazwa wystąpienia kopii zapasowej Przyjazna nazwa wystąpienia kopii zapasowej w celu ułatwienia odczytu. Jest to format {protectedContainerName};{backupItemFriendlyName}.

Na przykład testStorageAccount;testFileShare
Stan kondycji Reprezentuje kondycję elementu kopii zapasowej po zakończeniu zadania. Może przyjmować jedną z następujących wartości: Dobra kondycja, Przejściowy stan złej kondycji, Trwały stan złej kondycji, Przejściowy obniżony poziom obniżonej wydajności, Trwały obniżony poziom wydajności.

  • Gdy zadanie tworzenia/przywracania kopii zapasowej zakończy się pomyślnie, zostanie wyświetlone zdarzenie kondycji ze stanem W dobrej kondycji.


  • W złej kondycji występują błędy zadań spowodowane błędami usługi, a obniżona wydajność wydaje się być błędami spowodowanymi błędami użytkownika.


  • Gdy ten sam błąd występuje w przypadku tego samego elementu kopii zapasowej wielokrotnie, stan zmienia się z Przejściowej złej kondycji/obniżonej wydajności do trwałej złej kondycji/obniżonej wydajności.

Scenariusze monitorowania

Wyświetlanie metryk w witrynie Azure Portal

Aby wyświetlić metryki w witrynie Azure Portal, wykonaj poniższe kroki:

  1. Przejdź do centrum kopii zapasowej w witrynie Azure Portal i kliknij pozycję Metryki z menu.

    Screenshot showing to select Metrics in Backup center.

  2. Wybierz magazyn lub grupę magazynów, dla których chcesz wyświetlić metryki.

    Obecnie maksymalny zakres, dla którego można wyświetlać metryki, to: Wszystkie magazyny usługi Recovery Services w określonej subskrypcji i regionie. Na przykład wszystkie magazyny usługi Recovery Services w regionie Wschodnie stany USA w usłudze TestSubscription1.

  3. Wybierz metrykę , aby wyświetlić zdarzenia kondycji kopii zapasowej lub przywrócić zdarzenia kondycji.

    Spowoduje to renderowanie wykresu przedstawiającego liczbę zdarzeń kondycji dla magazynów. Zakres czasu i stopień szczegółowości agregacji można dostosować przy użyciu filtrów w górnej części ekranu.

    Screenshot showing the process to select a metric.

  4. Aby filtrować metryki według różnych wymiarów, kliknij przycisk Dodaj filtr i wybierz odpowiednie wartości wymiarów.

    • Jeśli na przykład chcesz zobaczyć liczbę zdarzeń kondycji tylko dla kopii zapasowych maszyn wirtualnych platformy Azure, dodaj filtr Datasource Type = Microsoft.Compute/virtualMachines.
    • Aby wyświetlić zdarzenia kondycji dla określonego źródła danych lub wystąpienia kopii zapasowej w magazynie, użyj filtrów identyfikatora źródła danych/identyfikatora wystąpienia kopii zapasowej.
    • Aby wyświetlić zdarzenia kondycji tylko w przypadku nieudanych kopii zapasowych, użyj filtru w obszarze HealthStatus, wybierając wartości odpowiadające kondycji w złej kondycji lub obniżonej kondycji.

    Screenshot showing the process to filter metrics by different dimensions.

Konfigurowanie alertów i powiadomień dotyczących metryk

Aby skonfigurować alerty i powiadomienia dotyczące metryk, wykonaj następujące kroki:

  1. Kliknij pozycję Nowa reguła alertu w górnej części wykresów metryk.

  2. Wybierz zakres, dla którego chcesz utworzyć alerty.

    Limity zakresu są takie same jak limity opisane w sekcji Wyświetlanie metryk .

  3. Wybierz warunek, w którym powinien zostać wyzwolony alert.

    Domyślnie niektóre pola są wstępnie wypełniane na podstawie wyborów na wykresie metryki. Parametry można edytować zgodnie z potrzebami. Aby wygenerować poszczególne alerty dla każdego źródła danych w magazynie, użyj wyboru wymiarów w regule alertów dotyczących metryk. Poniżej przedstawiono kilka scenariuszy:

    • Wyzwalanie alertów dotyczących nieudanych zadań tworzenia kopii zapasowej dla każdego źródła danych:

      Reguła alertu: wyzwol alert, jeśli zdarzenia > kondycji kopii zapasowej 0 w ciągu ostatnich 24 godzin dla:

      • Dimensions["HealthStatus"]= "Trwały w złej kondycji/ przejściowej złej kondycji"
      • Dimensions["DatasourceId"]= "Wszystkie bieżące i przyszłe wartości"
    • Wyzwalanie alertów, jeśli wszystkie kopie zapasowe w magazynie zakończyły się pomyślnie w ciągu dnia:

      Reguła alertu: wyzwol alert, jeśli zdarzenia < kondycji kopii zapasowej 1 w ciągu ostatnich 24 godzin dla:

      • Wymiary["HealthStatus"]="Trwały w złej kondycji/przejściowej złej kondycji/trwałe obniżone/przejściowe obniżone działanie"

    Screenshot showing the option to select the condition on which the alert should be fired.

    Uwaga

    W przypadku wybrania większej liczby wymiarów w ramach warunku reguły alertu koszt zostanie zwiększony (proporcjonalny do liczby unikatowych kombinacji wartości wymiarów). Wybór większej liczby wymiarów pozwala uzyskać więcej kontekstu w wyzwalanym alercie.

  4. Aby skonfigurować powiadomienia dla tych alertów przy użyciu grup akcji, skonfiguruj grupę akcji w ramach reguły alertu lub utwórz oddzielną regułę akcji.

    Obsługujemy różne kanały powiadomień, takie jak poczta e-mail, ITSM, element webhook, aplikacja logiki, sms. Dowiedz się więcej o grupach akcji.

    Screenshot showing the process to configure notifications for these alerts using Action Groups.

  5. Konfigurowanie zachowania automatycznego rozwiązywania problemów — alerty metryk można skonfigurować jako bezstanowe lub stanowe zgodnie z potrzebami .

    • Aby wygenerować alert dotyczący każdego niepowodzenia zadania niezależnie od niepowodzenia, jest spowodowany tą samą przyczyną (zachowanie bezstanowe), usuń zaznaczenie opcji Automatycznie rozwiąż alerty w regule alertu.
    • Alternatywnie, aby skonfigurować alerty jako stanowe, zaznacz to samo pole wyboru. W związku z tym po wyzwoleniu alertu dotyczącego metryk w zakresie inny błąd nie spowoduje utworzenia nowego alertu dotyczącego metryk. Alert zostanie automatycznie rozwiązany, jeśli warunek generowania alertu zwróci wartość false dla trzech kolejnych cykli oceny. Nowe alerty są generowane, jeśli warunek ponownie zwróci wartość true.

Dowiedz się więcej o stanowym i bezstanowym zachowaniu alertów metryk usługi Azure Monitor.

Screenshot showing the process to configure auto-resolution behavior.

Zarządzanie alertami

Aby wyświetlić wyzwolone alerty dotyczące metryk, wykonaj następujące kroki:

  1. Przejdź do obszaru Alerty centrum>kopii zapasowych.

  2. Filtrowanie pod kątem metryki typu = sygnału i skonfigurowanego typu = alertu.

  3. Kliknij alert, aby wyświetlić więcej szczegółów na temat alertu i zmienić jego stan.

    Screenshot showing the process to view your fired metric alerts.

Uwaga

Alert ma dwa pola — Warunek monitorowania (wyzwolony/rozwiązany) i Stan alertu (Nowy/Ack/Zamknięty).

  • Stan alertu: Możesz edytować to pole (jak pokazano na poniższym zrzucie ekranu).
  • Warunek monitorowania: nie można edytować tego pola. To pole jest używane bardziej w scenariuszach, w których sama usługa rozwiązuje alert. Na przykład zachowanie automatycznego rozwiązywania w alertach dotyczących metryk używa pola Warunek monitorowania w celu rozwiązania alertu.

Alerty źródła danych i alerty globalne

Na podstawie konfiguracji reguł alertu wyzwolony alert jest wyświetlany w sekcji Alerty źródła danych lub w sekcji Alerty globalne w centrum kopii zapasowych:

  • Jeśli alert ma skojarzony wymiar identyfikatora źródła danych, wyzwolony alert zostanie wyświetlony w obszarze Alerty źródła danych.
  • Jeśli alert nie ma skojarzonego wymiaru identyfikatora źródła danych, wyzwolony alert pojawi się w obszarze Alerty globalne, ponieważ nie ma żadnych informacji, które łączą alert z określonym źródłem danych.

Dowiedz się więcej o źródle danych i alertach globalnych tutaj

Uwaga

Obecnie w przypadku alertów przywracania obiektów blob alerty są wyświetlane w obszarze alertów źródła danych tylko wtedy, gdy wybierzesz oba wymiary — datasourceId i datasourceType podczas tworzenia reguły alertu. Jeśli nie wybrano żadnych wymiarów, alerty są wyświetlane w obszarze alertów globalnych.

Programowe uzyskiwanie dostępu do metryk

Aby uzyskać dostęp do funkcji metryk, możesz użyć różnych klientów programowych, takich jak program PowerShell, interfejs wiersza polecenia lub interfejs API REST. Aby uzyskać więcej informacji, zobacz dokumentację interfejsu API REST usługi Azure Monitor.

Przykładowe scenariusze alertów

Wyzwalanie pojedynczego alertu, jeśli wszystkie wyzwolone kopie zapasowe magazynu zakończyły się pomyślnie w ciągu ostatnich 24 godzin

Reguła alertu: wyzwol alert, jeśli zdarzenia < kondycji kopii zapasowej 1 w ciągu ostatnich 24 godzin dla:

Wymiary["HealthStatus"] != "W dobrej kondycji"

Wyzwalanie alertu po każdym nieudanym zadaniu tworzenia kopii zapasowej

Reguła alertu: wyzwol alert, jeśli zdarzenia > kondycji kopii zapasowej 0 w ciągu ostatnich 5 minut:

  • Wymiary["HealthStatus"]!= "W dobrej kondycji"
  • Dimensions["DatasourceId"]= "Wszystkie bieżące i przyszłe wartości"

Wyzwol alert, jeśli w ciągu ostatnich 24 godzin wystąpiły kolejne błędy tworzenia kopii zapasowej dla tego samego elementu

Reguła alertu: wyzwol alert, jeśli zdarzenia > kondycji kopii zapasowej 1 w ciągu ostatnich 24 godzin dla:

  • Wymiary["HealthStatus"]!= "W dobrej kondycji"
  • Dimensions["DatasourceId"]= "Wszystkie bieżące i przyszłe wartości"

Wyzwol alert, jeśli nie wykonano zadania tworzenia kopii zapasowej dla elementu w ciągu ostatnich 24 godzin

Reguła alertu: wyzwol alert, jeśli zdarzenia < kondycji kopii zapasowej 1 w ciągu ostatnich 24 godzin dla:

Dimensions["DatasourceId"]= "Wszystkie bieżące i przyszłe wartości"

Następne kroki