Udostępnij za pośrednictwem


Utwórz alert metryczny z dynamicznymi progami

Być może nie masz pewności co do poprawnej liczby, która ma być używana jako progi reguł alertów. Progi dynamiczne stosują zaawansowane uczenie maszynowe i używają zestawu algorytmów i metod do:

  • Poznaj historyczne zachowanie metryk.
  • Analizowanie metryk w czasie i identyfikowanie wzorców, takich jak wzorce godzinowe, dzienne lub tygodniowe.
  • Rozpoznaj anomalie wskazujące możliwe problemy z usługą.
  • Oblicz najbardziej odpowiednie progi dla metryk.

Jeśli używasz progów dynamicznych, nie musisz znać odpowiedniego progu dla każdej metryki. Dynamiczne progi obliczają najbardziej odpowiednie wartości progowe.

Zalecamy skonfigurowanie reguł alertów z progami dynamicznymi dla następujących metryk:

  • Procent wykorzystania procesora maszyny wirtualnej
  • Czas wykonywania żądania HTTP usługi Application Insights

Progi dynamiczne ułatwiają:

  • Utwórz skalowalne alerty dla setek serii metryk z jedną regułą alertu. Jeśli masz mniej reguł alertów, poświęcasz mniej czasu na tworzenie i zarządzanie nimi. Skalowalne alerty są szczególnie przydatne w przypadku wielu wymiarów lub wielu zasobów, takich jak wszystkie zasoby w subskrypcji.
  • Twórz reguły bez konieczności konfigurowania progów.
  • Konfigurowanie alertów dotyczących metryk przy użyciu pojęć wysokiego poziomu bez konieczności posiadania obszernej wiedzy o domenie dotyczącej metryki.
  • Unikaj hałaśliwych (niskiej precyzji) lub szerokich (niskiej czułości) progów, które nie mają oczekiwanego wzorca.

Możesz użyć progów dynamicznych w:

  • Większość metryk platformy Azure Monitor i metryk niestandardowych.
  • Typowe metryki aplikacji i infrastruktury.
  • Hałaśliwe metryki, takie jak procesor komputera lub pamięć.
  • Metryki o niskim rozproszeniu, takie jak dostępność i szybkość błędów.

Progi dynamiczne można skonfigurować przy użyciu:

Obliczanie progu alertu i podgląd

Po utworzeniu reguły alertu progi dynamiczne używają 10 dni danych historycznych do obliczania sezonowych wzorców godzinowych lub dziennych. Wykres widoczny w podglądzie alertu odzwierciedla te dane.

Progi dynamiczne stale używają wszystkich dostępnych danych historycznych do nauki i umożliwiają dokładniejsze dostosowanie. Po trzech tygodniach progi dynamiczne mają wystarczającą ilość danych, aby zidentyfikować tygodniowe wzorce, a model jest dostosowywany w celu uwzględnienia tygodniowej sezonowości.

System automatycznie rozpoznaje długotrwałe awarie i usuwa je z algorytmu uczenia progowego. Jeśli występuje długotrwała awaria, dynamiczne progi dostosowują się do danych. Wykrywają problemy systemowe z takim samym poziomem czułości, jak przed wystąpieniem awarii.

Zagadnienia dotyczące używania progów dynamicznych

  • Aby zapewnić dokładne obliczenie progu, reguły alertów używające progów dynamicznych nie wyzwalają alertu przed zebraniem trzech dni i co najmniej 30 próbek danych metryk. Nowe zasoby lub zasoby, dla których brakuje danych metryk, nie wyzwalają alertu do momentu udostępnienia wystarczającej ilości danych.
  • Progi dynamiczne wymagają co najmniej trzech tygodni danych historycznych w celu wykrycia tygodniowej sezonowości. Niektóre szczegółowe wzorce, takie jak wzorce dwugodzinne lub półtygodniowe, mogą nie zostać wykryte.
  • Jeśli zachowanie metryki uległo ostatnio zmianie, zmiany nie zostaną natychmiast odzwierciedlone w górnej i dolnej granicy progu dynamicznego. Granice są obliczane na podstawie metrycznych danych z ostatnich 10 dni. Po wyświetleniu obramowania progu dynamicznego dla określonej metryki przyjrzyj się trendowi metryki w ostatnim tygodniu, a nie tylko w ostatnich godzinach lub dniach.
  • Progi dynamiczne są dobre do wykrywania znaczących odchyleń, w przeciwieństwie do powoli zmieniających się problemów. Powolne zmiany zachowania prawdopodobnie nie wyzwolą alertu.
  • Nie można używać progów dynamicznych w regułach alertów, które monitorują wiele warunków.

Konfigurowanie progów dynamicznych

Aby skonfigurować progi dynamiczne, wykonaj procedurę tworzenia reguły alertu. Użyj tych ustawień na karcie Warunek :

  • W obszarze Próg wybierz opcję Dynamiczny.
  • W polu Typ agregacji zalecamy, aby nie wybierać pozycji Maksimum.
  • W obszarze Operator wybierz pozycję Większe niż , chyba że zachowanie reprezentuje użycie aplikacji.
  • Dla czułości progu wybierz Średni lub Niski, aby zmniejszyć hałas alertów.
  • W polu Sprawdź co wybierz, jak często reguła alertu sprawdza, czy warunek jest spełniony. Aby zminimalizować wpływ alertu na działalność biznesową, rozważ użycie niższej częstotliwości. Upewnij się, że ta wartość jest mniejsza lub równa wartości okresu wstecznego.
  • W obszarze Okres lookback ustaw czas trwania przeglądu, aby przy każdym sprawdzeniu danych określać okres wstecz. Upewnij się, że ta wartość jest większa lub równa wartości Sprawdź co.
  • W obszarze Opcje zaawansowane wybierz liczbę naruszeń, które będą wyzwalać alert w określonym przedziale czasu. Opcjonalnie ustaw datę, od której chcesz zacząć uczyć się danych historycznych metryk i obliczać progi dynamiczne.

Uwaga

Reguły alertów dotyczących metryk tworzone za pośrednictwem portalu są tworzone w tej samej grupie zasobów co zasób docelowy.

Dynamiczny wykres progowy

Na poniższym wykresie przedstawiono metrykę, jej limity progów dynamicznych i niektóre alerty, które zostały wyzwolone, gdy wartość przekroczyła dozwolone progi.

Zrzut ekranu przedstawiający wykres z metryką, dynamicznymi progami oraz wyzwolonymi alertami.

Aby interpretować wykres, skorzystaj z poniższych informacji:

  • Niebieska linia: metryka mierzona w czasie.
  • Niebieski zacieniony obszar: dozwolony zakres dla metryki. Jeśli wartości metryk pozostaną w tym zakresie, żaden alert nie zostanie wyzwolony.
  • Niebieskie kropki: zagregowane wartości metryk. Jeśli wybierzesz część wykresu, a następnie umieść kursor nad niebieską linią, niebieska kropka pojawi się pod kursorem, aby wskazać pojedynczą zagregowaną wartość metryki.
  • Okno podręczne z niebieską kropką: zmierzona wartość metryki (niebieska kropka) oraz górne i dolne wartości dozwolonego zakresu.
  • Czerwona kropka z czarnym okręgiem: pierwsza wartość metryki poza dozwolonym zakresem. Ta wartość wyzwala alert dotyczący metryki i umieszcza go w aktywnym stanie.
  • Czerwone kropki: Inne zmierzone wartości poza dozwolonym zakresem. Nie wywołują dodatkowych alertów metryk, ale alert pozostaje w stanie aktywnym.
  • Czerwony obszar: czas, kiedy wartość metryki znajdowała się poza dozwolonym zakresem. Alert pozostaje w stanie aktywnym, o ile kolejne zmierzone wartości znajdują się poza dozwolonym zakresem, ale nie są wyzwalane żadne nowe alerty.
  • Koniec czerwonego obszaru: powrót do dozwolonych wartości. Gdy niebieska linia jest z powrotem wewnątrz dozwolonych wartości, czerwony obszar zatrzymuje się, a linia zmierzonej wartości zmieni kolor na niebieski. Stan alertu dotyczącego metryki wyzwolony w momencie czerwonej kropki z czarnym okręgiem jest ustawiony na rozwiązanie problemu.

Znane problemy z czułością progu dynamicznego

  • Jeśli reguła alertu korzystająca z progów dynamicznych generuje zbyt wiele powiadomień lub uruchamia zbyt wiele alertów, może być konieczne zmniejszenie jej czułości. Skorzystaj z jednej z następujących opcji:

    • Czułość progowa: ustaw czułość na Wartość Niska , aby być bardziej odporna na odchylenia.
    • Liczba naruszeń (w obszarze Ustawienia zaawansowane): skonfiguruj regułę alertu, aby wyzwalać tylko wtedy, gdy w określonym okresie wystąpi kilka odchyleń. To ustawienie sprawia, że reguła jest mniej podatna na odchylenia przejściowe.
  • Może się okazać, że reguła alertu korzystająca z progów dynamicznych nie jest wywoływana lub nie jest wystarczająco czuła, mimo że jest skonfigurowana z wysoką czułością. Ten scenariusz może wystąpić, gdy rozkład metryki jest bardzo nieregularny. Rozważ jedno z następujących rozwiązań:

    • Przejdź do monitorowania uzupełniającej metryki, która jest odpowiednia dla danego scenariusza, jeśli ma to zastosowanie. Na przykład sprawdź zmiany współczynnika powodzenia, a nie współczynnik niepowodzeń.
    • Spróbuj wybrać inną wartość dla stopnia szczegółowości agregacji (okres).
    • Sprawdź, czy drastyczna zmiana wystąpiła w funkcjonowaniu metryki w ciągu ostatnich 10 dni, na przykład awaria. Nagłe zmiany mogą mieć wpływ na górne i niższe progi obliczone dla metryki i uczynić je szerszymi. Poczekaj kilka dni, aż awaria nie zostanie już uwzględniona w obliczeniu progu. Możesz również edytować regułę alertu, aby użyć opcji Ignoruj dane przed w ustawieniach zaawansowanych.
    • Jeśli dane mają cotygodniową sezonowość, ale dla metryki jest dostępna za mało historii, obliczone progi mogą spowodować szerokie górne i dolne granice. Na przykład obliczenie może traktować dni robocze i weekendy w taki sam sposób i tworzyć szerokie granice, które nie zawsze pasują do danych. Ten problem powinien zostać rozwiązany po udostępnieniu wystarczającej liczby historii metryk. Następnie wykryto poprawną sezonowość i odpowiednio zaktualizowano obliczone progi.
  • Gdy wartość metryki wykazuje duże wahania, progi dynamiczne mogą utworzyć szeroki model wokół wartości metryk, co może spowodować obniżenie lub wyższe granice niż oczekiwano. Ten scenariusz może wystąpić, gdy:

    • Czułość jest ustawiona na niską.
    • Metryka wykazuje nieregularne zachowanie z wysoką wariancją, która pojawia się jako skoki lub spadki danych.

    Rozważ zmniejszenie czułości modelu przez wybór niższej czułości lub wybranie większej wartości okresu lookback. Możesz również użyć opcji Ignoruj dane przed , aby wykluczyć ostatnie nieregularności z danych historycznych używanych do kompilowania modelu.

Metryki, które nie są obsługiwane przez progi dynamiczne

Progi dynamiczne obsługują większość metryk, ale następujące metryki nie mogą używać progów dynamicznych:

Typ zasobu Nazwa metryki
Microsoft.KlasycznaPamięć/kontaPrzechowywania ZużytaPojemność
Microsoft.ClassicStorage/storageAccounts/blobServices Pojemność bloba
Microsoft.ClassicStorage/storageAccounts/blobServices LiczbaBlobów
Microsoft.ClassicStorage/storageAccounts/blobServices Pojemność indeksu
Microsoft.ClassicStorage/storageAccounts/fileServices Pojemność pliku
Microsoft.ClassicStorage/storageAccounts/fileServices LiczbaPlików
Microsoft.ClassicStorage/storageAccounts/fileServices LiczbaUdostępnieńPliku
Microsoft.ClassicStorage/storageAccounts/fileServices FileShareSnapshotCount
Microsoft.KlasycznePrzechowywanie/kontaPrzechowywania/usługiPlików FileShareSnapshotSize
Microsoft.ClassicStorage/storageAccounts/fileServices Udział plikówQuota
Microsoft.Compute/disks Bajty odczytu dysku kompozytowego na sekundę
Microsoft.Compute/disks Złożone operacje odczytu dysku na sekundę
Microsoft.Compute/disks Skomponowany zapis bajtów dysku na sekundę
Microsoft.Compute/disks Operacje zapisu na dysku kompozytowym na sekundę
Microsoft.ContainerService/managedClusters Liczba węzłów
Microsoft.ContainerService/managedClusters PodCount
Microsoft.ContainerService/managedClusters LiczbaUkoczonychZadań
Microsoft.ContainerService/managedClusters LicznikPonownychUruchomieńKontenera
Microsoft.ContainerService/managedClusters LiczbaZabitychPrzezOomKontenerów
Microsoft.Devices/IotHubs CałkowitaLiczbaUrządzeń
Microsoft.Devices/IotHubs LiczbaPodłączonychUrządzeń
Microsoft.Devices/IotHubs CałkowitaLiczbaUrządzeń
Microsoft.Devices/IotHubs LiczbaPodłączonychUrządzeń
Microsoft.DocumentDB/databaseAccounts Zamykanie połączeń Cassandra
Microsoft.EventHub/clusters Rozmiar
Microsoft.EventHub/przestrzenie nazw Rozmiar
Microsoft.IoTCentral/IoTApps liczbaPodłączonychUrządzeń
Microsoft.IoTCentral/IoTApps liczba skonfigurowanych urządzeń
Microsoft.Kubernetes/connectedClusters Liczba węzłów
Microsoft.Kubernetes/connectedClusters PodCount
Microsoft.Kubernetes/connectedClusters LiczbaUkoczonychZadań
Microsoft.Kubernetes/connectedClusters LicznikPonownychUruchomieńKontenera
Microsoft.Kubernetes/connectedClusters LiczbaZabitychPrzezOomKontenerów
Microsoft.MachineLearningServices/przestrzenie_robocze/punkty_koncowe_online ŻądaniaNaMinutę
Microsoft.MachineLearningServices/przestrzenie/nawigacjaWInternecie/deployments Pojemność Wdrożenia
Microsoft.Maps/konta UżycieKreatora
Microsoft.Media/mediaservices/streamingEndpoints Przepustowość wyjściowa
Microsoft.Network/applicationGateways Produktywność
Microsoft.Network/azureFirewalls Produktywność
Microsoft.Network/expressRouteGateways Pakiety na sekundę ExpressRouteGateway
Microsoft.Network/expressRouteGateways ExpressRouteGatewayNumberOfVmInVnet
Microsoft.Network/expressRouteGateways Częstotliwość zmiany tras bramy ExpressRoute
Microsoft.Network/virtualNetworkGateways ExpressRouteGatewayBityNaSekundę
Microsoft.Network/virtualNetworkGateways Pakiety na sekundę ExpressRouteGateway
Microsoft.Network/virtualNetworkGateways ExpressRouteGatewayNumberOfVmInVnet
Microsoft.Network/virtualNetworkGateways Częstotliwość zmiany tras bramy ExpressRoute
Microsoft.ServiceBus/przestrzenie nazw Rozmiar
Microsoft.ServiceBus/przestrzenie nazw Wiadomości
Microsoft.ServiceBus/przestrzenie nazw AktywneWiadomości
Microsoft.ServiceBus/przestrzenie nazw Wiadomości oznaczone jako nieprzetworzone
Microsoft.ServiceBus/przestrzenie nazw Wiadomości Zaplanowane
Microsoft.ServiceFabricMesh/applications Przydzielony procesor
Microsoft.ServiceFabricMesh/applications PrzydzielonaPamięć
Microsoft.ServiceFabricMesh/applications ActualCpu
Microsoft.ServiceFabricMesh/applications ActualMemory
Microsoft.ServiceFabricMesh/applications StatusAplikacji
Microsoft.ServiceFabricMesh/applications Stan usługi
Microsoft.ServiceFabricMesh/applications ServiceReplicaStatus
Microsoft.ServiceFabricMesh/applications Stan kontenera
Microsoft.ServiceFabricMesh/applications Liczba ponownych uruchomień
Microsoft.Storage/kontaMagazynowe ZużytaPojemność
Microsoft.Storage/kontaMagazynowe/usługiBlob Pojemność bloba
Microsoft.Storage/kontaMagazynowe/usługiBlob LiczbaBlobów
Microsoft.Storage/kontaMagazynowe/usługiBlob Rozmiar przydzielony dla Blob
Microsoft.Storage/kontaMagazynowe/usługiBlob Pojemność indeksu
Microsoft.Storage/storageAccounts/fileServices Pojemność pliku
Microsoft.Storage/storageAccounts/fileServices LiczbaPlików
Microsoft.Storage/storageAccounts/fileServices LiczbaUdostępnieńPliku
Microsoft.Storage/kontaStorage/usługiPlików Liczba migawek udostępnionych plików
Microsoft.Storage/storageAccounts/fileServices FileShareSnapshotSize
Microsoft.Storage/konta_magazynowe/usługi_pliku Limit Pojemności Udostępniania Plików
Microsoft.Storage/storageAccounts/fileServices Udostępnianie plików - zastrzeżone IOPS

Jeśli masz opinię na temat progów dynamicznych, wyślij nam wiadomość e-mail.