Wybieranie odpowiedniego typu reguły alertu

Artykuł
11/05/2024

W tym artykule opisano rodzaje alertów usługi Azure Monitor, które można utworzyć. Ułatwia to zrozumienie, kiedy należy używać każdego typu alertu. Aby uzyskać więcej informacji na temat cen, zobacz stronę cennika.

Typy alertów to:

Alerty dotyczące metryk
Alerty przeszukiwania dzienników
Alerty dotyczące dzienników aktywności
- Alerty usługi Service Health
- Alerty usługi Resource Health
Alerty wykrywania inteligentnego
Alerty prometheus

Typy alertów usługi Azure Monitor

Typ alertu	Kiedy używać	Informacje o cenach
Alert dotyczący metryki	Dane metryk są przechowywane w systemie już wstępnie obliczone. Alerty dotyczące metryk są przydatne, gdy chcesz otrzymywać alerty dotyczące danych, które wymagają niewielkiej lub żadnej manipulacji. Użyj alertów metryk, jeśli dane, które chcesz monitorować, są dostępne w danych metryk.	Każda reguła alertu metryki jest naliczana na podstawie liczby monitorowanych szeregów czasowych.
Alert dotyczący przeszukiwania dzienników	Alerty przeszukiwania dzienników umożliwiają wykonywanie zaawansowanych operacji logiki na danych. Jeśli dane, które chcesz monitorować, są dostępne w dziennikach lub wymagają zaawansowanej logiki, możesz użyć niezawodnych funkcji język zapytań Kusto (KQL) do manipulowania danymi przy użyciu alertów przeszukiwania dzienników.	Każda reguła alertu przeszukiwania dzienników jest rozliczana na podstawie interwału, w którym jest oceniane zapytanie dziennika. Częstsza ocena zapytań powoduje wyższe koszty. W przypadku alertów wyszukiwania dzienników skonfigurowanych do monitorowania na dużą skalę przy użyciu podziału według wymiarów koszt zależy również od liczby szeregów czasowych utworzonych przez wymiary wynikające z zapytania.
Alert dziennika aktywności	Dzienniki aktywności oferują inspekcję wszystkich akcji, które wystąpiły w zasobach. Alerty dziennika aktywności służą do wysyłania alertów w przypadku wystąpienia określonego zdarzenia do zasobu, takiego jak ponowne uruchomienie, zamknięcie lub utworzenie lub usunięcie zasobu. Alerty usługi Service Health i alerty usługi Resource Health informują o problemie z jedną z usług lub zasobów.	Aby uzyskać więcej informacji, zobacz stronę z cennikiem.
Alerty rozwiązania Prometheus	Alerty prometheus są używane do zgłaszania alertów dotyczących metryk Rozwiązania Prometheus przechowywanych w usługach zarządzanych usługi Azure Monitor dla rozwiązania Prometheus. Reguły alertów są oparte na języku zapytań open source PromQL.	Reguły alertów Prometheus są naliczane tylko za dane, których dotyczy zapytanie. Aby uzyskać więcej informacji, zobacz stronę z cennikiem.

Alerty dotyczące metryk

Reguła alertu metryki monitoruje zasób, oceniając warunki metryk zasobów w regularnych odstępach czasu. Jeśli warunki zostaną spełnione, zostanie wyzwolony alert. Szereg czasowy metryki to seria wartości metryk przechwyconych w danym okresie.

Reguły można tworzyć przy użyciu następujących metryk:

Reguły alertów dotyczących metryk obejmują następujące funkcje:

Dla pojedynczego zasobu można użyć wielu warunków dla reguły alertu.
Stopień szczegółowości można dodać, monitorując wiele wymiarów metryk.
Możesz użyć progów dynamicznych, które są oparte na uczeniu maszynowym.
Możesz skonfigurować, czy alerty metryk są stanowe lub bezstanowe. Alerty metryk są domyślnie stanowe.

Elementem docelowym reguły alertu metryki może być:

Pojedynczy zasób, taki jak maszyna wirtualna. Aby uzyskać informacje o obsługiwanych typach zasobów, zobacz Obsługiwane zasoby dla alertów metryk w usłudze Azure Monitor.
Wiele zasobów tego samego typu w tym samym regionie świadczenia usługi Azure, takich jak grupa zasobów.

Stosowanie wielu warunków do reguły alertu metryki

Podczas tworzenia reguły alertu dla pojedynczego zasobu można zastosować wiele warunków. Można na przykład utworzyć regułę alertu, aby monitorować maszynę wirtualną platformy Azure i alert, gdy zarówno wartość procentowa procesora CPU jest wyższa niż 90%" i "Długość kolejki przekracza 300 elementów". Jeśli reguła alertu ma wiele warunków, alert jest wyzwalany, gdy wszystkie warunki w regule alertu są prawdziwe i jest rozpoznawane, gdy co najmniej jeden z warunków nie jest już spełniony w przypadku trzech kolejnych testów.

Zawężanie obiektu docelowego przy użyciu wymiarów

Aby uzyskać instrukcje dotyczące używania wymiarów w regułach alertów dotyczących metryk, zobacz Monitorowanie wielu szeregów czasowych w jednej regule alertu dotyczącego metryk.

Monitorowanie tego samego warunku dla wielu zasobów przy użyciu podziału według wymiarów

Aby monitorować ten sam warunek dla wielu zasobów platformy Azure, można użyć dzielenia według wymiarów. W przypadku używania dzielenia według wymiarów można tworzyć alerty skoncentrowane na zasobach na dużą skalę dla subskrypcji lub grupy zasobów. Alerty są podzielone na oddzielne alerty według kombinacji grupowania. Podzielenie kolumny identyfikatora zasobu platformy Azure powoduje, że określony zasób jest przeznaczony dla elementu docelowego alertu.

Możesz również zdecydować, że nie chcesz dzielić warunku zastosowanego do wielu zasobów w zakresie. Na przykład możesz chcieć uruchomić alert, jeśli co najmniej pięć maszyn w zakresie grupy zasobów ma użycie procesora CPU powyżej 80%.

Monitorowanie wielu zasobów przy użyciu jednej reguły alertu

Możesz monitorować na dużą skalę, stosując tę samą regułę alertu metryki do wielu zasobów tego samego typu dla zasobów, które istnieją w tym samym regionie świadczenia usługi Azure. Poszczególne powiadomienia są wysyłane dla każdego monitorowanego zasobu.

Obsługiwane są metryki platformy dla tych usług w następujących chmurach platformy Azure:

Usługa	Dostawca zasobów	globalna platforma Azure	Instytucje rządowe	Chiny
Maszyny wirtualne	"Microsoft.Compute/virtualMachines"	Tak	Tak	Tak
Bazy danych programu SQL Server	"Microsoft.Sql/servers/databases"	Tak	Tak	Tak
Elastyczne pule programu SQL Server	"Microsoft.Sql/servers/elasticpools"	Tak	Tak	Tak
Pule pojemności plików NetApp	"Microsoft.NetApp/netAppAccounts/capacityPools"	Tak	Tak	Tak
Woluminy plików NetApp	"Microsoft.NetApp/netAppAccounts/capacityPools/volumes"	Tak	Tak	Tak
Azure Key Vault	"Microsoft.KeyVault/vaults"	Tak	Tak	Tak
Azure Cache for Redis	"Microsoft.Cache/redis"	Tak	Tak	Tak
Urządzenia usługi Azure Stack Edge	(Nie ma określonego dostawcy zasobów dla tego zasobu. Ze względu na sposób działania urządzeń brzegowych stosu metryki są pobierane z kilku dostawców zasobów. Aby uzyskać więcej informacji na temat alertów dotyczących tego zasobu, zapoznaj się z tą dokumentacją: Przejrzyj alerty w usłudze Azure Stack Edge)	Tak	Tak	Tak
Magazyny usługi Recovery Services	"Microsoft.RecoveryServices/Vaults"	Tak	Nie.	Nie.
Serwery — Azure Database for PostgreSQL — serwer elastyczny	"Microsoft.DBforPostgreSQL/flexibleServers"	Tak	Tak	Tak
Maszyny bez systemu operacyjnego (Operator Nexus)	"Microsoft.NetworkCloud/bareMetalMachines"	Tak	Tak	Tak
Urządzenia magazynujące (Operator Nexus)	"Microsoft.NetworkCloud/storageAppliances"	Tak	Tak	Tak
Klastry (Operator Nexus)	"Microsoft.NetworkCloud/clusters"	Tak	Tak	Tak
Urządzenia sieciowe (Operator Nexus)	Microsoft.NetworkCloud/l2Networks, Microsoft.NetworkCloud/l3Networks	Tak	Tak	Tak
Reguły zbierania danych	"Microsoft.Insights/datacollectionrules"	Tak	Tak	Tak

Uwaga

Alerty metryk z wieloma zasobami nie są obsługiwane w następujących celach:

Alerty dotyczące metryk gościa maszyny wirtualnej.
Alerty dotyczące metryk sieci maszyn wirtualnych (Łączna ilość danych przychodzących sieci, łączna ilość danych wychodzących sieci, przepływy wychodzące, maksymalna szybkość tworzenia przepływów przychodzących, maksymalna szybkość tworzenia przepływów wychodzących).

Zakres monitorowania można określić za pomocą jednej reguły alertu metryki na jeden z trzech sposobów. Na przykład za pomocą maszyn wirtualnych można określić zakres jako:

Lista maszyn wirtualnych w jednym regionie świadczenia usługi Azure w ramach subskrypcji.
Wszystkie maszyny wirtualne w jednym regionie świadczenia usługi Azure w co najmniej jednej grupie zasobów w subskrypcji.
Wszystkie maszyny wirtualne w jednym regionie świadczenia usługi Azure w ramach subskrypcji.

Stosowanie zaawansowanej uczenia maszynowego z progami dynamicznymi

Progi dynamiczne używają zaawansowanego uczenia maszynowego do:

Poznaj historyczne zachowanie metryk.
Identyfikowanie wzorców i dostosowywanie się do zmian metryk w czasie, takich jak wzorce godzinowe, dzienne lub tygodniowe.
Rozpoznaj anomalie wskazujące możliwe problemy z usługą.
Oblicz najbardziej odpowiedni próg dla metryki.

Uczenie maszynowe stale używa nowych danych, aby dowiedzieć się więcej i zwiększyć dokładność progu. Ponieważ system dostosowuje się do zachowania metryk w miarę upływu czasu i alertów na podstawie odchyleń od wzorca, nie musisz znać progu "odpowiedniego" dla każdej metryki.

Progi dynamiczne ułatwiają:

Utwórz skalowalne alerty dla setek serii metryk z jedną regułą alertu. Jeśli masz mniej reguł alertów, poświęcasz mniej czasu na tworzenie reguł alertów i zarządzanie nimi.
Tworzenie reguł bez konieczności znajomości progu do skonfigurowania.
Konfigurowanie alertów dotyczących metryk przy użyciu pojęć wysokiego poziomu bez obszernej wiedzy o domenie dotyczącej metryki.
Zapobiegaj hałaśliwym (niskiej precyzji) lub szerokim (niskim odwołaniu) progom, które nie mają oczekiwanego wzorca.
Obsługa hałaśliwych metryk (takich jak procesor CPU maszyny lub pamięć) i metryki o niskim rozproszeniu (na przykład dostępność i szybkość błędów).

Zobacz progi dynamiczne, aby uzyskać szczegółowe instrukcje dotyczące używania progów dynamicznych w regułach alertów dotyczących metryk.

Alerty przeszukiwania dzienników

Reguła alertu przeszukiwania dzienników monitoruje zasób przy użyciu zapytania usługi Log Analytics w celu oceny dzienników zasobów z ustawioną częstotliwością. Jeśli warunki zostaną spełnione, zostanie wyzwolony alert. Ponieważ można używać zapytań usługi Log Analytics, możesz wykonywać zaawansowane operacje logiki na danych i używać niezawodnych funkcji KQL do manipulowania danymi dziennika.

Elementem docelowym reguły alertu przeszukiwania dzienników może być:

Pojedynczy zasób, taki jak maszyna wirtualna.
Pojedynczy kontener zasobów, taki jak grupa zasobów lub subskrypcja.
Wiele zasobów korzystających z zapytania obejmującego wiele zasobów.

Alerty przeszukiwania dzienników mogą mierzyć dwie różne rzeczy, które mogą być używane w różnych scenariuszach monitorowania:

Wiersze tabeli: liczba zwracanych wierszy może służyć do pracy ze zdarzeniami, takimi jak dzienniki zdarzeń systemu Windows, dziennik syslog i wyjątki aplikacji.
Obliczanie kolumny liczbowej: obliczenia na podstawie dowolnej kolumny liczbowej mogą służyć do uwzględnienia dowolnej liczby zasobów. Przykładem jest procent procesora CPU.

Możesz skonfigurować, czy alerty przeszukiwania dzienników są stanowe lub bezstanowe.
Należy pamiętać, że alerty wyszukiwania dzienników stanowych mają następujące ograniczenia:

mogą wyzwalać maksymalnie 300 alertów na ocenę.
Możesz mieć maksymalnie 5000 alertów z warunkiem alertu fired .

Uwaga

Alerty przeszukiwania dzienników działają najlepiej, gdy próbujesz wykryć określone dane w dziennikach, a nie podczas próby wykrycia braku danych w dziennikach. Ponieważ dzienniki są danymi częściowo ustrukturyzowanymi, są one z natury bardziej ukryte niż dane metryk w przypadku informacji takich jak puls maszyny wirtualnej. Aby uniknąć błędów podczas próby wykrycia braku danych w dziennikach, rozważ użycie alertów dotyczących metryk. Dane można wysyłać do magazynu metryk z dzienników przy użyciu alertów metryk dla dzienników.

Monitorowanie wielu wystąpień zasobu przy użyciu wymiarów

Wymiary można używać podczas tworzenia reguł alertów przeszukiwania dzienników w celu monitorowania wartości wielu wystąpień zasobu za pomocą jednej reguły. Możesz na przykład monitorować użycie procesora CPU w wielu wystąpieniach z uruchomioną witryną internetową lub aplikacją. Każde wystąpienie jest monitorowane indywidualnie. Powiadomienia są wysyłane dla każdego wystąpienia.

Monitorowanie tego samego warunku dla wielu zasobów przy użyciu podziału według wymiarów

Aby monitorować ten sam warunek dla wielu zasobów platformy Azure, można użyć dzielenia według wymiarów. W przypadku używania dzielenia według wymiarów można tworzyć alerty skoncentrowane na zasobach na dużą skalę dla subskrypcji lub grupy zasobów. Alerty są podzielone na oddzielne alerty, grupując kombinacje przy użyciu kolumn liczbowych lub ciągów. Podzielenie kolumny Identyfikator zasobu platformy Azure powoduje, że określony zasób jest określany jako element docelowy alertu.

Używanie interfejsu API dla reguł alertów przeszukiwania dzienników

Zarządzanie nowymi regułami w obszarach roboczych przy użyciu interfejsu API ScheduledQueryRules .

Uwaga

Alerty wyszukiwania dzienników dla usługi Log Analytics używane do zarządzania przy użyciu starszego interfejsu API alertów usługi Log Analytics. Dowiedz się więcej na temat przełączania do bieżącego interfejsu API ScheduledQueryRules.

Alerty dotyczące przeszukiwania dzienników na rachunku za korzystanie z platformy Azure

Alerty przeszukiwania dzienników są wyświetlane w obszarze dostawca microsoft.insights/scheduledqueryrules zasobów z:

Alerty wyszukiwania dzienników w usłudze Application Insights wyświetlane z dokładną nazwą zasobu oraz właściwościami grupy zasobów i alertu.
Alerty przeszukiwania dzienników w usłudze Log Analytics są wyświetlane z dokładną nazwą zasobu oraz właściwościami grupy zasobów i alertów podczas ich tworzenia przy użyciu interfejsu API scheduledQueryRules.
Alerty przeszukiwania dzienników utworzone na podstawie starszego interfejsu API usługi Log Analytics nie są śledzone przez zasoby platformy Azure i nie mają wymuszanych unikatowych nazw zasobów. Te alerty są nadal tworzone microsoft.insights/scheduledqueryrules jako ukryte zasoby, które mają strukturę <WorkspaceName>|<savedSearchId>|<scheduleId>|<ActionId>nazewnictwa zasobów . Alerty wyszukiwania dzienników w starszym interfejsie API są wyświetlane z poprzednią ukrytą nazwą zasobu wraz z grupą zasobów i właściwościami alertu.

Uwaga

Nieobsługiwane znaki zasobu, takie jak <, , >%, &, , ? i / są zastępowane znakiem podkreślenia (_) w ukrytych nazwach zasobów. Ta zmiana znaku jest również odzwierciedlana w informacjach rozliczeniowych.

Alerty dotyczące dzienników aktywności

Alert dziennika aktywności monitoruje zasób, sprawdzając dzienniki aktywności pod kątem nowego zdarzenia dziennika aktywności zgodnego ze zdefiniowanymi warunkami.

Możesz użyć alertów dziennika aktywności dla następujących typów scenariuszy:

Gdy określona operacja występuje na zasobach w określonej grupie zasobów lub subskrypcji. Możesz na przykład otrzymywać powiadomienia, gdy:
- Maszyna wirtualna w produkcyjnej grupie zasobów jest usuwana.
- Nowe role są przypisywane do użytkownika w ramach subskrypcji.
Występuje zdarzenie usługi Service Health. Zdarzenia usługi Service Health obejmują powiadomienia o zdarzeniach i zdarzeniach konserwacji, które mają zastosowanie do zasobów w ramach subskrypcji.

Możesz utworzyć alert dziennika aktywności w następujących tematach:

Każda z kategorii zdarzeń dziennika aktywności, inna niż w przypadku zdarzeń alertów.
Dowolne zdarzenie dziennika aktywności we właściwości najwyższego poziomu w obiekcie JSON.

Reguły alertów dziennika aktywności to zasoby platformy Azure, więc można je utworzyć przy użyciu szablonu usługi Azure Resource Manager. Można je również utworzyć, zaktualizować lub usunąć w witrynie Azure Portal.

Alert dziennika aktywności monitoruje tylko zdarzenia w subskrypcji, w której jest tworzony alert.

Alerty usługi Service Health

Alerty usługi Service Health są typem alertu aktywności. Usługa Service Health informuje o awariach, planowanych działaniach konserwacji i innych poradach dotyczących kondycji, ponieważ uwierzytelnione środowisko usługi Service Health wie, które usługi i zasoby są obecnie używane.

Najlepszym sposobem korzystania z usługi Service Health jest skonfigurowanie alertów usługi Service Health w celu powiadamiania użytkownika za pomocą preferowanych kanałów komunikacyjnych, gdy problemy z usługą, planowana konserwacja lub inne zmiany mogą mieć wpływ na używane usługi i regiony platformy Azure.

Alerty usługi Resource Health

Alerty usługi Resource Health są typem alertu aktywności. Omówienie usługi Resource Health ułatwia diagnozowanie i uzyskiwanie pomocy technicznej dotyczącej problemów z usługami, które wpływają na zasoby platformy Azure. Raportuje bieżącą i przeszłą kondycję zasobów.

Usługa Resource Health korzysta z sygnałów pochodzących z różnych usług platformy Azure, aby ocenić, czy zasób jest w dobrej kondycji. Jeśli zasób jest w złej kondycji, usługa Resource Health analizuje więcej informacji, aby określić źródło problemu. Raportuje również działania podejmowane przez firmę Microsoft w celu rozwiązania problemu i identyfikuje działania, które można wykonać, aby rozwiązać ten problem.

Alerty wykrywania inteligentnego

Po skonfigurowaniu usługi Application Insights dla projektu, a aplikacja generuje pewną ilość danych, wykrywanie inteligentne trwa 24 godziny, aby dowiedzieć się, jak działa normalna aplikacja. Wydajność aplikacji ma typowy wzorzec zachowania. Niektóre żądania lub wywołania zależności będą bardziej podatne na awarie niż inne, a ogólny współczynnik awarii może wzrosnąć w miarę wzrostu obciążenia.

Wykrywanie inteligentne używa uczenia maszynowego do znajdowania tych anomalii. Funkcja wykrywania inteligentnego monitoruje dane odebrane z aplikacji, a w szczególności współczynniki awarii. Usługa Application Insights automatycznie wysyła alerty niemal w czasie rzeczywistym, jeśli aplikacja internetowa doświadcza nietypowego wzrostu liczby żądań, które zakończyły się niepowodzeniem.

Gdy dane wchodzą do usługi Application Insights z aplikacji internetowej, wykrywanie inteligentne porównuje bieżące zachowanie z wzorcami widocznymi w ciągu ostatnich kilku dni. Jeśli występuje nietypowy wzrost współczynnika niepowodzeń w porównaniu z poprzednią wydajnością, zostanie wyzwolona analiza.

Aby ułatwić klasyfikację i zdiagnozować problem, w szczegółach alertu znajduje się analiza cech błędów i powiązanych danych aplikacji. Istnieją również linki do portalu usługi Application Insights w celu dalszej diagnostyki. Ta funkcja nie wymaga konfiguracji ani konfiguracji, ponieważ używa algorytmów uczenia maszynowego do przewidywania normalnego współczynnika awarii.

Mimo że alerty metryk informują o problemie, wykrywanie inteligentne uruchamia pracę diagnostyczną. Wykonuje ona wiele analiz, które w przeciwnym razie trzeba by zrobić samodzielnie. Wyniki są starannie spakowane, co pomaga szybko przejść do korzenia problemu.

Wykrywanie inteligentne działa w przypadku aplikacji internetowych hostowanych w chmurze lub na własnych serwerach, które generują żądania aplikacji lub dane zależności.

Alerty rozwiązania Prometheus

Alerty prometheus służą do monitorowania metryk przechowywanych w usługach zarządzanych usługi Azure Monitor dla rozwiązania Prometheus. Reguły alertów prometheus są konfigurowane w ramach grup reguł Prometheus. Są one wyzwalane, gdy wynik wyrażenia PromQL jest rozpoznawany na wartość true. Wyzwolone alerty Prometheus są wyświetlane i zarządzane, podobnie jak inne typy alertów.

Następne kroki

Zapoznaj się z omówieniem alertów.
Tworzenie reguły alertu.
Dowiedz się więcej o wykrywaniu inteligentnym.

Udostępnij za pośrednictwem

Wybieranie odpowiedniego typu reguły alertu

Typy alertów usługi Azure Monitor

Alerty dotyczące metryk

Stosowanie wielu warunków do reguły alertu metryki

Zawężanie obiektu docelowego przy użyciu wymiarów

Monitorowanie tego samego warunku dla wielu zasobów przy użyciu podziału według wymiarów

Monitorowanie wielu zasobów przy użyciu jednej reguły alertu

Stosowanie zaawansowanej uczenia maszynowego z progami dynamicznymi

Alerty przeszukiwania dzienników

Monitorowanie wielu wystąpień zasobu przy użyciu wymiarów

Monitorowanie tego samego warunku dla wielu zasobów przy użyciu podziału według wymiarów

Używanie interfejsu API dla reguł alertów przeszukiwania dzienników

Alerty dotyczące przeszukiwania dzienników na rachunku za korzystanie z platformy Azure

Alerty dotyczące dzienników aktywności

Alerty usługi Service Health

Alerty usługi Resource Health

Alerty wykrywania inteligentnego

Alerty rozwiązania Prometheus

Następne kroki

Opinia

Dodatkowe zasoby