Typy alertów usługi Azure Monitor

W tym artykule opisano rodzaje alertów usługi Azure Monitor, które można utworzyć, i pomaga zrozumieć, kiedy używać każdego typu alertu.

Istnieją cztery typy alertów:

Wybieranie odpowiedniego typu alertu

Ta tabela może pomóc w podjęciu decyzji, kiedy należy użyć typu alertu. Aby uzyskać bardziej szczegółowe informacje o cenach, zobacz stronę cennika.

Typ alertu Kiedy należy używać Informacje o cenach
Alert dotyczący metryki Dane metryk są przechowywane w systemie już wstępnie obliczone. Alerty dotyczące metryk są przydatne, gdy chcesz otrzymywać alerty o danych, które wymagają niewielkiej lub żadnej manipulacji. Zalecamy używanie alertów dotyczących metryk, jeśli dane, które chcesz monitorować, są dostępne w danych metryk. Każda reguła alertu metryk jest naliczana na podstawie liczby monitorowanych szeregów czasowych.
Alert dziennika Alerty dzienników umożliwiają wykonywanie zaawansowanych operacji logiki na danych. Jeśli dane, które chcesz monitorować, są dostępne w dziennikach lub wymagają zaawansowanej logiki, możesz użyć niezawodnych funkcji KQL do manipulowania danymi przy użyciu alertów dzienników. Każda reguła alertu dziennika jest rozliczana na podstawie interwału, w którym zapytanie dziennika jest oceniane (częstsze oceny zapytań skutkuje wyższym kosztem). Ponadto w przypadku alertów dzienników skonfigurowanych do monitorowania skalowania koszt zależy również od liczby szeregów czasowych utworzonych przez wymiary wynikające z zapytania.
Alert dziennika aktywności Dzienniki aktywności zapewniają inspekcję wszystkich akcji, które wystąpiły w zasobach. Alerty dziennika aktywności mogą być alertowane, gdy wystąpi określone zdarzenie z zasobem, na przykład ponowne uruchomienie, zamknięcie lub utworzenie lub usunięcie zasobu. Alerty usługi Service Health i alerty Resource Health mogą poinformować Cię o problemie z jedną z usług lub zasobów. Aby uzyskać więcej informacji, odwiedź stronę cennika.
Alerty prometheus (wersja zapoznawcza) Alerty prometheus są używane głównie do zgłaszania alertów dotyczących wydajności i kondycji klastrów Kubernetes (w tym usługi AKS). Reguły alertów są oparte na języku PromQL, który jest językiem zapytań open source. W okresie obowiązywania wersji zapoznawczej nie są naliczane opłaty za alerty Prometheus.

Alerty dotyczące metryk

Reguła alertu metryki monitoruje zasób, oceniając warunki metryk zasobów w regularnych odstępach czasu. Jeśli warunki zostaną spełnione, zostanie wyzwolony alert. Szereg czasowy metryki to seria wartości metryk przechwyconych w danym okresie.

Reguły można tworzyć przy użyciu następujących metryk:

Reguły alertów dotyczących metryk obejmują następujące funkcje:

Elementem docelowym reguły alertu metryk może być:

  • Pojedynczy zasób, taki jak maszyna wirtualna. Zobacz ten artykuł , aby zapoznać się z obsługiwanymi typami zasobów.
  • Wiele zasobów tego samego typu w tym samym regionie świadczenia usługi Azure, takich jak grupa zasobów.

Wiele warunków

Podczas tworzenia reguły alertu dla pojedynczego zasobu można zastosować wiele warunków. Możesz na przykład utworzyć regułę alertu, aby monitorować maszynę wirtualną platformy Azure i alert, gdy zarówno wartość procentowa procesora CPU jest wyższa niż 90%" i "Długość kolejki przekracza 300 elementów". Gdy reguła alertu ma wiele warunków, alert jest uruchamiany, gdy wszystkie warunki reguły alertu są prawdziwe i jest rozwiązywane, gdy co najmniej jeden z warunków nie jest już spełniony w przypadku trzech kolejnych testów.

Zawężanie obiektu docelowego przy użyciu wymiarów

Wymiary to pary nazwa-wartość, które zawierają więcej danych o wartości metryki. Użycie wymiarów umożliwia filtrowanie metryk i monitorowanie określonych szeregów czasowych zamiast monitorowania agregacji wszystkich wartości wymiarowych. Na przykład metryka Transakcje konta magazynu może mieć wymiar nazwy interfejsu API, który zawiera nazwę interfejsu API wywoływanego przez każdą transakcję (na przykład GetBlob, DeleteBlob, PutPage). Możesz wybrać, czy alert został wyzwolony, gdy istnieje duża liczba transakcji w dowolnej nazwie interfejsu API (czyli zagregowanych danych) lub możesz użyć wymiarów, aby dodatkowo podzielić go na alert tylko wtedy, gdy liczba transakcji jest wysoka dla określonych nazw interfejsów API. Jeśli używasz więcej niż jednego wymiaru, reguła alertu dotyczącego metryki może monitorować wiele wartości wymiarów z różnych wymiarów metryki. Reguła alertu oddzielnie monitoruje wszystkie kombinacje wartości wymiarów. Zobacz ten artykuł , aby uzyskać szczegółowe instrukcje dotyczące używania wymiarów w regułach alertów dotyczących metryk.

Tworzenie alertów skoncentrowanych na zasobach przy użyciu dzielenia według wymiarów

Aby monitorować ten sam warunek na wielu zasobach platformy Azure, możesz użyć podziału według wymiarów. Dzielenie według wymiarów umożliwia tworzenie alertów skoncentrowanych na zasobach na dużą skalę dla subskrypcji lub grupy zasobów. Alerty są podzielone na oddzielne alerty, grupując kombinacje. Dzielenie kolumny identyfikatora zasobu platformy Azure powoduje, że określony zasób jest przeznaczony dla elementu docelowego alertu.

Możesz również zdecydować, że nie chcesz dzielić warunku zastosowanego do wielu zasobów w zakresie. Jeśli na przykład chcesz uruchomić alert, jeśli co najmniej pięć maszyn w zakresie grupy zasobów ma użycie procesora CPU powyżej 80%.

Monitorowanie wielu zasobów

Można monitorować na dużą skalę, stosując tę samą regułę alertu metryki do wielu zasobów tego samego typu dla zasobów, które istnieją w tym samym regionie świadczenia usługi Azure. Poszczególne powiadomienia są wysyłane dla każdego monitorowanego zasobu.

Obsługiwane są metryki platformy dla tych usług w następujących chmurach platformy Azure:

Usługa Globalna platforma Azure Instytucje rządowe Chiny
Maszyny wirtualne* Tak Tak Tak
Bazy danych programu SQL Server Tak Tak Tak
Elastyczne pule programu SQL Server Tak Tak Tak
Pule pojemności plików NetApp Tak Tak Tak
Woluminy plików NetApp Tak Tak Tak
Magazyny kluczy Tak Tak Tak
Azure Cache for Redis Tak Tak Tak
Urządzenia Azure Stack Edge Tak Tak Tak
Magazyny usługi Recovery Services Tak Nie Nie
Azure Database for PostgreSQL — serwery elastyczne Tak Tak Tak

Uwaga

Alerty metryk obejmujących wiele zasobów nie są obsługiwane w następujących scenariuszach:

  • Alerty dotyczące metryk gościa maszyn wirtualnych
  • Alerty dotyczące metryk sieci maszyn wirtualnych (łączna liczba sieci, łączna liczba przepływów sieciowych, przepływy przychodzące, przepływy wychodzące, maksymalna szybkość tworzenia przepływów przychodzących, maksymalna szybkość tworzenia przepływów wychodzących).

Zakres monitorowania można określić za pomocą jednej reguły alertu metryki na jeden z trzech sposobów. Na przykład za pomocą maszyn wirtualnych można określić zakres jako:

  • lista maszyn wirtualnych (w jednym regionie świadczenia usługi Azure) w ramach subskrypcji
  • wszystkie maszyny wirtualne (w jednym regionie świadczenia usługi Azure) w co najmniej jednej grupie zasobów w subskrypcji
  • wszystkie maszyny wirtualne (w jednym regionie świadczenia usługi Azure) w subskrypcji

Progi dynamiczne

Progi dynamiczne używają zaawansowanego uczenia maszynowego do:

  • Informacje o historycznym zachowaniu metryk
  • Identyfikowanie wzorców i dostosowywanie się do zmian metryk w czasie, takich jak wzorce godzinowe, dzienne lub tygodniowe.
  • Rozpoznawanie anomalii wskazujących możliwe problemy z usługą
  • Obliczanie najbardziej odpowiedniego progu dla metryki

Usługa Machine Learning stale używa nowych danych, aby dowiedzieć się więcej i zwiększyć dokładność progu. Ponieważ system dostosowuje się do zachowania metryk wraz z upływem czasu i alertów na podstawie odchyleń od jego wzorca, nie musisz znać progu "prawego" dla każdej metryki.

Progi dynamiczne ułatwiają:

  • Utwórz skalowalne alerty dla setek serii metryk z jedną regułą alertu. Jeśli masz mniej reguł alertów, poświęcasz mniej czasu na tworzenie reguł alertów i zarządzanie nimi.
  • Tworzenie reguł bez konieczności znajomości progu do skonfigurowania
  • Konfigurowanie alertów dotyczących metryk przy użyciu pojęć wysokiego poziomu bez obszernej wiedzy o domenie dotyczącej metryki
  • Zapobiegaj hałaśliwym (niskiej precyzji) lub szerokim (niskim odwołaniu) progom, które nie mają oczekiwanego wzorca
  • Obsługa hałaśliwych metryk (takich jak procesor CPU maszyny lub pamięć) i metryk o niskim rozproszeniu (takich jak dostępność i szybkość błędów).

Zobacz ten artykuł , aby uzyskać szczegółowe instrukcje dotyczące używania progów dynamicznych w regułach alertów dotyczących metryk.

Alerty dotyczące dzienników

Reguła alertu dziennika monitoruje zasób przy użyciu zapytania usługi Log Analytics w celu oceny dzienników zasobów z ustawioną częstotliwością. Jeśli warunki zostaną spełnione, zostanie wyzwolony alert. Ponieważ można używać zapytań usługi Log Analytics, możesz wykonywać zaawansowane operacje logiki na danych i używać niezawodnych funkcji języka KQL do manipulowania danymi dzienników.

Elementem docelowym reguły alertu dziennika może być:

Alerty dzienników mogą mierzyć dwie różne rzeczy, które mogą być używane w różnych scenariuszach monitorowania:

  • Wiersze tabeli: liczba zwracanych wierszy może służyć do pracy ze zdarzeniami, takimi jak dzienniki zdarzeń systemu Windows, dziennik systemowy, wyjątki aplikacji.
  • Obliczanie kolumny liczbowej: obliczenia na podstawie dowolnej kolumny liczbowej mogą służyć do uwzględnienia dowolnej liczby zasobów. Na przykład procent użycia procesora CPU.

Możesz skonfigurować, czy alerty dziennika są stanowe lub bezstanowe (obecnie w wersji zapoznawczej).

Uwaga

Alerty dzienników działają najlepiej, gdy próbujesz wykryć określone dane w dziennikach, w przeciwieństwie do tego, kiedy próbujesz wykryć brak danych w dziennikach. Ponieważ dzienniki są danymi częściowo ustrukturyzowanymi, są one z natury bardziej ukryte niż dane metryk dotyczące informacji, takich jak puls maszyny wirtualnej. Aby uniknąć błędów podczas próby wykrycia braku danych w dziennikach, rozważ użycie alertów metryk. Dane można wysyłać do magazynu metryk z dzienników przy użyciu alertów metryk dla dzienników.

Wymiary w regułach alertów dziennika

Wymiary można używać podczas tworzenia reguł alertów dziennika do monitorowania wartości wielu wystąpień zasobu przy użyciu jednej reguły. Na przykład można monitorować użycie procesora CPU w wielu wystąpieniach z uruchomioną witryną internetową lub aplikacją. Każde wystąpienie jest monitorowane indywidualnie powiadomienia są wysyłane dla każdego wystąpienia.

Dzielenie według wymiarów w regułach alertów dziennika

Aby monitorować ten sam warunek dla wielu zasobów platformy Azure, można użyć dzielenia według wymiarów. Dzielenie według wymiarów umożliwia tworzenie alertów skoncentrowanych na zasobach na dużą skalę dla subskrypcji lub grupy zasobów. Alerty są podzielone na oddzielne alerty przez grupowanie kombinacji przy użyciu kolumn liczbowych lub ciągów. Podział w kolumnie Identyfikator zasobu platformy Azure sprawia, że określony zasób jest kierowany do elementu docelowego alertu. Możesz również zdecydować, że nie chcesz podzielić warunku zastosowanego do wielu zasobów w zakresie. Jeśli na przykład chcesz uruchomić alert, jeśli co najmniej pięć maszyn w zakresie grupy zasobów ma użycie procesora CPU powyżej 80%.

Używanie interfejsu API

Zarządzanie nowymi regułami w obszarach roboczych przy użyciu interfejsu API ScheduledQueryRules .

Uwaga

Alerty dzienników dla usługi Log Analytics były zarządzane wcześniej przy użyciu starszego interfejsu API alertów usługi Log Analytics. Dowiedz się więcej na temat przełączania do bieżącego interfejsu API ScheduledQueryRules.

Rejestrowanie alertów na rachunku za platformę Azure

Alerty dzienników są wyświetlane w obszarze dostawca zasobów microsoft.insights/scheduledqueryrules z:

  • Alerty dzienników w usłudze Application Insights wyświetlane z dokładną nazwą zasobu oraz właściwościami grupy zasobów i alertu.
  • Alerty dzienników w usłudze Log Analytics wyświetlane z dokładną nazwą zasobu wraz z grupą zasobów i właściwościami alertu; podczas tworzenia przy użyciu interfejsu API scheduledQueryRules.
  • Alerty dzienników utworzone na podstawie starszego interfejsu API usługi Log Analytics nie są śledzone przez zasoby platformy Azure i nie mają wymuszanych unikatowych nazw zasobów. Te alerty są nadal tworzone microsoft.insights/scheduledqueryrules jako ukryte zasoby, które mają tę strukturę <WorkspaceName>|<savedSearchId>|<scheduleId>|<ActionId>nazewnictwa zasobów. Alerty dzienników w starszym interfejsie API są wyświetlane z powyższą ukrytą nazwą zasobu wraz z grupą zasobów i właściwościami alertu.

Uwaga

Nieobsługiwane znaki zasobów, takie jak <, , >%, &, , ?, / są zastępowane znakiem _ w ukrytych nazwach zasobów, co również będzie odzwierciedlać w informacjach rozliczeniowych.

Alerty dotyczące dziennika aktywności

Alert dziennika aktywności monitoruje zasób, sprawdzając dzienniki aktywności dla nowego zdarzenia dziennika aktywności zgodnego ze zdefiniowanymi warunkami.

Możesz użyć alertów dziennika aktywności dla tego typu scenariuszy:

  • Gdy określona operacja występuje na zasobach w określonej grupie zasobów lub subskrypcji. Na przykład możesz chcieć otrzymać powiadomienie, gdy:
    • Każda maszyna wirtualna w produkcyjnej grupie zasobów zostanie usunięta.
    • Wszystkie nowe role są przypisywane do użytkownika w ramach subskrypcji.
  • Występuje zdarzenie kondycji usługi. Kondycja usługi zdarzenia obejmują powiadomienia o zdarzeniach i zdarzeniach konserwacji, które mają zastosowanie do zasobów w ramach subskrypcji.

Alert dziennika aktywności można utworzyć w następujących elementach:

  • Każda z kategorii zdarzeń dziennika aktywności, inna niż w przypadku zdarzeń alertów.
  • Każde zdarzenie dziennika aktywności we właściwości najwyższego poziomu w obiekcie JSON.

Reguły alertów dziennika aktywności to zasoby platformy Azure, więc można je utworzyć przy użyciu szablonu usługi Azure Resource Manager. Można je również tworzyć, aktualizować lub usuwać w Azure Portal.

Alert dziennika aktywności monitoruje tylko zdarzenia w subskrypcji, w której jest tworzony alert.

Alerty usługi Service Health

Alerty usługi Service Health są typem alertu aktywności. Usługa Service Health informuje o awariach, planowanych działaniach konserwacji i innych poradach dotyczących kondycji, ponieważ uwierzytelnione środowisko usługi Service Health wie, które usługi i zasoby są obecnie używane.

Najlepszym sposobem korzystania z usługi Service Health jest skonfigurowanie alertów usługi Service Health w celu powiadamiania o używaniu preferowanych kanałów komunikacyjnych, gdy problemy z usługą, planowana konserwacja lub inne zmiany mogą mieć wpływ na używane usługi i regiony platformy Azure.

alerty Resource Health

Resource Health alerty są typem alertu aktywności. Resource Health omówienie ułatwia diagnozowanie i uzyskiwanie pomocy technicznej dla problemów z usługami, które wpływają na zasoby platformy Azure. Raportuje bieżącą i przeszłą kondycję zasobów. Resource Health opiera się na sygnałach z różnych usług platformy Azure w celu oceny, czy zasób jest w dobrej kondycji. Jeśli zasób jest w złej kondycji, Resource Health analizuje dodatkowe informacje w celu określenia źródła problemu. Raportuje również działania podejmowane przez firmę Microsoft w celu rozwiązania problemu i identyfikuje rzeczy, które można zrobić, aby rozwiązać ten problem.

Alerty wykrywania inteligentnego

Po skonfigurowaniu usługi Application Insights dla projektu, gdy aplikacja generuje pewną minimalną ilość danych, funkcja wykrywania inteligentnego trwa 24 godziny, aby poznać normalne zachowanie aplikacji. Wydajność aplikacji ma typowy wzorzec zachowania. Niektóre żądania lub wywołania zależności będą bardziej podatne na awarie niż inne; a ogólny współczynnik awarii może wzrosnąć wraz ze wzrostem obciążenia. Funkcja wykrywania inteligentnego używa uczenia maszynowego do znajdowania tych anomalii. Funkcja wykrywania inteligentnego monitoruje dane odebrane z aplikacji, a w szczególności współczynniki awarii. Usługa Application Insights automatycznie wysyła alerty niemal w czasie rzeczywistym, jeśli aplikacja internetowa doświadcza nietypowego wzrostu liczby żądań, które zakończyły się niepowodzeniem.

Gdy dane są wprowadzane do usługi Application Insights z aplikacji internetowej, funkcja wykrywania inteligentnego porównuje bieżące zachowanie z wzorcami widocznymi w ciągu ostatnich kilku dni. Jeśli występuje nietypowy wzrost współczynnika niepowodzeń w porównaniu z poprzednią wydajnością, analiza zostanie wyzwolona. Aby ułatwić klasyfikację i zdiagnozować problem, w szczegółach alertu znajduje się analiza cech błędów i powiązanych danych aplikacji. Dostępne są również linki do portalu usługi Application Insights w celu dalszej diagnostyki. Funkcja nie wymaga konfiguracji ani konfiguracji, ponieważ używa algorytmów uczenia maszynowego do przewidywania normalnego współczynnika niepowodzeń.

Alerty metryk informują o problemie, jednak funkcja wykrywania inteligentnego uruchamia pracę diagnostyczną, wykonując większość analizy, którą w przeciwnym razie trzeba wykonać samodzielnie. Wyniki są starannie spakowane, pomagając szybko przejść do korzenia problemu.

Wykrywanie inteligentne działa w przypadku aplikacji internetowych hostowanych w chmurze lub na własnych serwerach, które generują żądania aplikacji lub dane zależności.

Alerty prometheus (wersja zapoznawcza)

Alerty rozwiązania Prometheus są oparte na wartościach metryk przechowywanych w usługach zarządzanych usługi Azure Monitor dla rozwiązania Prometheus. Są uruchamiane, gdy wyniki zapytania PromQL są rozpoznawane jako true. Alerty rozwiązania Prometheus są wyświetlane i zarządzane jak inne typy alertów podczas ich uruchamiania, ale są one skonfigurowane przy użyciu grupy reguł Prometheus. Aby uzyskać szczegółowe informacje, zobacz Grupy reguł w usłudze zarządzanej Azure Monitor dla rozwiązania Prometheus .

Następne kroki