Wykrywanie i eliminowanie potencjalnych problemów przy użyciu metodyki AIOps i uczenia maszynowego w usłudze Azure Monitor

2025-05-20

Sztuczna inteligencja dla operacji IT (AIOps) oferuje zaawansowane sposoby poprawy jakości i niezawodności usług przy użyciu uczenia maszynowego do przetwarzania i automatycznego działania na danych zbieranych z aplikacji, usług i zasobów IT do usługi Azure Monitor.

Wbudowane funkcje sztucznej inteligencji w usłudze Azure Monitor zapewniają szczegółowe informacje i ułatwiają rozwiązywanie problemów oraz automatyzowanie zadań opartych na danych, takich jak przewidywanie użycia pojemności i skalowanie automatyczne, identyfikowanie i analizowanie problemów z wydajnością aplikacji oraz wykrywanie nietypowych zachowań na maszynach wirtualnych, kontenerach i innych zasobach. Te funkcje zwiększają monitorowanie i operacje IT bez konieczności znajomości uczenia maszynowego i dalszych inwestycji.

Usługa Azure Monitor udostępnia również narzędzia, które umożliwiają tworzenie własnego potoku uczenia maszynowego w celu wprowadzenia nowych funkcji analizy i odpowiedzi oraz działania na danych w dziennikach usługi Azure Monitor.

W tym artykule opisano wbudowane funkcje AIOps usługi Azure Monitor i wyjaśniono, jak można tworzyć i uruchamiać dostosowane modele uczenia maszynowego oraz tworzyć zautomatyzowany potok uczenia maszynowego na danych w dziennikach usługi Azure Monitor.

Wbudowane funkcje AIOps i uczenia maszynowego w usłudze Azure Monitor

Scenariusz monitorowania	Zdolność	Opis
Monitorowanie dzienników	Obszar roboczy usługi Log Analytics — szczegółowe informacje	Zapewnia ujednolicony widok obszarów roboczych usługi Log Analytics i używa uczenia maszynowego do wykrywania anomalii w procesie pozyskiwania danych.
	analiza szeregów czasowych i funkcje uczenia maszynowego w języku zapytań Kusto (KQL)	Łatwe w użyciu narzędzia do generowania danych szeregów czasowych, wykrywania anomalii, prognozowania i przeprowadzania analizy głównej przyczyny bezpośrednio w dziennikach usługi Azure Monitor bez konieczności dogłębnej znajomości języków nauki o danych i programowania.
	Microsoft Copilot na platformie Azure	Ułatwia korzystanie z usługi Log Analytics do analizowania danych i rozwiązywania problemów. Generuje przykładowe zapytania KQL na podstawie monitów, takich jak "Czy w dziennikach kontenera występują błędy?".
Monitorowanie wydajności aplikacji	Inteligentny widok mapy aplikacji	Mapuje zależności między usługami i pomaga wykrywać wąskie gardła wydajnościowe lub punkty krytyczne błędów we wszystkich składnikach aplikacji rozproszonej.
	Inteligentne wykrywanie	Analizuje dane telemetryczne wysyłane przez aplikację do usługi Application Insights, alerty dotyczące problemów z wydajnością i anomalii w zakresie awarii oraz identyfikuje potencjalne główne przyczyny problemów z wydajnością aplikacji.
Alerty dotyczące metryk	Dynamiczne progi dla alertowania dotyczącego metryk	Poznaje wzorce metryk, automatycznie ustawia progi alertów na podstawie danych historycznych i identyfikuje anomalie, które mogą wskazywać na problemy z usługą.
Zestawy do skalowania maszyn wirtualnych	Automatyczne skalowanie predykcyjne	Prognozuje ogólne wymagania CPU zestawu skalowania maszyn wirtualnych na podstawie historycznych wzorców użycia i automatycznie skaluje się poziomo, aby sprostać tym potrzebom.

Uczenie maszynowe w dziennikach usługi Azure Monitor

Użyj wbudowanych funkcji i operatorów analizy szeregów czasowych, uczenia maszynowego oraz wtyczek języka zapytań Kusto, aby uzyskać szczegółowe informacje na temat kondycji, użycia, pojemności i innych trendów oraz generować prognozy i wykrywać anomalie w dziennikach Azure Monitor.

Aby uzyskać większą elastyczność i zwiększyć możliwość analizowania i wykonywania działań na danych, możesz również zaimplementować własny potok uczenia maszynowego na danych w dziennikach usługi Azure Monitor.

W tej tabeli porównaliśmy zalety i ograniczenia korzystania z wbudowanych funkcji uczenia maszynowego języka KQL oraz tworzenia własnego potoku uczenia maszynowego oraz linki do samouczków, które pokazują, jak można zaimplementować poszczególne elementy:

	Wbudowane możliwości uczenia maszynowego KQL	Stwórz własny potok uczenia maszynowego
scenariusz	✅ Wykrywanie anomalii, główna przyczyna i analiza szeregów czasowych	✅ Wykrywanie anomalii, główna przyczyna i analiza szeregów czasowych ✅ Zaawansowana analiza i scenariusze AIOps
Zalety	🔹Pozwala szybko zacząć. 🔹Nie jest wymagana wiedza na temat nauki o danych i umiejętności programistycznych. 🔹 Optymalna wydajność i oszczędność kosztów.	🔹Obsługuje większe skalowanie. 🔹Umożliwia zaawansowane, bardziej złożone scenariusze. 🔹Elastyczność wybierania bibliotek, modeli, parametrów.
Limity usług i woluminy danych	Portal Azure lub limity kwerend logów interfejsu API w zależności od tego, czy pracujesz w portalu, czy używasz interfejsu API, na przykład z poziomu notesu.	🔹 Zapytania dotyczące limitów zapytań w dziennikach interfejsu API, jeśli wykonujesz zapytania dotyczące danych w dziennikach w usłudze Azure Monitor w ramach potoku uczenia maszynowego. W przeciwnym razie żadne limity usługi platformy Azure. 🔹Może obsługiwać większe woluminy danych.
Integracja	Żaden z nich nie jest wymagany. Uruchamianie przy użyciu usługi Log Analytics w witrynie Azure Portal lub zintegrowanego notesu Jupyter Notebook.	Wymaga integracji z narzędziem, takim jak Jupyter Notebook. Zazwyczaj integrujesz się również z innymi usługami platformy Azure, takimi jak Azure Synapse Analytics.
Wydajność	Optymalna wydajność przy użyciu platformy Azure Data Explorer działająca na dużą skalę w sposób rozproszony.	Wprowadza niewielkie opóźnienie podczas wykonywania zapytań lub eksportowania danych w zależności od sposobu implementowania potoku uczenia maszynowego.
Typ modelu	Model regresji liniowej i inne modele obsługiwane przez funkcje szeregów czasowych KQL z zestawem konfigurowalnych parametrów.	Całkowicie dostosowywany model uczenia maszynowego lub metoda wykrywania anomalii.
Koszt	Bez dodatkowych kosztów.	W zależności od sposobu wdrażania potoku uczenia maszynowego mogą być naliczane opłaty za eksportowanie danych, wczytywanie ocenionych danych do dzienników Azure Monitor oraz korzystanie z innych usług platformy Azure.
Samouczek	Wykrywanie i analizowanie anomalii przy użyciu funkcji uczenia maszynowego KQL w usłudze Azure Monitor	Analizowanie danych w dziennikach usługi Azure Monitor przy użyciu notesu

Stwórz własny potok uczenia maszynowego na danych w dziennikach Azure Monitor

Utwórz własny potok uczenia maszynowego na danych w dziennikach usługi Azure Monitor, aby wprowadzić nowe możliwości usługi AIOps i obsługiwać zaawansowane scenariusze, takie jak:

Wyszukiwanie ataków na bezpieczeństwo za pomocą bardziej zaawansowanych modeli niż te tworzone przez KQL.
Wykrywanie problemów z wydajnością i diagnozowanie błędów w aplikacji internetowej.
Tworzenie przepływów wieloetapowych, uruchamianie kodu w każdym kroku na podstawie wyników poprzedniego kroku.
Automatyzacja analizy danych dziennika usługi Azure Monitor i uzyskiwanie szczegółowych informacji na temat wielu obszarów, w tym kondycji infrastruktury i zachowania klientów.
Korelowanie danych w dziennikach usługi Azure Monitor z danymi z innych źródeł.

Istnieją dwa podejścia do udostępniania danych w dziennikach usługi Azure Monitor potokowi uczenia maszynowego:

Wykonywanie zapytań dotyczących danych w dziennikach usługi Azure Monitor - Integracja notesu z dziennikami usługi Azure Monitor lub uruchamianie skryptu albo aplikacji na danych dziennika przy użyciu bibliotek, takich jak Azure Monitor Query client library lub MSTICPY, w celu pobrania danych z dzienników usługi Azure Monitor w postaci tabelarycznej, na przykład do ramki danych Pandas. Zapytania do danych zostają pobrane do obiektu pamięci na Twoim serwerze, bez eksportowania danych ze środowiska roboczego usługi Log Analytics.

Uwaga / Notatka

Może być konieczne przekonwertowanie formatów danych w ramach procesu. Aby na przykład użyć bibliotek opartych na platformie Apache Spark, takiej jak SynapseML, może być konieczne przekonwertowanie biblioteki Pandas na ramkę danych PySpark.
Wyeksportuj dane z dzienników usługi Azure Monitor - z obszaru roboczego Log Analytics, zazwyczaj do konta magazynu obiektów blob, i zaimplementuj pipeline uczenia maszynowego, korzystając z biblioteki uczenia maszynowego.

Ta tabela porównuje zalety i ograniczenia podejść do pobierania danych dla przepływu uczenia maszynowego.

	Wykonywanie zapytań dotyczących danych w dziennikach usługi Azure Monitor	Eksportowanie danych
Zalety	🔹Umożliwia szybkie rozpoczęcie pracy. 🔹Wymaga tylko podstawowych umiejętności nauki o danych i programowania. 🔹Minimalne opóźnienia i oszczędności kosztów.	🔹Obsługuje większe skalowanie. 🔹Brak ograniczeń zapytań.
Wyeksportowane dane?	Nie.	Tak
Limity usługi	Limity zapytań dotyczących dzienników API i ograniczanie zapytań użytkowników. Limity interfejsu API zapytań można przezwyciężyć w pewnym stopniu, dzieląc większe zapytania na fragmenty.	Brak informacji z Azure Monitor.
Woluminy danych	Przeanalizuj kilka gb danych lub kilka milionów rekordów na godzinę.	Obsługuje duże ilości danych.
Biblioteka uczenia maszynowego	W przypadku małych i średnich zestawów danych zwykle używa się bibliotek uczenia maszynowego z jednym węzłem, takich jak Scikit Learn.	W przypadku dużych zestawów danych zwykle używa się bibliotek uczenia maszynowego danych big data, takich jak SynapseML.
Opóźnienie	Minimalny.	Wprowadza niewielkie opóźnienie podczas eksportowania danych.
Koszt	Brak dodatkowych opłat w usłudze Azure Monitor. Koszt usługi Azure Synapse Analytics, Azure Machine Learning lub innej usługi, jeśli jest używana.	Koszt eksportu danych i magazynu zewnętrznego. Koszt usługi Azure Synapse Analytics, Azure Machine Learning lub innej usługi, jeśli jest używana.

Wskazówka

Aby skorzystać z najlepszych elementów obu podejść do implementacji, utwórz potok hybrydowy. Typowym podejściem hybrydowym jest eksportowanie danych na potrzeby trenowania modelu, które obejmuje duże ilości danych oraz używanie danych zapytań w dziennikach usługi Azure Monitor w celu eksplorowania danych i oceniania nowych danych w celu zmniejszenia opóźnień i kosztów.

Implementowanie kroków cyklu życia uczenia maszynowego w dziennikach usługi Azure Monitor

Skonfigurowanie potoku uczenia maszynowego zwykle obejmuje wszystkie lub niektóre kroki opisane poniżej.

Dostępne są różne biblioteki uczenia maszynowego Azure i open-source, których można użyć do tworzenia potoku uczenia maszynowego, w tym Scikit Learn, PyTorch, Tensorflow, Spark MLlib i SynapseML.

W tej tabeli opisano każdy krok i przedstawiono ogólne wskazówki oraz kilka przykładów implementacji tych kroków na podstawie metod implementacji opisanych w temacie Tworzenie własnego potoku uczenia maszynowego na danych w dziennikach usługi Azure Monitor:

Krok	Opis	Wykonywanie zapytań dotyczących danych w dziennikach usługi Azure Monitor	Eksportowanie danych
Eksplorowanie danych	Zapoznaj się z zebranymi danymi i poznaj je.	Najprostszym sposobem eksplorowania danych jest użycie usługi Log Analytics, która udostępnia bogaty zestaw narzędzi do eksplorowania i wizualizowania danych w witrynie Azure Portal. Możesz również analizować dane w dziennikach usługi Azure Monitor przy użyciu notesu.	Aby analizować dzienniki poza usługą Azure Monitor, wyeksportuj dane z obszaru roboczego usługi Log Analytics i skonfiguruj środowisko w wybranej usłudze. Aby zapoznać się z przykładem eksplorowania dzienników poza usługą Azure Monitor, zobacz Analizowanie danych wyeksportowanych z usługi Log Analytics przy użyciu usługi Synapse.
Tworzenie i trenowanie modelu uczenia maszynowego	Trenowanie modelu jest procesem iteracyjnym. Naukowcy lub analitycy danych opracowują model, pobierając i czyszcząc dane szkoleniowe, funkcje inżynierów, próbując różne modele i dostrajając parametry, i powtarzając ten cykl, aż model będzie dokładny i niezawodny.	W przypadku małych i średnich zestawów danych zwykle używasz bibliotek uczenia maszynowego z jednym węzłem, takich jak Scikit Learn. Aby zapoznać się z przykładem trenowania modelu uczenia maszynowego na danych w dziennikach usługi Azure Monitor przy użyciu biblioteki Scikit Learn, zobacz ten przykładowy notes: Wykrywanie anomalii w dziennikach usługi Azure Monitor przy użyciu technik uczenia maszynowego.	W przypadku dużych zestawów danych zwykle używasz bibliotek uczenia maszynowego danych big data, takich jak SynapseML.
Wdrażanie i ocenianie modelu	Ocenianie to proces stosowania modelu uczenia maszynowego na nowych danych w celu uzyskania przewidywań. Ocenianie zwykle należy wykonać na dużą skalę z minimalnym opóźnieniem.	Aby wykonywać zapytania dotyczące nowych danych w dziennikach usługi Azure Monitor, użyj biblioteki klienta zapytań usługi Azure Monitor. Aby zapoznać się z przykładem oceniania danych przy użyciu narzędzi typu open source, zobacz ten przykładowy notes: Wykrywanie anomalii w dziennikach usługi Azure Monitor przy użyciu technik uczenia maszynowego.
Uruchamianie potoku zgodnie z harmonogramem	Zautomatyzuj proces, aby regularnie ponownie trenować model na bieżących danych.	Zaplanuj potok uczenia maszynowego za pomocą usługi Azure Synapse Analytics lub usługi Azure Machine Learning.	Zobacz przykłady w kolumnie Zapytania dotyczące danych w dziennikach usługi Azure Monitor.

Pozyskiwanie wyników z ocen w obszarze roboczym usługi Log Analytics umożliwia korzystanie z danych w celu uzyskania zaawansowanych wglądów oraz tworzenia alertów i paneli kontrolnych. Aby zapoznać się z przykładem sposobu pozyskiwania wyników ocenianych przy użyciu biblioteki klienta pozyskiwania usługi Azure Monitor, zobacz Pozyskiwanie anomalii w tabeli niestandardowej w obszarze roboczym usługi Log Analytics.

Dalsze kroki

Dowiedz się więcej o:

Dzienniki usługi Azure Monitor.
Usługa Azure Monitor Insights i wyselekcjonowane wizualizacje.