Możliwość obserwowania w monitorowaniu w chmurze

Ten artykuł jest częścią serii w przewodniku monitorowania chmury.

Poniższe sekcje mają na celu zwiększenie dojrzałości operacyjnej przez obserwowanie i ciągłe iterowanie w celu ulepszenia sposobu monitorowania usług. Dowiedz się, jak organizacje wdrażają spójną strategię monitorowania szybciej, ustanawiając możliwość obserwowania dla każdego rozwiązania do monitorowania.

Definiowanie możliwości obserwowania

Chociaż obserwowanie i monitorowanie uzupełniają się nawzajem, istnieje zauważalne rozróżnienie:

  • Monitorowanie: zbiera informacje i informuje o wykryciu problemu na podstawie konfiguracji pod kątem monitorowania tych warunków. Monitorujesz znane lub przewidywalne błędy.
  • Możliwość obserwowania: możliwość zrozumienia, co dzieje się w systemie, patrząc na dane wyjściowe. Rozwiązanie do obserwacji pomaga analizować te dane w celu oceny kondycji systemu i znajdowania sposobów rozwiązywania problemów w infrastrukturze IT.

Możliwość obserwacji najpierw napędza konsumenta monitorowania, aby zrozumieć, co jest uważane za normalne działanie usługi. Innymi słowy, szukasz jak najszybszej całkowitej widoczności .

Po osiągnięciu początkowej możliwości obserwacji będziesz korzystać z tego początkowego poziomu widoczności, aby opracowywać alerty z możliwością działania, tworzyć przydatne pulpity nawigacyjne i oceniać rozwiązania AIOps. Te szczegółowe informacje umożliwiają wygodne uzyskiwanie informacji o podstawowych danych dotyczących metryk i monitorowania dzienników.

Uwaga

Jest to przeciwieństwo podejścia stosowanego w przeszłości, gdy zespoły pracowały nad zdefiniowanie wszystkich wymagań dotyczących monitorowania na papierze przed utworzeniem, testowaniem i wdrożeniem.

Niezależnie od tego, czy plan monitorowania jest przeznaczony dla aplikacji, infrastruktury w chmurze, czy platformy Azure, pierwszym krokiem jest ustalenie możliwości obserwowania.

Takie podejście upraszcza również plany. We wszystkich przypadkach łączna widoczność oznacza osiągnięcie i utrzymanie wystarczającej widoczności w trzech wymiarach lub aspektach:

  1. Monitorowanie szczegółowe: zbieranie znaczących i odpowiednich sygnałów.
  2. Monitoruj kompleksowe lub szerokie zakresy: od najniższej warstwy stosu do aplikacji.
  3. Monitorowanie w modelu kondycji: skup się na aspektach kondycji, takich jak dostępność, wydajność, zabezpieczenia i ciągłość.

Three-sided cube example

Obserwacja to nie tylko skupienie się na zespołach IT. Podstawowym celem jest zapewnienie użytkownikom końcowym możliwości korzystania z systemów i spełnienia celów poziomu usług (SLO).

Rozwiązania do monitorowania i możliwości obserwacji

Monitorowanie infrastruktury i aplikacji może być skomplikowane. Transformacja biznesowa stosuje technologię do osiągnięcia i ułatwienia kształtowania swoich strategii. Chmura dodatkowo wpłynęła na skomplikowany charakter monitorowania.

Przedstawiono to w następujący sposób:

  • Zmiana transformacji cyfrowej: wysiłki firmy związane z transformacją cyfrową zmieniają się w kierunku hipereksploatowania technologii w chmurze.
  • Wbudowane monitorowanie: monitorowanie staje się osadzone w zasobach i grupach zasobów platformy Azure w porównaniu z oddzielnymi narzędziami zarządzanymi lokalnie.
  • Ekspansywne monitorowanie architektur natywnych dla chmury, takich jak usługa Azure Monitor, są podobne do narzędzi do zarządzania zdarzeniami zabezpieczeń i zdarzeniami (SIEM). Usługa Azure Monitor jest ekspansywna, sterowana dziennikami i kolejność wielkości bardziej elastyczna niż tradycyjne narzędzia lokalne.

Architekci muszą, podobnie jak operatorzy, zrozumieć, jakie informacje diagnostyczne emituje składnik infrastruktury lub aplikacja.

Łączenie wielowariantowych, dynamicznych, szeregów czasowych, zdarzeń, stanowych i telemetrycznych strumieni dzienników w cennej inteligencji zależy od następujących elementów:

  • Wiedza zespołowa: wiedza i doświadczenie dewelopera lub inżyniera systemu, który głęboko rozumie cel monitorowania.
  • Środowisko rozwiązywania problemów: środowisko pomocy technicznej i rozwiązywania problemów podczas korzystania z danych w celu znalezienia lub zlokalizowania przyczyn problemów.
  • Edukacja z historii: Przejrzyj wcześniejsze incydenty, aby znaleźć przyczyny nietechne, które mogą zostać skorygowane automatycznie później.
  • Dokumentacja: wskazówki dotyczące dokumentacji, oprogramowania, szkolenia lub konsultacji ze strony dostawcy oprogramowania lub sprzętu.

Firma Microsoft i jej partnerzy udostępniają pakiety administracyjne dla programu System Center Operations Manager. Pakiety administracyjne są specyficzne dla technologii; na przykład w przypadku importowania pakietu administracyjnego SQL program Operations Manager automatycznie odnajduje serwery hostujące program SQL Server i rozpoczyna ich monitorowanie. Tutaj możliwość obserwacji jest mniej lub bardziej wstępnie zdefiniowana. Program Operations Manager jest przeznaczony głównie do infrastruktury lokalnej, która zwykle jest stała w składnikach i wzorcach projektowych architektury względem usług w chmurze.

W chmurze masz ogromną elastyczność w zakresie typów usług do wyboru. Monitorowanie obejmuje sposób, w jaki usługi zmieniają się w czasie i mogą być dynamiczne, globalne i odporne. Dzięki usłudze Azure Monitor możesz korzystać z istniejących skoroszytów zawartych w usłudze Azure Monitor Szczegółowe informacje zapewniając funkcjonalność podobną do pakietu administracyjnego w programie Operations Manager.

Sztuka obserwowania

Możliwość obserwacji zależy od tego, co i jak coś jest monitorowane.

Na platformie Azure istnieje wiele źródeł danych monitorowania, z których każda zapewnia inną perspektywę zachowania. Platforma Azure zawiera wiele narzędzi, które ułatwiają analizowanie różnych aspektów tych danych.

Obserwowanie platformy

Na platformie Azure firma Microsoft zapewnia perspektywę dostawcy usług za pośrednictwem różnych dzienników platformy.

Usługi na platformie Azure mogą zmieniać się na różne, nieprzewidywalne sposoby w czasie. To zachowanie jest nazywane dynamicznym zachowaniem. Menedżerowie usług w chmurze obserwujących usługę w czasie muszą również wziąć pod uwagę następujące kwestie:

  • Relokacja zasobów: zasoby mogą migrować lub przenosić się między lokalizacjami lub lokalizacjami geograficznymi.
  • Zmiany zasobów: zasoby są dodawane, usuwane lub modyfikowane.
  • Użycie: użycie różni się w zależności od usług i implementacji. Należy pamiętać o monitorze kosztów, zużycia i przewidywanych wydatków.

Oto kilka przykładów narzędzi, które umożliwiają obserwowanie platformy:

Źródło dziennika opis
Kondycja usługi Zdarzenia usługi i planowana konserwacja zgłoszona przez firmę Microsoft.
Azure Resource Health Raporty dotyczące bieżącej i wcześniejszej kondycji zasobów.
Dzienniki aktywności w usłudze Azure Monitor Raportuje zdarzenia na poziomie subskrypcji we wszystkich zasobach wdrożonych w subskrypcji.
Analiza zmian w usłudze Azure Monitor Raportuje zmiany w aplikacjach platformy Azure i skraca średni czas naprawy (MTTR).
Dzienniki zasobów platformy Azure Wcześniej znane jako dzienniki diagnostyczne, raporty dzienników zasobów dotyczące operacji wykonywanych w ramach zasobu platformy Azure na płaszczyźnie danych.
Dzienniki raportów firmy Microsoft (AzureAD) Raporty dotyczące historii aktywności logowania i dziennika inspekcji zmian w identyfikatorze Entra firmy Microsoft dla danej dzierżawy.
Azure Advisor Użyj usługi Azure Advisor, aby otrzymywać zalecane rozwiązania oparte na najlepszych rozwiązaniach w celu zoptymalizowania wdrożeń platformy Azure.
Dzienniki przezroczystości chmury firmy Microsoft dla suwerenności Raporty dotyczące uzyskiwania dostępu do zasobów i uzyskiwania dostępu do zasobu przez inżyniera firmy Microsoft. Dzienniki przezroczystości zawierają szczegółowe informacje o dostępie do zasobów klientów. Dzienniki powiadamiają również o braku dostępu, co jest typowe.

Możliwość obserwacji ewoluuje stopniowo, począwszy od planu monitorowania o minimalnych możliwościach, a prace nad integracją narzędzi i procesów są w toku. Gdy zapoznasz się z danymi (metrykami, dziennikami i transakcjami), możesz zrozumieć zachowanie i oznaki objawów lub problemów z tych zasobów lub aplikacji. Zapoznając się z danymi, tworzysz zaufanie do pracy z usługą Azure Monitor i danymi.

Uzyskiwanie pewności co do obserwacji

Dzięki właściwej obserwacji zyskujesz pewność siebie i jesteś w stanie zrealizować przyczynę i znaleźć odpowiedzi, które mogą pomóc. Tym więcej dowiesz się więcej o danych, tym bardziej ewoluowały procesy, a zespoły uzyskują szczegółowe informacje.

Aby ustawić scenę, oto kilka sposobów, aby uzyskać pewność z obserwacji:

  • Zwiększanie przewidywalności: Ulepszone monitorowanie zasobów i usług pomaga aktywnie identyfikować problemy, dzięki czemu są one przewidywalne i możliwe do zarządzania w przyszłości.

  • Wczesne wykrywanie anomalii: możliwość obserwacji umożliwia szybkie wykrywanie nieprawidłowości lub odchyleń od oczekiwanego zachowania, co zmniejsza wpływ potencjalnych problemów.

  • Identyfikacja głównej przyczyny: Szczegółowe dane dotyczące obserwacji pomagają zidentyfikować główne przyczyny problemów, umożliwiając szybsze rozwiązywanie problemów i zapobieganie cyklowi.

  • Zwiększanie wydajności rozwiązywania problemów: dzięki obserwacji zespoły mogą szybko diagnozować i rozwiązywać złożone problemy, analizując odpowiednie dane i korelując zdarzenia.

  • Zwiększanie niezawodności systemu: identyfikując wąskie gardła, problemy z wydajnością i potencjalne punkty awarii, można zauważyć, że można zoptymalizować wydajność systemu i zwiększyć ogólną niezawodność.

  • Zwiększanie jakości obsługi klienta: możliwość obserwacji pozwala lepiej zrozumieć, w jaki sposób wydajność systemu wpływa na użytkowników końcowych, umożliwiając proaktywne środki zwiększające zadowolenie klientów.

  • Ułatwianie współpracy: platformy obserwacji zapewniają wspólną widoczność i dostęp do danych, promowanie współpracy między różnymi zespołami, takimi jak deweloperzy, operacje i pomoc techniczna.

  • Zgodność z przepisami: Możliwości obserwowania pomagają spełnić wymagania prawne, zapewniając możliwość śledzenia, dzienniki inspekcji i zapewnienie zgodności ze standardami zabezpieczeń i prywatności.

  • Krótszy czas rozwiązywania problemów: zapewniając zaawansowane dane i szczegółowe informacje, możliwość obserwacji skraca czas diagnozowania i rozwiązywania problemów, minimalizując przestoje i przerwy w działaniu usługi.

  • Proaktywne zarządzanie pojemnością: dane dotyczące obserwacji ułatwiają przewidywanie zapotrzebowania na zasoby, identyfikowanie luk w pojemności i proaktywne dostosowywanie zasobów w celu zachowania optymalnej wydajności.

  • Środki zaradcze związane z ryzykiem: dzięki obserwacji można wcześnie zidentyfikować potencjalne zagrożenia, umożliwiając proaktywne środki zaradcze i zmniejszając prawdopodobieństwo poważnych skutków.

  • Ciągłe monitorowanie i uczenie: możliwość obserwacji umożliwia ciągłe monitorowanie i uczenie się, pomagając zespołom dostosować się do zmieniających się środowisk, wymagań i zachowań użytkowników.

  • Optymalizacja wydajności: analizując dane dotyczące obserwacji, zespoły mogą identyfikować i optymalizować wąskie gardła wydajności, zwiększając wydajność systemu.

  • Priorytetyzacja wysiłków: Wgląd w szczegółowe informacje umożliwiające zespołom określanie priorytetów zadań i przydzielanie zasobów na podstawie krytycznej i wpływu zidentyfikowanych problemów.

  • Zaufanie do zarządzania zmianami: Możliwość obserwacji zapewnia wgląd w wpływ zmian, zapewniając, że nowe wdrożenia lub aktualizacje nie wprowadzają nieprzewidzianych problemów.

  • Ulepszona reakcja na zdarzenia: Dzięki możliwości obserwacji zespoły reagowania na zdarzenia mogą szybko zbierać odpowiednie informacje, rozumieć kontekst i inicjować odpowiednie działania.

Plan monitorowania

Utworzysz plan monitorowania, aby opisać cele i cele, wymagania i inne istotne szczegóły. Następnie skontaktuj się z prośbą o porozumienie między wszystkimi odpowiednimi uczestnikami projektu w organizacji.

Plan monitorowania powinien wyjaśniać, jak opracowywać i obsługiwać co najmniej jedno rozwiązanie do monitorowania. Rozpocznij tworzenie planów monitorowania na wczesnym etapie strategii i planowania projektu.

Podczas tworzenia planu należy pamiętać o pięciu dyscyplinach nowoczesnego monitorowania, zgodnie z opisem w dokumentacji strategii monitorowania chmury: monitorowanie, mierzenie, reagowanie, uczenie się i ulepszanie.

Poniżej przedstawiono początkowy zalecany konspekt dotyczący planu monitorowania i są uważane za podstawowe zagadnienia dotyczące indywidualnego planu usług lub w przypadku standaryzacji funkcji usług w chmurze, takich jak typy zasobów platformy Azure lub usługi Platformy Microsoft 365.

Istotą planu jest zdefiniowanie linii widoczności między dostawcami usług (którzy będą polami rozwiązań) i konsumentami (którzy będą działać lub uzyskiwać wartość).

Perspektywa biznesowa

Kompleksowy plan monitorowania musi uwzględniać potrzeby biznesowe i monitorowanie, w tym fokus skoncentrowany na użytkowniku. Podczas definiowania planu niezbędne jest udokumentowanie i udostępnienie wymagań biznesowych, a poniżej przedstawiono zakres tego planu.

  • Osoby biorące udział w projekcie i odbiorcy
  • Strumienie i procesy dotyczące wartości biznesowej
  • Perspektywa i narzędzie użytkownika końcowego
  • Wymagania dotyczące pomiarów i raportowania
  • Zidentyfikowano zagrożenia i struktury kontroli zgodności
  • Wymagania dotyczące dostępu i kontroli
  • Ryzyko dla firmy

Perspektywa usługi

Kompleksowy plan monitorowania musi uwzględniać potrzeby właścicieli usług z monitorowaniem i monitorowaniem. Podczas definiowania planu niezbędne jest udokumentowanie i udostępnienie ich wymagań, a następnie sugeruje zakres tej części planu.

  • Osoby biorące udział w projekcie i odbiorcy
  • Role i odpowiedzialność
  • Definicja usługi
  • Wymagania dotyczące dostępu i kontroli
  • Zagadnienia dotyczące architektury?
  • Kontrakty oparte na dostawcach i partnerach
  • Umowy dotyczące usług (UMOWY SLA, OLA)
  • Identyfikowanie pokrycia gwarancji na usługę
  • Wymagania dotyczące pomiarów i raportowania
  • Ryzyka

Perspektywa technologii

Ta sekcja planu reprezentuje rozwiązanie do monitorowania przy użyciu informacji z perspektywy firmy i usługi. Poniżej przedstawiono zakres tej części planu.

  • Scenariusze i scenariusze użytkownika
  • Cele techniczne (na przykład sieć)
  • Mapowanie zależności składników
  • Typy (na przykład natywne dla chmury, hybrydowe, lokalne)
  • Obserwacyjne
  • Dynamiczne
  • Miara
  • Dostrajanie i optymalizacja

Kwestie wymagające rozważenia

Podsumuj plan, aby zapewnić komunikację i informowanie wszystkich odpowiednich konsumentów, uczestników projektu i poziomów zarządzania. W przypadku pomyślnego planu monitorowania należy wziąć pod uwagę następujące kwestie:

Najważniejsze zagadnienia

  • Etapy produkcji: rozwiązanie do monitorowania powinno być gotowe po uruchomieniu usługi. Planowanie może obejmować konfigurację testowania lub przedprodukcyjnego w innej subskrypcji przeznaczonej do eksperymentowania i testowania założeń.

  • Strategia: plany mogą również mapować z powrotem na monitorowanie i strategię IT w celu śledzenia celów monitorowania dla misji lub działalności biznesowej.

  • Cele: w planie opisz i przeanalizuj rozważane zasoby lub usługi docelowe. W razie potrzeby zamapuj wszystkie składniki, aby monitorować, w tym zależności usługi. Zidentyfikuj luki w zakresie pokrycia i określ, kto jest właścicielem każdej części usługi.

  • Rozwiązanie: W przypadku rozwiązania do monitorowania zidentyfikuj konsumentów, zainteresowanych stron, dostawców, partnerów, dostęp i instrumentację. Ponadto aspekty monitorowania, zakres, odpowiedź, raporty i pulpity nawigacyjne (dostępność, zabezpieczenia, środowisko użytkownika i inne).

Zagadnienia ogólne

Oprócz kluczowych zagadnień staraj się lepiej zrozumieć, w jaki sposób te punkty mogą wpływać na plan monitorowania organizacji.

  • Minimalny produkt opłacalny (MVP): Pozwól planowi zdefiniować, jak wygląda powodzenie dla minimalnego opłacalnego produktu. Innymi słowy, co jest początkowo potrzebne do życia i czy możemy zmierzyć sukces w tej sprawie? Po przejściu na żywo możesz nadal rozwijać rozwiązanie do monitorowania, aby zmaksymalizować wartość.

  • Zabezpieczanie danych monitorowania: Bezpieczeństwo jest kluczowym aspektem dla każdej organizacji i zespołu. Upewnij się, że jesteś wykształcony i znasz bariery ochronne, lub pozwól ekspertom kierować Cię, aby nie dodawać ryzyka do rozwiązań do monitorowania, na przykład przez uwidacznianie poufnych danych monitorowania w dziennikach.

  • Rozważ rozwiązanie Microsoft 365: Każdy dobry plan traktuje dzierżawę platformy Azure z platformą Microsoft 365 jako znaczący składnik. Platforma Microsoft 365 zależy od identyfikatora Entra firmy Microsoft, a usługa Azure Monitor zapewnia integrację platformy Microsoft 365 z zarządzaniem punktami końcowymi.

  • Wygrane z obserwacją: skup się na całkowitej widoczności przed skoncentrowaniem się na alertach, ponieważ alerty są kosztami i mogą szybko prowadzić do zmęczenia alertów.

  • Monitorowanie aktywności: inspekcja, logowanie i dzienniki aktywności są teraz łatwe dla właścicieli usług i zabezpieczeń w celu fragmentowania i kości. Upewnij się, że plan monitorowania uwzględnia monitorowanie aktywności, w tym szczegółowe informacje i pulpity nawigacyjne, które należy utworzyć dla wszystkich odpowiednich uczestników projektu.

Następne kroki