Monitorowanie pojedynczego klastra usługi Azure Stack HCI w wersji 23H2 za pomocą szczegółowych informacji

Artykuł
07/31/2024

Dotyczy: Azure Stack HCI, wersja 23H2

W tym artykule opisano sposób monitorowania pojedynczego klastra rozwiązania Azure Stack HCI za pomocą szczegółowych informacji. W przypadku wielu klastrów rozwiązania Azure Stack HCI zobacz Monitorowanie wielu klastrów rozwiązania Azure Stack HCI za pomocą szczegółowych informacji.

Szczegółowe informacje to funkcja usługi Azure Monitor, która umożliwia szybkie rozpoczęcie monitorowania klastra usługi Azure Stack HCI. Możesz wyświetlić kluczowe metryki, kondycję i informacje o użyciu dotyczące klastra, serwerów, maszyn wirtualnych i magazynu.

Pośmiń kilka chwil, aby obejrzeć przewodnik wideo w usłudze Insights for Azure Stack HCI:

Świadczenia

Szczegółowe informacje dotyczące rozwiązania Azure Stack HCI oferują następujące korzyści:

Zarządzane przez platformę Azure. Szczegółowe informacje są zarządzane przez platformę Azure i dostępne za pośrednictwem witryny Azure Portal, dzięki czemu są zawsze aktualne. Nie ma potrzeby konfigurowania bazy danych ani specjalnego oprogramowania.
Skalowalność. Szczegółowe informacje mogą ładować ponad 400 zestawów informacji klastra w wielu subskrypcjach jednocześnie. Nie ma żadnych ograniczeń dotyczących klastra, domeny lub lokalizacji fizycznej.
Możliwość dostosowywania. Środowisko usługi Insight jest oparte na szablonach skoroszytów usługi Azure Monitor. Dzięki temu można zmieniać widoki i zapytania, modyfikować lub ustawiać progi zgodne z określonymi limitami, a następnie zapisywać te dostosowania w skoroszycie. Następnie możesz przypiąć wykresy w skoroszytach do pulpitów nawigacyjnych platformy Azure.

Wymagania wstępne

Poniżej przedstawiono wymagania wstępne dotyczące używania szczegółowych informacji dla rozwiązania Azure Stack HCI:

Musisz mieć dostęp do klastra rozwiązania Azure Stack HCI wdrożonego i zarejestrowanego.
Tożsamość zarządzana zasobu platformy Azure musi być włączona. Aby uzyskać więcej informacji, zobacz Włączanie rozszerzonego zarządzania.

Włączanie szczegółowych informacji

Włączenie szczegółowych informacji ułatwia monitorowanie wszystkich klastrów rozwiązania Azure Stack HCI aktualnie skojarzonych z obszarem roboczym usługi Log Analytics, zapewniając przydatne metryki kondycji. Usługa Insights instaluje agenta usługi Azure Monitor i pomaga skonfigurować reguły zbierania danych (DCR) na potrzeby monitorowania klastra usługi Azure Stack HCI.

Aby włączyć szczegółowe informacje na dużą skalę, zobacz Włączanie szczegółowych informacji dla rozwiązania Azure Stack HCI na dużą skalę przy użyciu zasad platformy Azure.

Wykonaj następujące kroki, aby włączyć szczegółowe informacje w witrynie Azure Portal:

W witrynie Azure Portal przejdź do strony zasobu klastra azure Stack HCI, a następnie wybierz klaster. Na karcie Możliwości wybierz pozycję Szczegółowe informacje.
Na stronie Szczegółowe informacje wybierz pozycję Rozpocznij.
Na stronie Konfiguracja usługi Insights wybierz istniejący kontroler domeny z listy rozwijanej Reguła zbierania danych. Kontroler domeny określa dzienniki zdarzeń i liczniki wydajności, które muszą być zbierane i przechowywane w obszarze roboczym usługi Log Analytics. Szczegółowe informacje tworzą domyślny kontroler domeny, jeśli jeszcze nie istnieje. Uwzględniane są tylko kontrolery domeny, które są włączone dla szczegółowych informacji.
(Opcjonalnie) Możesz również utworzyć nowy kontroler domeny, wybierając pozycję Utwórz nowy na stronie konfiguracji szczegółowych informacji.

Ważne

Zdecydowanie zalecamy, aby nie tworzyć własnych kontrolerów domeny. Kontroler domeny utworzony przez usługę Insights zawiera specjalny strumień danych wymagany do jej działania. Możesz edytować ten kontroler domeny, aby zebrać więcej danych, takich jak zdarzenia systemu Windows i Syslog. Kontrolery domeny utworzone za pośrednictwem instalacji usługi AMA będą miały prefiks AzureStackHCI- dołączony do nazwy DCR.
1. Na stronie Reguła zbierania nowych danych określ nazwę subskrypcji, nazwy kontrolera domeny i punktu końcowego zbierania danych (DCE). Kontrolery domeny są używane do uzyskiwania dostępu do usługi konfiguracji w celu pobrania skojarzonych kontrolerów domeny dla agenta usługi Azure Monitor. Aby uzyskać więcej informacji na temat platformy DCE, zobacz Punkty końcowe zbierania danych w usłudze Azure Monitor.
  
  Uwaga
  
  Jeśli używasz linków prywatnych na agencie, musisz dodać kontrolery domeny. Aby uzyskać więcej informacji na temat ustawień sieciowych usługi AMA, zobacz Definiowanie ustawień sieciowych agenta usługi Azure Monitor.
2. Wybierz przycisk Przejrzyj i utwórz.
  
  Jeśli kontroler domeny nie został jeszcze utworzony dla niemonitorowanego klastra, zostanie utworzony z włączonymi licznikami wydajności i włączonym kanałem dziennika zdarzeń systemu Windows.
Przejrzyj ekran końcowy z podsumowaniem nazwy kontrolera domeny, liczby dzienników zdarzeń, liczników wydajności i nazwy obszaru roboczego usługi Log Analytics, w którym są przechowywane dane. Wybierz pozycję Set up (Konfiguracja).

Po wybraniu pozycji Skonfiguruj nastąpi przekierowanie do strony Rozszerzenia , na której można zobaczyć stan instalacji agenta. Konfigurując szczegółowe informacje, usługa AMA jest automatycznie instalowana na wszystkich węzłach klastra.
Przejdź do strony zasobu klastra rozwiązania Azure Stack HCI, a następnie wybierz klaster. Szczegółowe informacje są teraz wyświetlane jako Skonfigurowane na karcie Możliwości :

Reguły zbierania danych

Po włączeniu szczegółowych informacji na maszynie z agentem usługi Azure Monitor należy określić kontroler domeny do użycia. Aby uzyskać więcej informacji na temat kontrolerów domeny, zobacz Reguły zbierania danych w usłudze Azure Monitor.

Opcja	Opis
Liczniki wydajności	Określa, jakie liczniki wydajności danych mają być zbierane z systemu operacyjnego. Ta opcja jest wymagana dla wszystkich komputerów. Te liczniki wydajności są używane do wypełniania wizualizacji w skoroszycie szczegółowych informacji. Obecnie skoroszyt szczegółowych informacji używa pięciu liczników wydajności — `Memory()\Available Bytes`, , `Processor(_Total)\% Processor TimeNetwork Interface()\Bytes Total/sec`, `RDMA Activity()\RDMA Inbound Bytes/sec`i`RDMA Activity()\RDMA Outbound Bytes/sec`
Kanał dziennika zdarzeń	Określa, które dzienniki zdarzeń systemu Windows mają być zbierane z systemu operacyjnego. Ta opcja jest wymagana dla wszystkich komputerów. Dzienniki zdarzeń systemu Windows służą do wypełniania wizualizacji w skoroszycie szczegółowych informacji. Obecnie dane są zbierane za pośrednictwem dwóch kanałów dziennika zdarzeń systemu Windows: `- microsoft-windows-health/operational` i `microsoft-windows-sddc-management/operational`
Obszar roboczy usługi Log Analytics	Obszar roboczy do przechowywania danych. Wyświetlane są tylko obszary robocze ze szczegółowymi informacjami.

Kanał zdarzeń

Kanał Microsoft-windows-sddc-management/operational zdarzeń systemu Windows i Microsoft-windows-health/operational jest dodawany do obszaru roboczego usługi Log Analytics w obszarze Dzienniki zdarzeń systemu Windows.

Zbierając te dzienniki, szczegółowe informacje pokazują stan kondycji poszczególnych serwerów, dysków, woluminów i maszyn wirtualnych. Domyślnie są dodawane pięć liczników wydajności.

Liczniki wydajności

Domyślnie są dodawane pięć liczników wydajności:

W poniższej tabeli opisano monitorowane liczniki wydajności:

Liczniki wydajności	opis
Pamięć(*)\Dostępne bajty	Dostępne bajty to ilość pamięci fizycznej, w bajtach, natychmiast dostępna do alokacji do procesu lub do użycia systemu.
Karta sieciowa(*)\Bajty łącznie/s	Szybkość wysyłania i odbierania bajtów przez każdą kartę sieciową, w tym znaki framowania. Całkowita liczba bajtów na sekundę to suma bajtów odebranych/s i bajtów wysłanych na sekundę.
\Procesor (_Suma)% czasu procesora	Procent upływu czasu, przez który wszystkie wątki procesów używały procesora do wykonywania instrukcji.
Działanie RDMA(*)\RDMA Bajty przychodzące/s	Szybkość odbierania danych przez funkcję RDMA przez kartę sieciową na sekundę.
Działanie RDMA(*)\RDMA Bajty ruchu wychodzącego/s	Szybkość danych wysyłanych przez funkcję RDMA przez kartę sieciową na sekundę.

Po włączeniu usługi Insights zbieranie danych może potrwać do 15 minut. Po zakończeniu procesu możesz wyświetlić bogatą wizualizację kondycji klastra z menu Szczegółowe informacje w okienku po lewej stronie:

Wyłączanie szczegółowych informacji

Aby wyłączyć usługę Insights, wykonaj następujące kroki:

Wybierz pozycję Szczegółowe informacje na karcie Możliwości .
Wybierz pozycję Wyłącz szczegółowe informacje.

Po wyłączeniu funkcji Insights skojarzenie między regułą zbierania danych a klastrem zostanie usunięte, a dzienniki zarządzania Usługa kondycji i SDDC nie są już zbierane, ale istniejące dane nie są usuwane. Jeśli chcesz usunąć te dane, przejdź do obszaru roboczego DCR i Log Analytics i usuń je ręcznie.

Aktualizowanie szczegółowych informacji

Kafelek Szczegółowe informacje zawiera komunikat Wymaga aktualizacji w następujących przypadkach:

Reguła zbierania danych jest zmieniana.
Zdarzenie kondycji z dziennika zdarzeń systemu Windows jest usuwane.
Wszystkie z pięciu liczników wydajności z obszaru roboczego usługi Log Analytics są usuwane.

Aby ponownie włączyć szczegółowe informacje, wykonaj następujące kroki:

Wybierz kafelek Szczegółowe informacje w obszarze Możliwości.
Wybierz pozycję Aktualizuj , aby ponownie wyświetlić wizualizacje.

Rozwiązywanie problemów

Ta sekcja zawiera wskazówki dotyczące rozwiązywania problemów z używaniem szczegółowych informacji dla rozwiązania Azure Stack HCI.

Rozwiązywanie problemów z pustą stroną Skoroszyty bez wypełnionych danych

Problem. Zostanie wyświetlona pusta strona Skoroszyty bez wypełnionych danych, jak pokazano na poniższym zrzucie ekranu:

Możliwe przyczyny. Może wystąpić kilka przyczyn tego problemu, takich jak ostatnia konfiguracja usługi Insights lub niewłaściwa konfiguracja skojarzonego kontrolera domeny.

Rozwiązanie. Aby rozwiązać ten problem, wykonaj następujące kroki w sekwencji:

Jeśli ostatnio skonfigurowano szczegółowe informacje, poczekaj do jednej godziny, aż usługa AMA będzie zbierać dane.
Sprawdź konfigurację skojarzonego kontrolera domeny. Upewnij się, że kanały zdarzeń i liczniki wydajności są dodawane jako źródła danych do skojarzonego kontrolera domeny, zgodnie z opisem w sekcji Reguły zbierania danych.
Jeśli problem będzie się powtarzać po wykonaniu powyższych kroków i nadal nie widzisz żadnych danych, skontaktuj się z pomocą techniczną w celu uzyskania pomocy.

Aby uzyskać bardziej szczegółowe wskazówki dotyczące rozwiązywania problemów, zobacz Wskazówki dotyczące rozwiązywania problemów z agentem usługi Azure Monitor.

Wizualizacje szczegółowych informacji

Po włączeniu usługi Insights poniższe tabele zawierają szczegółowe informacje o wszystkich zasobach.

Służba zdrowia

Zapewnia błędy kondycji w klastrze.

Metryczne	opis	Jednostka	Przykład
lokalizator	Krótki opis błędów kondycji. Po kliknięciu linku zostanie otwarty panel boczny zawierający więcej informacji.	Brak jednostki	PoolCapacityThresholdExceeded
Typ zasobu błędu	Typ zasobu, który napotkał błąd.	Brak jednostki	Pula magazynu
Identyfikator zasobu błędu	Unikatowy identyfikator zasobu, który napotkał błąd kondycji.	Unikatowy identyfikator	{a0a0a0-bbbb-cccc-dddd-e1e1e1e1e1e1e1}: SP:{b1b1b1b1-cccc-dddd-eeee-f2f2f2f2f2f2f2f2f2f2f2}
Ważność	Ważność błędu może być ostrzegawcza lub krytyczna.	Brak jednostki	Ostrzeżenie
Początkowy czas błędu	Sygnatura czasowa ostatniej aktualizacji serwera.	Datetime	4/9/2022, 12:15:42

Serwer

Metryczne	opis	Jednostka	Przykład
Serwery	Nazwy serwerów w klastrze.	Brak jednostki	Maszyna wirtualna-1
Ostatnia aktualizacja	Data i godzina ostatniej aktualizacji serwera.	Datetime	4/9/2022, 12:15:42
Stan	Kondycja zasobów serwera w klastrze.	Może to być w dobrej kondycji, ostrzeżenie, krytyczne i inne	Dobra kondycja
Użycie procesora CPU	Procent czasu, przez który proces używał procesora CPU.	Procent	56%
Użycie pamięci	Użycie pamięci procesu serwera jest równe licznikowi Process\Private Bytes oraz rozmiaru danych mapowanych na pamięć.	Procent	16%
Procesory logiczne	Liczba procesorów logicznych.	Count	2
Procesory CPU	Liczba procesorów CPU.	Count	2
Czas sprawności	Czas, w którym maszyna, zwłaszcza komputer, działa.	Zakres czasu	2.609 godz.
Witryna	Nazwa lokacji, do której należy serwer.	Nazwa witryny	SiteA
Nazwa domeny	Domena lokalna, do której należy serwer.	Brak jednostki	Contoso.local

Maszyny wirtualne

Zapewnia stan wszystkich maszyn wirtualnych w klastrze. Maszyna wirtualna może znajdować się w jednym z następujących stanów: Uruchomiono, Zatrzymano, Niepowodzenie lub Inne (Nieznany, Uruchamianie, Migawka, Zapisywanie, Zatrzymywanie, Wstrzymywanie, Wznawianie, Wstrzymano, Zawieszone).

Metryczne	opis	Jednostka	Przykład
Serwery	Nazwa serwera.	Brak jednostki	Przykładowa maszyna wirtualna-1
Ostatnia aktualizacja	Daje to datę i godzinę ostatniej aktualizacji serwera	Datetime	4/9/2022, 12:24:02
Łączna liczba maszyn wirtualnych	Liczba maszyn wirtualnych w węźle serwera.	Count	0 z 0 uruchomionych
Uruchomiono	Liczba maszyn wirtualnych uruchomionych w węźle serwera.	Count	2
Zatrzymana	Liczba maszyn wirtualnych zatrzymanych w węźle serwera.	Count	3
Niepowodzenie	Liczba maszyn wirtualnych nie powiodła się w węźle serwera.	Count	2
Inne	Jeśli maszyna wirtualna znajduje się w jednym z następujących stanów (Nieznany, Uruchamianie, Migawka, Zapisywanie, Zatrzymywanie, Wstrzymywanie, Wznawianie, Wstrzymane, Zawieszone), jest uznawane za "Inne".	Count	2

Storage

W poniższej tabeli przedstawiono kondycję woluminów i dysków w klastrze:

Metryczne	opis	Jednostka	Przykład
Woluminy	Nazwa woluminu	Brak jednostki	ClusterPerformanceHistory
Ostatnia aktualizacja	Data i godzina ostatniej aktualizacji magazynu.	Datetime	14.04.2022, 2:58:55
Stan	Stan woluminu.	Dobra kondycja, ostrzeżenie, krytyczne i inne.	Dobra kondycja
Łączna dyspozycyjność	Łączna pojemność urządzenia w bajtach w okresie raportowania.	Bajty	2.5 GB
Dostępna dyspozycyjność	Dostępna pojemność w bajtach w okresie raportowania.	Bajty	20B
Iops	Operacje wejścia/wyjścia na sekundę.	Sekundę	45/s
Produktywność	Liczba bajtów na sekundę obsługiwana przez usługę Application Gateway.	Bajty na sekundę	5B/s
Opóźnienie	Czas potrzebny na ukończenie żądania we/wy.	Second	0,0016 s
Odporność	Pojemność do odzyskania po awariach. Maksymalizuj dostępność danych.	Brak jednostki	Dublowanie trzystopniowe
Deduplikacja	Proces zmniejszania fizycznej liczby bajtów danych, które muszą być przechowywane na dysku.	Dostępne lub nie	Tak/Nie
System plików	Typ systemu plików.	Brak jednostki	ReFS

Cennik usługi Azure Monitor

Po włączeniu wizualizacji monitorowania dzienniki są zbierane z:

Zarządzanie kondycją (Microsoft-windows-health/operational).
SDDC Management (Microsoft-Windows-SDDC-Management/Operational; Identyfikator zdarzenia: 3000, 3001, 3002, 3003, 3004).

Opłaty są naliczane na podstawie ilości pozyskanych danych i ustawień przechowywania danych obszaru roboczego usługi Log Analytics.

Usługa Azure Monitor ma cennik płatności zgodnie z rzeczywistym użyciem, a pierwsze 5 GB na konto rozliczeniowe miesięcznie jest bezpłatne. Ponieważ ceny mogą się różnić ze względu na wiele czynników, takich jak region używanej platformy Azure, odwiedź kalkulator cen usługi Azure Monitor, aby uzyskać najbardziej aktualne obliczenia cen.

Udostępnij za pośrednictwem