Konfigurowanie Azure Portal do monitorowania klastrów usługi Azure Stack HCI (wersja zapoznawcza)

Dotyczy: Azure Stack HCI, wersja 21H2

Ważne

Funkcje opisane w tym artykule wymagają najnowszej aktualizacji rozwiązania Azure Stack HCI. Poprzednie wersje usługi Azure Stack HCI wyświetlają kafelek Monitorowanie zamiast kafelka Szczegółowe informacje, a menu Szczegółowe informacje jest niedostępne. Zainstaluj najnowszą aktualizację, aby uzyskać nowe możliwości.

W tym artykule wyjaśniono, jak włączyć możliwości usługi Azure Szczegółowe informacje do monitorowania klastra usługi Azure Stack HCI za pomocą usługi Azure Stack HCI Szczegółowe informacje.

Jeśli jeszcze tego nie zrobiono, pamiętaj o zarejestrowaniu klastra na platformie Azure. Po włączeniu dzienników i monitorowania można użyć usługi Azure Stack HCI Szczegółowe informacje do monitorowania kondycji klastra, wydajności i użycia. Monitorowanie klastra usługi Azure Stack HCI z Azure Portal wymaga włączenia usługi Azure Arc dla każdego serwera w klastrze. Jeśli klaster został zarejestrowany w dniu 15 czerwca 2021 r., dzieje się tak domyślnie. W przeciwnym razie należy włączyć integrację usługi Azure Arc.

Możliwość dzienników (wersja zapoznawcza)

Po zarejestrowaniu klastra i włączeniu serwera Arc zobaczysz następujące informacje w Azure Portal:

  • Zasób usługi Azure Stack HCI w określonej grupie zasobów.
  • Serwer — zasoby usługi Azure Arc dla każdego serwera w klastrze w programie <clustername>ArcInstanceResourceGroup.
  • Węzły z linkiem zasobu Server-Azure Arc na stronie zasobu usługi Azure Stack HCI na karcie Węzły .

Teraz, gdy węzły klastra są włączone w usłudze Arc, przejdź do strony zasobu klastra usługi Azure Stack HCI. Na karcie Możliwości zostanie wyświetlona opcja włączania dzienników, która powinna mieć wartość Nieskonfigurowane.

Logs capability under the Capabilities tab

Ta funkcja to rozszerzenie Arc for Servers, które upraszcza instalowanie Microsoft Monitoring Agent. Ponieważ używasz rozszerzenia Arc for Servers w celu włączenia tego przepływu pracy, jeśli kiedykolwiek dodasz dodatkowe serwery do klastra, będą one automatycznie zainstalowane Microsoft Monitoring Agent na nich.

Uwaga

Microsoft Monitoring Agent dla Windows komunikuje się wychodząco z usługą Azure Monitor za pośrednictwem portu TCP 443. Jeśli serwery łączą się za pośrednictwem zapory lub serwera proxy, aby komunikować się przez Internet, zapoznaj się z tymi wymaganiami , aby zrozumieć wymaganą konfigurację sieci.

Konfigurowanie rozszerzenia agenta usługi Log Analytics

Aby skonfigurować rozszerzenie agenta usługi Log Analytics:

  1. Na karcie Możliwości wybierz pozycję Dzienniki.

  2. Wybierz pozycję Użyj istniejącej , aby użyć istniejącego obszaru roboczego dla subskrypcji.

  3. Wybierz pozycję Dodaj w dolnej części strony.

    Enable Log Analytics on Azure portal

  4. Po zakończeniu konfiguracji dzienniki będą wyświetlane jako Skonfigurowane na karcie Możliwości .

  5. Wybierz pozycję Ustawienia > Rozszerzenia na pasku narzędzi po lewej stronie. Powinien zostać wyświetlony komunikat, że każdy z serwerów pomyślnie zainstalował Microsoft Monitoring Agent.

Rozszerzenie log analytics zostało pomyślnie zainstalowane.

Wyłączanie usługi Log Analytics

Jeśli chcesz wyłączyć funkcję Dzienniki, musisz usunąć Microsoft Monitoring Agent z ustawień Rozszerzenia. Należy pamiętać, że nie powoduje to usunięcia obszaru roboczego usługi Log Analytics na platformie Azure ani żadnego z danych znajdujących się w nim, więc musisz to zrobić ręcznie.

Aby usunąć Microsoft Monitoring Agent z każdego serwera w klastrze, wykonaj następujące kroki:

  1. Wybierz pozycję Ustawienia > Rozszerzenia na pasku narzędzi po lewej stronie.
  2. Zaznacz pole wyboru MicrosoftMonitoringAgent .
  3. Kliknij przycisk Usuń, a następnie pozycję Tak.

Szczegółowe informacje możliwości (wersja zapoznawcza)

Szczegółowe informacje był wcześniej znany jako "monitorowanie" i służy do monitorowania zasobów i zapewnia przydatne szczegółowe informacje dotyczące klastra, serwerów, maszyn wirtualnych, magazynu i wiele innych.

Cluster portal screen

Dane wygenerowane na podstawie lokalnego klastra usługi Azure Stack HCI są zbierane w obszarze roboczym usługi Log Analytics na platformie Azure. W tym obszarze roboczym można zbierać dane dotyczące kondycji klastra. Domyślnie monitorowanie zbiera następujące dzienniki co godzinę:

  • Zarządzanie kondycją (Microsoft-windows-health/operational)
  • SdDC Management (Microsoft-Windows-SDDC-Management/Operational; Identyfikator zdarzenia: 3000, 3001, 3002, 3003, 3004)

Aby zmienić częstotliwość zbierania dzienników, zobacz Kanał dziennika zdarzeń.

Włączanie Szczegółowe informacje

Włączenie Szczegółowe informacje ułatwia monitorowanie wszystkich klastrów usługi Azure Stack HCI obecnie skojarzonych z obszarem roboczym usługi Log Analytics, zapewniając przydatne metryki kondycji. Aby włączyć tę funkcję z poziomu Azure Portal, wykonaj następujące kroki:

  1. Na karcie Możliwości wybierz pozycję Szczegółowe informacje. Następnie wybierz pozycję Włącz.
  2. Szczegółowe informacje powinny teraz być wyświetlane jako Skonfigurowane na karcie Możliwości.

Portal screen to enable Insights

Kanał zdarzeń microsoft-windows-sddc-management/operational i microsoft-windows-health/operational Windows zostanie dodany do obszaru roboczego usługi Log Analytics w obszarze Windows dzienników zdarzeń.

Portal workspace for Windows event logs

Zbierając te dzienniki, analiza pokaże stan kondycji poszczególnych serwerów, dysków, woluminów i maszyn wirtualnych. Domyślnie zostaną dodane 5 liczników wydajności:

Windows performance counters

Liczniki wydajności

W poniższej tabeli opisano liczniki wydajności monitorowane:

Liczniki wydajności Opis
Pamięć(*)\Dostępne bajty Dostępne bajty to ilość pamięci fizycznej, w bajtach, natychmiast dostępna do alokacji do procesu lub do użycia systemu.
Interfejs sieciowy(*)\Łączna liczba bajtów/s Szybkość wysyłania i odbierania bajtów za pośrednictwem każdej karty sieciowej, w tym znaków ramek. Liczba bajtów całkowita/s to suma bajtów odebranych/s i bajtów wysłanych/s.
Procesor (_Total)% czasu procesora Procent czasu, który upłynął, wszystkie wątki przetwarzania używały procesora do wykonywania instrukcji.
Działanie RDMA(*)\RDMA Bajty przychodzące/s Szybkość odbierania danych przez rdMA przez kartę sieciową na sekundę.
Działanie RDMA(*)\RDMA Bajty ruchu wychodzącego/s Szybkość danych wysyłanych przez rdMA przez kartę sieciową na sekundę.

Po włączeniu Szczegółowe informacje zbieranie danych może potrwać do 15 minut. Po zakończeniu procesu zobaczysz bogatą wizualizację kondycji klastra na karcie Szczegółowe informacje (wersja zapoznawcza) na lewym pasku nawigacyjnym, jak pokazano na poniższym zrzucie ekranu:

Server visualizations

wizualizacje Szczegółowe informacje

Po włączeniu Szczegółowe informacje poniższe tabele zawierają szczegółowe informacje o wszystkich zasobach.

Służba zdrowia

Zapewnia błędy kondycji klastra.

Metric Opis Jednostka Przykład
Usterki Krótki opis błędów kondycji. Po kliknięciu linku zostanie otwarty panel boczny zawierający więcej informacji. Brak jednostki PoolCapacityThresholdExceeded
Typ zasobu błędu Typ zasobu, który napotkał błąd. Brak jednostki Pula magazynu
Identyfikator zasobu błędu Unikatowy identyfikator zasobu, który napotkał błąd kondycji. Unikatowy identyfikator {1245340c-780b-4afc-af3c-f9bdc4b12f8a}: SP:{c57f23d1-d784-4a42-8b59-4edd8e70e830}
Ważność Ważność błędu może być ostrzegawcza lub krytyczna. Brak jednostki Ostrzeżenie
Początkowy czas błędu Sygnatura czasowa ostatniej aktualizacji serwera. Data/godzinastamp 4/9/2022, 12:15:42 PM

Serwer

Metric Opis Jednostka Przykład
Serwery Nazwy serwerów w klastrze. Brak jednostki Maszyna wirtualna-1
Ostatnia aktualizacja Sygnatura czasowa ostatniej aktualizacji serwera. Data/godzinastamp 4/9/2022, 12:15:42 PM
Stan Kondycja zasobów serwera w klastrze. Może to być w dobrej kondycji, ostrzeżenie, krytyczne i inne Dobra kondycja
Użycie procesora Procent czasu, przez który proces używał procesora CPU. Procent 56%
Użycie pamięci Użycie pamięci procesu serwera jest równe licznikowi Process\Private Bytes oraz rozmiaru danych zamapowanych na pamięć. Procent 16%
Procesory logiczne Liczba procesorów logicznych. Liczba 2
Procesory CPU Liczba procesorów CPU. Liczba 2
Czas pracy Czas, w którym maszyna, zwłaszcza komputer, działa. Dni/min/s 2.609 godz.
Witryna Adres sieciowy, do którego należy serwer. Adres IP Witryna 2001:4888:31:13c:::/64
Nazwa domeny Domena lokalna, do której należy serwer. Brak jednostki Contoso.local

Maszyny wirtualne

Zapewnia stan wszystkich maszyn wirtualnych w klastrze. Maszyna wirtualna może znajdować się w jednym z następujących stanów: Uruchomiono, Zatrzymano, Niepowodzenie lub Inne (nieznane, uruchamianie, migawka, zapisywanie, zatrzymywanie, wstrzymywanie, wznawianie, wstrzymane, wstrzymane, wstrzymane).

Metric Opis Jednostka Przykład
Serwery Nazwa serwera. Brak jednostki Przykładowa maszyna wirtualna-1
Ostatnia aktualizacja Daje to znacznik daty/godziny, kiedy serwer został ostatnio zaktualizowany Data/godzinastamp 4/9/2022, 12:24:02
Łączna liczba maszyn wirtualnych Liczba maszyn wirtualnych w węźle serwera. Liczba 0 z 0 uruchomionych
Uruchomienie Liczba maszyn wirtualnych uruchomionych w węźle serwera. Liczba 2
Zatrzymano Liczba maszyn wirtualnych zatrzymanych w węźle serwera. Liczba 3
Niepowodzenie Liczba maszyn wirtualnych nie powiodła się w węźle serwera. Liczba 2
Inne Jeśli maszyna wirtualna znajduje się w jednym z następujących stanów (Nieznany, Uruchamianie, Migawka, Zapisywanie, Zatrzymywanie, Wstrzymywanie, Wznawianie, Wstrzymane, Wstrzymane), jest uznawane za "Inne". Liczba 2

Poniższa tabela zawiera kondycję woluminów w klastrze:

Metric Opis Jednostka Przykład
Woluminy Nazwa woluminu Brak jednostki ClusterPerformanceHistory
Ostatnia aktualizacja Znacznik daty/godziny ostatniej aktualizacji magazynu. Data/godzinastamp 14.04.2022, 2:58:55
Stan Stan woluminu. Dobra kondycja, ostrzeżenie, krytyczne i inne. Dobra kondycja
Łączna pojemność Całkowita pojemność urządzenia w bajtach w okresie raportowania. Bajty 25B
Dostępna pojemność Dostępna pojemność w bajtach w okresie raportowania. Bajty 20B
Iops Operacje wejścia/wyjścia na sekundę. Sekundę 45/s
Przepływność Liczba bajtów na sekundę obsłużonego Application Gateway. BytesPerSecond 5B/s
Opóźnienie Czas potrzebny na ukończenie żądania we/wy. Second 10-te
Odporność Pojemność do odzyskiwania po awariach. Maksymalizuje dostępność danych. Brak jednostki Dublowanie trzystopniowe
Deduplikacja Proces zmniejszania fizycznej ilości bajtów danych, które muszą być przechowywane na dysku. Dostępne lub nie Tak/Nie
System plików Typ systemu plików. Brak jednostki ReFS

Wyłączanie Szczegółowe informacje

Aby wyłączyć szczegółowe informacje, wykonaj następujące kroki:

  1. Wybierz pozycję Szczegółowe informacje na karcie Możliwości.

  2. Wybierz pozycję Wyłącz Szczegółowe informacje.

    Portal screen for disabling Insights

Po wyłączeniu funkcji Szczegółowe informacje dzienniki zarządzania Usługa kondycji i SDDC nie są już zbierane, jednak istniejące dane nie są usuwane. Jeśli chcesz usunąć te dane, przejdź do obszaru roboczego usługi Log Analytics i ręcznie usuń dane.

Wymaga aktualizacji

Kafelek Szczegółowe informacje zawiera komunikat Wymaga aktualizacji w następujących przypadkach:

  • Zdarzenie kondycji z dzienników zdarzeń Windows jest usuwane.
  • Wszystkie z 5 liczników wydajności z obszaru roboczego Loganalytics są usuwane.

Aby ponownie włączyć Szczegółowe informacje,

  • Wybierz kafelek Szczegółowe informacje w obszarze Możliwości.
  • Wybierz pozycję Aktualizuj , aby ponownie wyświetlić wizualizacje.

Portal shows update needed

Cennik usługi Azure Monitor

Jak opisano wcześniej, po włączeniu wizualizacji monitorowania dzienniki są zbierane z:

  • Zarządzanie kondycją (Microsoft-windows-health/operational).
  • SDDC Management (Microsoft-Windows-SDDC-Management/Operational; Identyfikator zdarzenia: 3000, 3001, 3002, 3003, 3004).

Opłaty są naliczane na podstawie ilości pozyskanych danych i ustawień przechowywania danych obszaru roboczego usługi Log Analytics.

Usługa Azure Monitor ma cennik płatności zgodnie z rzeczywistym użyciem, a pierwsze 5 GB na konto rozliczeniowe miesięcznie jest bezpłatne. Ponieważ ceny mogą się różnić ze względu na wiele czynników, takich jak region platformy Azure, z którego korzystasz, odwiedź kalkulator cen usługi Azure Monitor , aby uzyskać najbardziej aktualne obliczenia cen. Poniższa tabela może pomóc w obliczeniu kosztów:

Klastry w autonomicznym obszarze roboczym usługi Log Analytics Pozyskane GB miesięcznie
Klaster z dwoma węzłami Ok. 1 MB na godzinę
Klaster z czterema węzłami Ok. 1 MB na godzinę
Klaster z ośmioma węzłami Ok. 1 MB na godzinę

W poniższej tabeli przedstawiono strukturę cenową klastrów rozwiązania Azure Stack HCI o różnych rozmiarach:

Klastry w tym samym obszarze roboczym usługi Log Analytics Pozyskane GB miesięcznie
Małe wdrożenie (3 klastry z dwoma węzłami) Ok. 3 GB
Średnie wdrożenie (10 klastrów z czterema węzłami) ~10 GB
Duże wdrożenie (25 klastrów z czterema węzłami) Ok. 25 GB

Rozwiązywanie problemów

Jeśli funkcje dzienników i możliwości monitorowania są włączone bez błędów, ale dane monitorowania nie są wyświetlane po godzinie lub tak, możesz użyć narzędzia do rozwiązywania problemów z usługą Log Analytics.

Jak używać narzędzia do rozwiązywania problemów z usługą Log Analytics

  1. Otwórz wiersz polecenia programu PowerShell jako administrator na hoście rozwiązania Azure Stack HCI, na którym zainstalowano agenta usługi Log Analytics.

  2. Przejdź do katalogu, w którym znajduje się narzędzie.

    cd C:\Program Files\Microsoft Monitoring Agent\Agent\Troubleshooter
    
  3. Wykonaj skrypt główny przy użyciu tego polecenia:

    .\GetAgentInfo.ps1
    
  4. Po wyświetleniu monitu o wybranie scenariusza rozwiązywania problemów wybierz opcję 1: Agent nie zgłasza danych lub brak danych pulsu.

  5. Zostanie wyświetlony monit o wybranie akcji, którą chcesz wykonać. Wybierz opcję 1: Diagnozowanie.

    Troubleshooting tool command line options

  6. Jeśli wystąpi błąd wyróżniony na poniższym zrzucie ekranu, ale nadal można nawiązać połączenie ze wszystkimi punktami końcowymi usługi Log Analytics, a ustawienia zapory i bramy są poprawne, prawdopodobnie wystąpił problem ze strefą czasową.

    Command prompt showing tool errors

    Przyczyną jest to, że czas lokalny różni się od czasu platformy Azure i nie można zweryfikować klucza obszaru roboczego z powodu niezgodności.

    Move to next error

  7. W celu rozwiązania tego problemu:

    1. Przejdź do strony zasobów rozwiązania Azure Stack HCI w Azure Portal, wybierz pozycję [nazwa klastra] > Rozszerzenia. Następnie zaznacz pole wyboru MicrosoftMonitoringAgent i usuń rozszerzenie Microsoft Monitoring Agent.
    2. Upewnij się, że strefa czasowa hosta usługi Azure Stack HCI jest poprawna i że czas lokalny na hoście jest taki sam jak czas platformy Azure dla strefy czasowej.
      1. W konsoli hosta rozwiązania Azure Stack HCI wybierz opcję 9: Data i godzina & z menu Sconfig, a następnie wybierz pozycję Zmień strefę czasową i upewnij się, że czas lokalny jest poprawny.
      2. Przejrzyj strefę czasową kontrolera PDC usługi Active Directory (podstawowy kontroler domeny) i upewnij się, że data i godzina są poprawne.
      3. Jeśli kontroler PDC usługi Active Directory jest poprawny, a lokalny czas usługi Azure Stack HCI jest nadal niepoprawny, hierarchia domeny usługi Active Directory nie jest rozpoznawana. Jeśli tak jest, wykonaj kroki iv - vi poniżej. W przeciwnym razie przejdź do kroku c.
      4. Na hoście rozwiązania Azure Stack HCI wybierz opcję 15 , aby zamknąć menu Sconfig. Następnie uruchom następujące polecenie w programie PowerShell jako administrator: w32tm.exe /config /syncfromflags:domhier /update — powinno to zwrócić potwierdzenie pomyślnego zakończenia polecenia, a ustawienie czasu powinno być teraz poprawne.
      5. Aby przeprowadzić dalszą diagnostykę, uruchom polecenie w32tm /monitor w konsoli hosta rozwiązania Azure Stack HCI. Aktywny kontroler domeny powinien być wymieniony jako serwer warstwy 1, a wszystkie inne kontrolery domeny jako warstwy 2.
      6. Na koniec upewnij się, że dostawcy usługi czasu i czasu Windows nie są skonfigurowani w obiekcie zasady grupy, ponieważ zakłóca to hierarchię domeny usługi Active Directory.
    3. Ponownie dodaj rozszerzenie usługi Log Analytics, przechodząc do strony zasobów rozwiązania Azure Stack HCI w Azure Portal, wybierz pozycję [nazwa klastra] > Przegląd, a następnie wybierz pozycję Możliwości i skonfiguruj usługę Log Analytics i monitorowanie.
  8. Uruchom ponownie narzędzie do rozwiązywania problemów z usługą Log Analytics i nie powinno być już wyświetlane błąd. W obszarze roboczym usługi Log Analytics w obszarze roboczym usługi Log Analytics powinny być widoczne Windows numery agentów w celu dopasowania do węzłów klastra, a zdarzenia monitorowania zaczną przepływać.

Następne kroki