Omówienie i monitorowanie ponownej synchronizacji magazynu

Dotyczy: Azure Stack HCI, wersje 22H2 i 21H2; Windows Server 2022, Windows Server 2019

Alert ponownego synchronizacji magazynu to możliwość Bezpośrednie miejsca do magazynowania w usługach Azure Stack HCI i Windows Server. Umożliwia usłudze kondycji zgłaszanie błędu z powiadomieniem o ponownym zsynchronizowaniu. Pomaga to zapobiec przypadkowemu zdejmowaniu większej liczby serwerów, co może mieć wpływ na wiele domen błędów, co powoduje awarię klastra.

Ten artykuł zawiera omówienie ponownego synchronizowania magazynu i sposobu monitorowania go w klastrze trybu failover przy użyciu Bezpośrednie miejsca do magazynowania.

Informacje o ponownej synchronizacji magazynu

Zacznijmy od prostego przykładu, aby zrozumieć, w jaki sposób magazyn może wydostać się z synchronizacji. Należy pamiętać, że każde rozwiązanie magazynu rozproszonego bez udostępniania (tylko dyski lokalne) wykazuje to zachowanie. W poniższej sekcji pokazano, jak magazyn zostaje wyłączony z synchronizacji, gdy jeden węzeł serwera ulegnie awarii. Jego dyski nie są aktualizowane, dopóki nie wróci do trybu online — to zachowanie ma zastosowanie do dowolnej architektury hiperkonwergentnej.

Załóżmy, że chcesz przechowywać ciąg "HELLO".

Obraz przedstawiający ciąg hello s c i.

Zakładając, że masz odporność dublowania trójkierunkowego, masz trzy kopie tego ciągu. Jeśli tymczasowo zdjąsz serwer #1 (w celu konserwacji), nie możesz uzyskać dostępu do kopii #1.

Obraz przedstawiający, że nie można uzyskać dostępu do kopii numer 1, jeśli zdjąsz numer serwera 1.

Załóżmy, że w tej chwili zaktualizujesz ciąg z "HELLO" na "HELP!".

Obraz przedstawiający s c i i pomocy! Ciąg.

Po zaktualizowaniu ciągu skopiuj plik #2 i #3 zostanie pomyślnie zaktualizowany. Nie można jednak uzyskać dostępu do kopii #1, ponieważ serwer #1 jest tymczasowo wyłączony (w celu konserwacji).

GIF do skopiowania numeru 2 i 3.

Teraz masz kopię #1 z danymi poza synchronizacją. System operacyjny używa szczegółowego śledzenia zanieczyszczonych regionów, aby śledzić bity, które nie są zsynchronizowane. Dzięki temu, gdy serwer #1 wróci do trybu online, możesz zsynchronizować zmiany, odczytując dane z kopii #2 lub #3 i zastępując dane w kopii #1. Dzięki temu podejściu należy skopiować tylko te dane, które są nieaktualne, zamiast ponownie zsynchronizować wszystkie dane z serwera #2 lub serwera #3.

Plik GIF zastępowania w celu skopiowania numeru 1.

W poprzedniej sekcji opisano sposób, w jaki dane mogą zostać wycofane z synchronizacji. Ale jak wygląda to na wysokim poziomie? Załóżmy, że masz klaster z trzema serwerami, hiperkonwergentnym. Gdy serwer #1 jest w konserwacji, widzisz go jako wyłączony. Po utworzeniu kopii zapasowej serwera #1 rozpoczyna się ponowne synchronizowanie całego magazynu przy użyciu szczegółowego śledzenia brudnego regionu (wyjaśnionej w poprzedniej sekcji). Gdy wszystkie dane zostaną zsynchronizowane, zostaną wyświetlone wszystkie serwery.

Poniższy plik GIF pokazuje, jak funkcja ponownej synchronizacji magazynu działa w klastrze hiperkonwergentnym:

Plik GIF przedstawiający widok administratora ponownej synchronizacji.

Jak monitorować ponowną synchronizację magazynu

Począwszy od systemu Windows Server 2019 dodaliśmy nową usterkę do usługi kondycji , która jest wyświetlana po ponownym zsynchronizowaniu magazynu.

Aby wyświetlić tę usterkę w programie PowerShell, uruchom następujące polecenie cmdlet:

Get-HealthFault

Ta nowa usterka jest wyświetlana w programie PowerShell, w raporcie weryfikacji klastra i w dowolnym innym miejscu, który opiera się na błędach kondycji.

Aby uzyskać bardziej szczegółowe informacje, możesz wykonać zapytanie dotyczące bazy danych szeregów czasowych w programie PowerShell w następujący sposób:

Get-ClusterNode | Get-ClusterPerf -ClusterNodeSeriesName ClusterNode.Storage.Degraded

Poniżej przedstawiono przykładowe dane wyjściowe:

Object Description: ClusterNode Server1

Series                       Time                Value Unit
------                       ----                ----- ----
ClusterNode.Storage.Degraded 01/11/2019 16:26:48     214 GB

Windows Admin Center używa błędów kondycji, aby ustawić stan i kolor węzłów klastra. Na pulpicie nawigacyjnym HCI ta nowa usterka umożliwia węzłom klastra przejście z czerwonego (w dół) do żółtego (ponownego synchronizowania) do zielonego (w górę), zamiast przechodzić prosto z czerwonego na zielony.

Na poniższej ilustracji porównaliśmy postęp ponownego synchronizacji magazynu w Windows Server 2016 a Windows Server 2019.

Obraz przedstawiający widok Windows Server 2016 vs Windows Server 2019 przedstawiający ponowną synchronizację.

Pokazując ogólny postęp ponownego synchronizacji magazynu, można dokładnie wiedzieć, ile danych jest poza synchronizacją i czy system wykonuje postęp. W Windows Admin Center przejdź do pulpitu nawigacyjnego, aby wyświetlić nowy alert, jak pokazano na poniższym zrzucie ekranu:

Przechwytywanie ekranu alertu w Windows Admin Center.

Alert jest przydatny podczas powiadamiania o ponownym zsynchronizowaniu, dzięki czemu nie nastąpi przypadkowe usunięcie większej liczby serwerów (co może spowodować awarię wielu domen błędów, co spowoduje awarię klastra).

Aby uzyskać szczegółowy widok sposobu ponownego synchronizowania magazynu na serwerze w Windows Admin Center, przejdź do strony Serwery, kliknij pozycję Spis, a następnie wybierz określony serwer. Przejdź do serwera i przyjrzyj się wykresowi magazynu , aby zobaczyć ilość danych, które należy naprawić w fioletowym wierszu z dokładną liczbą tuż nad nim. Ta kwota zwiększa się, gdy serwer nie działa (więcej danych należy ponownie zsynchronizować) i zmniejsza się stopniowo, gdy serwer wraca do trybu online (dane są synchronizowane). Gdy ilość danych, które należy naprawić, wynosi 0, magazyn odbywa się ponownie — teraz możesz usunąć serwer, jeśli zajdzie taka potrzeba.

Poniższy zrzut ekranu przedstawia widok serwera w Windows Admin Center:

Przechwytywanie ekranu widoku serwera w Windows Admin Center.

Jak monitorować ponowną synchronizację magazynu w Windows Server 2016

Alert dostępny w systemie Windows Server 2019 i nowszych jest pomocny w uzyskaniu całościowego widoku tego, co dzieje się w warstwie magazynu. Zawiera podsumowanie informacji, które można pobrać z Get-StorageJob polecenia cmdlet. To polecenie cmdlet zwraca informacje o długotrwałych zadaniach modułu magazynu, takich jak operacja naprawy miejsca do magazynowania, jak pokazano w poniższych przykładowych danych wyjściowych.

Get-StorageJob

Oto przykładowe dane wyjściowe:

Name                  ElapsedTime           JobState              PercentComplete       IsBackgroundTask
----                  -----------           --------              ---------------       ----------------
Regeneration          00:01:19              Running               50                    True

Ten widok jest bardziej szczegółowy, ponieważ zadania magazynu są wyświetlane na woluminie. Możesz wyświetlić listę uruchomionych zadań i śledzić ich poszczególne postępy. To polecenie cmdlet działa zarówno w Windows Server 2016, jak i 2019.

Dodatkowe informacje