Udostępnij za pośrednictwem


Weryfikowanie klastra rozwiązania Azure Stack HCI

Dotyczy: Azure Stack HCI, wersje 22H2 i 21H2; Windows Server 2022, Windows Server 2019.

Ostrzeżenie

Instrukcje wdrażania podane w tym artykule dotyczą starszej wersji usługi Azure Stack HCI w wersji 22H2. W przypadku nowych wdrożeń zalecamy użycie najnowszej ogólnie dostępnej wersji, Azure Stack HCI w wersji 23H2. Aby uzyskać instrukcje dotyczące wdrażania, zobacz About Azure Stack HCI, version 23H2 deployment (Informacje o wdrożeniu rozwiązania Azure Stack HCI w wersji 23H2).

Sprawdzanie, czy funkcja DCB nie jest już zalecanym narzędziem do konfigurowania lub testowania konfiguracji sieci hosta w usłudze Azure Stack HCI. Zalecamy użycie usługi Network ATC do skonfigurowania konfiguracji sieci hosta dla usługi Azure Stack HCI. Usługa Network ATC zawsze zastępuje funkcję Validate DCB w usłudze Azure Stack HCI.

Mimo że kreator tworzenia klastra w Windows Admin Center wykonuje pewne weryfikacje w celu utworzenia klastra roboczego z wybranym sprzętem, walidacja klastra wykonuje dodatkowe kontrole, aby upewnić się, że klaster będzie działać w środowisku produkcyjnym. Ten artykuł z instrukcjami koncentruje się na tym, dlaczego walidacja klastra jest ważna i kiedy należy ją uruchomić w klastrze azure Stack HCI.

Zalecamy przeprowadzenie weryfikacji klastra w następujących podstawowych scenariuszach:

  • Po wdrożeniu klastra serwerów uruchom narzędzie Validate-DCB, aby przetestować sieć.
  • Po zaktualizowaniu klastra serwerów w zależności od scenariusza uruchom obie opcje weryfikacji, aby rozwiązać problemy z klastrem.
  • Po skonfigurowaniu replikacji za pomocą repliki magazynu sprawdź, czy replikacja przebiega normalnie, sprawdzając niektóre określone zdarzenia i uruchamiając kilka poleceń.
  • Po utworzeniu klastra serwerów uruchom narzędzie Validate-DCB przed umieszczeniem go w środowisku produkcyjnym.

Co to jest weryfikacja klastra?

Walidacja klastra jest przeznaczona do przechwytywania problemów ze sprzętem lub konfiguracją, zanim klaster przejdzie do środowiska produkcyjnego. Walidacja klastra pomaga upewnić się, że rozwiązanie Azure Stack HCI, które ma zostać wdrożone, jest naprawdę zależne. Możesz również użyć walidacji klastra w skonfigurowanych klastrach trybu failover jako narzędzia diagnostycznego.

Konkretne scenariusze weryfikacji

W tej sekcji opisano scenariusze, w których wymagana jest również walidacja lub jest przydatna.

  • Walidacja przed skonfigurowaniem klastra:

    • Zestaw serwerów gotowych do utworzenia klastra trybu failover: Jest to najprostszy scenariusz weryfikacji. Składniki sprzętowe (systemy, sieci i magazyn) są połączone, ale systemy nie działają jeszcze jako klaster. Uruchamianie testów w tej sytuacji nie ma wpływu na dostępność.

    • Maszyny wirtualne serwera: W przypadku serwerów zwirtualizowanych w klastrze uruchom walidację klastra, tak jak w przypadku dowolnego innego nowego klastra. Wymaganie uruchomienia funkcji jest takie samo, czy:

      • "Klaster hostów", w którym odbywa się tryb failover między dwoma komputerami fizycznymi.
      • "Klaster gościa", w którym następuje przejście w tryb failover między systemami operacyjnymi gościa na tym samym komputerze fizycznym.
  • Walidacja po skonfigurowaniu i użyciu klastra:

    • Przed dodaniem serwera do klastra: Podczas dodawania serwera do klastra zdecydowanie zalecamy zweryfikowanie klastra. Określ zarówno istniejące elementy członkowskie klastra, jak i nowy serwer podczas uruchamiania walidacji klastra.

    • Podczas dodawania dysków: Po dodaniu dodatkowych dysków do klastra, który różni się od zastępowania dysków z awarią lub tworzenia dysków wirtualnych lub woluminów opartych na istniejących dyskach, uruchom walidację klastra, aby potwierdzić, że nowy magazyn będzie działać poprawnie.

    • Podczas wprowadzania zmian wpływających na oprogramowanie układowe lub sterowniki: W przypadku uaktualniania lub wprowadzania zmian w klastrze, które mają wpływ na oprogramowanie układowe lub sterowniki, należy uruchomić walidację klastra, aby potwierdzić, że nowa kombinacja sprzętu, oprogramowania układowego, sterowników i oprogramowania obsługuje funkcje klastra trybu failover.

    • Po przywróceniu systemu z kopii zapasowej: Po przywróceniu systemu z kopii zapasowej uruchom walidację klastra, aby potwierdzić, że system działa prawidłowo w ramach klastra.

Weryfikowanie sieci

Narzędzie Microsoft Validate-DCB zostało zaprojektowane do weryfikowania konfiguracji mostkowania centrum danych (DCB) w klastrze. W tym celu narzędzie przyjmuje oczekiwaną konfigurację jako dane wejściowe, a następnie testuje każdy serwer w klastrze. W tej sekcji opisano sposób instalowania i uruchamiania narzędzia Validate-DCB, przeglądania wyników i rozwiązywania błędów sieciowych zidentyfikowanych przez narzędzie.

Uwaga

Firma Microsoft zaleca wdrażanie konfiguracji i zarządzanie nią za pomocą usługi Network ATC, co eliminuje większość problemów z konfiguracją sprawdzanych przez narzędzie Validate-DCB. Aby dowiedzieć się więcej na temat usługi Network ATC, która zapewnia oparte na intencji podejście do wdrażania sieci hostów, zobacz Upraszczanie sieci hostów za pomocą usługi Network ATC.

W sieci zdalny bezpośredni dostęp do pamięci (RDMA) za pośrednictwem sieci Converged Ethernet (RoCE) wymaga technologii DCB, aby sieć szkieletowa sieci nie utraciła. W przypadku systemu iWARP funkcja DCB jest opcjonalna. Jednak konfigurowanie funkcji DCB może być złożone, z dokładną konfiguracją wymaganą w:

  • Każdy serwer w klastrze
  • Każdy port sieciowy przechodzący przez ruch RDMA w sieci szkieletowej

Wymagania wstępne

  • Informacje o konfiguracji sieci klastra serwerów, które chcesz zweryfikować, w tym:
    • Nazwa klastra hostów lub serwerów
    • Nazwa przełącznika wirtualnego
    • Nazwy kart sieciowych
    • Ustawienia sterowania przepływem priorytetu (PFC) i ulepszonego wyboru transmisji (ETS)
  • Połączenie internetowe umożliwiające pobranie modułu narzędzi w Windows PowerShell od firmy Microsoft.

Instalowanie i uruchamianie narzędzia Validate-DCB

Aby zainstalować i uruchomić narzędzie Validate-DCB:

  1. Na komputerze zarządzania otwórz sesję Windows PowerShell jako administrator, a następnie użyj następującego polecenia, aby zainstalować narzędzie.

    Install-Module Validate-DCB
    
  2. Zaakceptuj żądania użycia dostawcy NuGet i uzyskaj dostęp do repozytorium w celu zainstalowania narzędzia.

  3. Gdy program PowerShell połączy się z siecią firmy Microsoft, aby pobrać narzędzie, wpisz Validate-DCB i naciśnij klawisz Enter , aby uruchomić kreatora narzędzi.

    Uwaga

    Jeśli nie możesz uruchomić skryptu narzędzia Validate-DCB, może być konieczne dostosowanie zasad wykonywania programu PowerShell. Użyj polecenia cmdlet Get-ExecutionPolicy, aby wyświetlić bieżące ustawienia zasad wykonywania skryptu. Aby uzyskać informacje na temat ustawiania zasad wykonywania w programie PowerShell, zobacz About Execution Policies (Informacje o zasadach wykonywania).

  4. Na stronie Kreatora konfiguracji Validate-DCB — Zapraszamy, wybierz przycisk Dalej.

  5. Na stronie Klastry i węzły wpisz nazwę klastra serwerów, który chcesz zweryfikować, wybierz pozycję Rozwiąż , aby wyświetlić listę na stronie, a następnie wybierz przycisk Dalej.

    Strona Klastry i węzły kreatora konfiguracji Validate-DCB

  6. Na stronie Karty:

    1. Zaznacz pole wyboru przełącznika wirtualnego dołączone i wpisz nazwę przełącznika wirtualnego.
    2. W obszarze Nazwa karty wpisz nazwę każdej fizycznej karty sieciowej, w obszarze Nazwa wirtualnej karty sieciowej hosta, nazwę każdej wirtualnej karty sieciowej (vNIC) i w obszarze VLAN identyfikator sieci VLAN używany dla każdej karty.
    3. Rozwiń pole listy rozwijanej Typ RDMA i wybierz odpowiedni protokół: RoCE lub iWARP. Ustaw również ramki Jumbo na odpowiednią wartość dla sieci, a następnie wybierz przycisk Dalej.

    Strona Adaptery kreatora konfiguracji Validate-DCB

    Uwaga

  7. Na stronie Mostkowanie centrum danych zmodyfikuj wartości w celu dopasowania ich do ustawień priorytetu, nazwy zasad i rezerwacji przepustowości, a następnie wybierz pozycję Dalej.

    Strona Mostkowanie centrum danych kreatora konfiguracji Validate-DCB

    Uwaga

    Wybranie funkcji RDMA za pośrednictwem roCE na poprzedniej stronie kreatora wymaga kontrolera DCB w celu zwiększenia niezawodności sieci na wszystkich kartach sieciowych i przełącznikach.

  8. Na stronie Zapisywanie i wdrażanie w polu Ścieżka pliku konfiguracji zapisz plik konfiguracji przy użyciu rozszerzenia .ps1 do lokalizacji, w której można użyć go ponownie później w razie potrzeby, a następnie wybierz pozycję Eksportuj , aby rozpocząć uruchamianie narzędzia Validate-DCB.

    • Opcjonalnie możesz wdrożyć plik konfiguracji, wykonując sekcję Deploy Configuration to Nodes (Wdrażanie konfiguracji w węzłach) na stronie, która obejmuje możliwość używania konta Azure Automation w celu wdrożenia konfiguracji, a następnie jego weryfikacji. Zobacz Tworzenie konta Azure Automation, aby rozpocząć pracę z Azure Automation.

    Strona Zapisywanie i wdrażanie kreatora konfiguracji Validate-DCB

Przejrzyj wyniki i napraw błędy

Narzędzie Validate-DCB generuje wyniki w dwóch jednostkach:

  1. [Global Unit] wyniki zawierają listę wymagań wstępnych i wymagań dotyczących uruchamiania testów modalnych.
  2. [Jednostka modalna] wyniki dostarczają opinii na temat konfiguracji i najlepszych rozwiązań dotyczących poszczególnych hostów klastra.

W tym przykładzie przedstawiono pomyślne wyniki skanowania pojedynczego serwera dla wszystkich wymagań wstępnych i modalnych testów jednostkowych, wskazując liczbę zakończonych niepowodzeniem 0.

Validate-DCB Global unit and Modal unit test results (Weryfikowanie wyników testu jednostek globalnych i testów jednostkowych modalnych)

W poniższych krokach pokazano, jak zidentyfikować błąd pakietu Jumbo z wirtualnej karty sieciowej SMB02 i naprawić go:

  1. Wyniki skanowania narzędzia Validate-DCB pokazują błąd Liczba nieudanych z 1.

    Wyniki skanowania narzędzia Validate-DCB z informacją o błędzie Liczba nieudanych z 1

  2. Przewijanie z powrotem wyników powoduje wyświetlenie błędu w kolorze czerwonym, co oznacza, że pakiet Jumbo dla protokołu SMB02 vNIC na hoście S046036 jest ustawiony na domyślny rozmiar 1514, ale należy go ustawić na wartość 9014.

    Wynik skanowania narzędzia Validate-DCB przedstawiający błąd ustawienia rozmiaru pakietu jumbo

  3. Przeglądanie właściwości Zaawansowane wirtualnej karty sieciowej SMB02 na hoście S046036 pokazuje, że pakiet Jumbo jest ustawiony na wartość domyślną Wyłączone.

    Ustawienie Zaawansowane właściwości funkcji Hyper-V hosta serwera Jumbo Packet

  4. Usunięcie błędu wymaga włączenia funkcji Pakietu Jumbo i zmiany rozmiaru na 9014 bajtów. Ponowne uruchomienie skanowania na hoście S046036 potwierdza tę zmianę, zwracając liczbę niepomyślnie 0.

    Sprawdzanie poprawności wyników skanowania DCB potwierdzające, że ustawienie pakiet Jumbo hosta serwera jest stałe

Aby dowiedzieć się więcej na temat rozwiązywania błędów zidentyfikowanych przez narzędzie Validate-DCB, zobacz poniższy film wideo.

Możesz również zainstalować narzędzie w trybie offline. W przypadku odłączonych systemów użyj polecenia Save-Module -Name Validate-DCB -Path c:\temp\Validate-DCB , a następnie przenieś moduły w folderze c:\temp\Validate-DCB do odłączonego systemu. Aby uzyskać więcej informacji, zobacz poniższy film wideo.

Weryfikowanie klastra

Wykonaj następujące kroki, aby zweryfikować serwery w istniejącym klastrze w Windows Admin Center.

  1. W Windows Admin Center w obszarze Wszystkie połączenia wybierz klaster Azure Stack HCI, który chcesz zweryfikować, a następnie wybierz pozycję Połącz.

    Na pulpicie nawigacyjnym Menedżera klastra są wyświetlane informacje o klastrze.

  2. Na pulpicie nawigacyjnym Menedżera klastra w obszarze Narzędzia wybierz pozycję Serwery.

  3. Na stronie Spis wybierz serwery w klastrze, a następnie rozwiń podmenu Więcej i wybierz pozycję Weryfikuj klaster.

  4. W oknie podręcznym Weryfikowanie klastra wybierz pozycję Tak.

    Okno podręczne Weryfikowanie klastra

  5. W oknie podręcznym Dostawca usług zabezpieczeń poświadczeń (CredSSP) wybierz pozycję Tak.

  6. Podaj poświadczenia, aby włączyć dostawcę CredSSP , a następnie wybierz pozycję Kontynuuj.
    Walidacja klastra jest uruchamiana w tle i wyświetla powiadomienie po zakończeniu, w którym momencie można wyświetlić raport weryfikacji, zgodnie z opisem w następnej sekcji.

Uwaga

Po zweryfikowaniu serwerów klastra należy wyłączyć program CredSSP ze względów bezpieczeństwa.

Wyłączanie programu CredSSP

Po pomyślnym zweryfikowaniu klastra serwerów należy wyłączyć protokół Dostawcy obsługi zabezpieczeń poświadczeń (CredSSP) na każdym serwerze na potrzeby zabezpieczeń. Aby uzyskać więcej informacji, zobacz CVE-2018-0886.

  1. W Windows Admin Center w obszarze Wszystkie połączenia wybierz pierwszy serwer w klastrze, a następnie wybierz pozycję Połącz.

  2. Na stronie Przegląd wybierz pozycję Wyłącz credSSP, a następnie w oknie podręcznym Wyłącz credSSP wybierz pozycję Tak.

    Wynik kroku 2 usuwa czerwony baner CredSSP ENABLED w górnej części strony Przegląd serwera i wyłącza credSSP na innych serwerach.

Wyświetlanie raportów weryfikacji

Teraz możesz wyświetlić raport weryfikacji klastra.

Istnieje kilka sposobów uzyskiwania dostępu do raportów weryfikacji:

  • Na stronie Spis rozwiń podmenu Więcej , a następnie wybierz pozycję Wyświetl raporty weryfikacji.

  • W prawym górnym rogu Windows Admin Center wybierz ikonę Dzwonek powiadomień, aby wyświetlić okienko Powiadomienia. Wybierz powiadomienie o pomyślnym zweryfikowaniu klastra , a następnie wybierz pozycję Przejdź do raportu weryfikacji klastra trybu failover.

Uwaga

Proces weryfikacji klastra serwerów może zająć trochę czasu. Nie przełączaj się do innego narzędzia w Windows Admin Center podczas uruchamiania procesu. W okienku Powiadomienia pasek stanu poniżej powiadomienia Sprawdź poprawność klastra wskazuje, kiedy proces zostanie wykonany.

Weryfikowanie klastra przy użyciu programu PowerShell

Można również użyć Windows PowerShell do uruchamiania testów weryfikacji w klastrze serwera i wyświetlania wyników. Testy można uruchamiać zarówno przed, jak i po skonfigurowaniu klastra.

Aby uruchomić test weryfikacyjny w klastrze serwerów, uruchom polecenie cmdlet programu PowerShell Get-Cluster and Test-Cluster server clustername> lub uruchom tylko polecenie cmdlet Test-Cluster<bezpośrednio w klastrze:

$Cluster = Get-Cluster -Name 'server-cluster1'
Test-Cluster -InputObject $Cluster -Verbose

Aby uzyskać więcej przykładów i informacji o użyciu, zobacz dokumentację referencyjną klastra testowego .

Test-NetStack to narzędzie do testowania opartego na programie PowerShell dostępne w usłudze GitHub, którego można użyć do przeprowadzania testów ruchu ICMP, TCP i RDMA sieci oraz identyfikowania potencjalnych błędów konfiguracji sieci szkieletowej i hosta lub niestabilności operacyjnej. Użyj Test-NetStack, aby zweryfikować ścieżki danych sieciowych przez testowanie natywnych, syntetycznych i sprzętowych ścieżek danych sieciowych (RDMA) pod kątem problemów z łącznością, fragmentacją pakietów, niską przepływnością i przeciążeniem.

Weryfikowanie replikacji dla repliki magazynu

Jeśli używasz repliki magazynu do replikowania woluminów w rozproszonym klastrze lub klastrze do klastra, istnieje kilka zdarzeń i poleceń cmdlet, których można użyć do uzyskania stanu replikacji.

W poniższym scenariuszu skonfigurowaliśmy replikę magazynu, tworząc grupy replikacji (RGs) dla dwóch lokacji, a następnie określono woluminy danych i woluminy dziennika dla obu węzłów serwera źródłowego w lokacji Site1 (Server1, Server2) oraz docelowe (replikowane) węzły serwera w lokacji 2 (Server3, Server4).

Aby określić postęp replikacji serwera Server1 w lokacji1, uruchom polecenie Get-WinEvent i sprawdź zdarzenia 5015, 5002, 5004, 1237, 5001 i 2200:

Get-WinEvent -ComputerName Server1 -ProviderName Microsoft-Windows-StorageReplica -max 20

W przypadku serwera Server3 w lokacji2 uruchom następujące Get-WinEvent polecenie, aby wyświetlić zdarzenia repliki magazynu, które pokazują tworzenie partnerstwa. To zdarzenie podaje liczbę skopiowanych bajtów i czas trwania. Na przykład:

Get-WinEvent -ComputerName Server3 -ProviderName Microsoft-Windows-StorageReplica | Where-Object {$_.ID -eq "1215"} | FL

W przypadku serwera3 w lokacji 2 uruchom Get-WinEvent polecenie i sprawdź zdarzenia 5009, 1237, 5001, 5015, 5005 i 2200, aby zrozumieć postęp przetwarzania. W tej sekwencji nie powinny wystąpić żadne ostrzeżenia dotyczące błędów. Będzie wiele zdarzeń 1237 — wskazują one postęp.

Get-WinEvent -ComputerName Server3 -ProviderName Microsoft-Windows-StorageReplica | FL

Alternatywnie docelowa grupa serwerów repliki określa liczbę bajtów pozostałych do skopiowania przez cały czas i można wykonywać zapytania za pomocą programu PowerShell za pomocą polecenia Get-SRGroup. Na przykład:

(Get-SRGroup).Replicas | Select-Object numofbytesremaining

W przypadku węzła Server3 w lokacji2 uruchom następujące polecenie i sprawdź zdarzenia 5009, 1237, 5001, 5015, 5005 i 2200, aby zrozumieć postęp replikacji. Nie powinno być żadnych ostrzeżeń o błędach. Jednak będzie wiele zdarzeń "1237" - te po prostu wskazują postęp.

Get-WinEvent -ComputerName Server3 -ProviderName Microsoft-Windows-StorageReplica | FL

Jako skrypt postępu, który nie zostanie zakończony:

while($true) {
$v = (Get-SRGroup -Name "Replication2").replicas | Select-Object numofbytesremaining
[System.Console]::Write("Number of bytes remaining: {0}`r", $v.numofbytesremaining)
Start-Sleep -s 5
}

Aby uzyskać stan replikacji w klastrze rozproszony, użyj polecenia Get-SRGroup i Get-SRPartnership:

Get-SRGroup -Cluster ClusterS1
Get-SRPartnership -Cluster ClusterS1
(Get-SRGroup).replicas -Cluster ClusterS1

Po potwierdzeniu pomyślnej replikacji danych między lokacjami można utworzyć maszyny wirtualne i inne obciążenia.

Zobacz też