Een Azure Stack HCI-cluster valideren

Van toepassing op: Azure Stack HCI, versies 22H2 en 21H2; Windows Server 2022, Windows Server 2019.

Waarschuwing

De implementatie-instructies in dit artikel zijn van toepassing op een oudere versie, Azure Stack HCI, versie 22H2. Voor nieuwe implementaties raden we u aan de meest recente algemeen beschikbare versie te gebruiken, Azure Stack HCI, versie 23H2. Zie Over Azure Stack HCI versie 23H2-implementatie voor implementatie-instructies.

Valideren dat DCB niet langer het aanbevolen hulpprogramma is voor het instellen of testen van uw hostnetwerkconfiguratie op Azure Stack HCI. We raden u aan Network ATC te gebruiken om uw hostnetwerkconfiguratie te configureren voor Azure Stack HCI. Netwerk-ATC vervangt altijd DCB valideren in Azure Stack HCI.

Hoewel de wizard Cluster maken in Windows Admin Center bepaalde validaties uitvoert om een werkend cluster te maken met de geselecteerde hardware, voert clustervalidatie extra controles uit om ervoor te zorgen dat het cluster in een productieomgeving werkt. In dit artikel wordt uitgelegd waarom clustervalidatie belangrijk is en wanneer u clustervalidatie uitvoert op een Azure Stack HCI-cluster.

We raden u aan clustervalidatie uit te voeren voor de volgende primaire scenario's:

  • Nadat u een servercluster hebt geïmplementeerd, voert u het hulpprogramma Validate-DCB uit om het netwerk te testen.
  • Nadat u een servercluster hebt bijgewerkt, voert u, afhankelijk van uw scenario, beide validatieopties uit om clusterproblemen op te lossen.
  • Nadat u de replicatie met Opslagreplica hebt ingesteld, controleert u of de replicatie normaal verloopt door enkele specifieke gebeurtenissen te controleren en een paar opdrachten uit te voeren.
  • Nadat u een servercluster hebt gemaakt, voert u het hulpprogramma Validate-DCB uit voordat u het in productie plaatst.

Wat is clustervalidatie?

Clustervalidatie is bedoeld om hardware- of configuratieproblemen te ondervangen voordat een cluster in productie wordt genomen. Met clustervalidatie kunt u ervoor zorgen dat de Azure Stack HCI-oplossing die u gaat implementeren, echt betrouwbaar is. U kunt clustervalidatie ook gebruiken voor geconfigureerde failoverclusters als diagnostisch hulpprogramma.

Specifieke validatiescenario's

In deze sectie worden scenario's beschreven waarin validatie ook nodig of nuttig is.

  • Validatie voordat het cluster wordt geconfigureerd:

    • Een set servers die klaar zijn om een failovercluster te worden: Dit is het eenvoudigste validatiescenario. De hardwareonderdelen (systemen, netwerken en opslag) zijn verbonden, maar de systemen werken nog niet als een cluster. Het uitvoeren van tests in deze situatie heeft geen invloed op de beschikbaarheid.

    • Server-VM's: Voor gevirtualiseerde servers in een cluster voert u clustervalidatie uit zoals u dat zou doen op elk ander nieuw cluster. De vereiste voor het uitvoeren van de functie is hetzelfde, ongeacht of u het volgende hebt:

      • Een 'hostcluster' waar failover plaatsvindt tussen twee fysieke computers.
      • Een 'gastcluster' waar failover plaatsvindt tussen gastbesturingssystemen op dezelfde fysieke computer.
  • Validatie nadat het cluster is geconfigureerd en in gebruik is:

    • Voordat u een server toevoegt aan het cluster: Wanneer u een server aan een cluster toevoegt, raden we u ten zeerste aan het cluster te valideren. Geef zowel de bestaande clusterleden als de nieuwe server op wanneer u clustervalidatie uitvoert.

    • Bij het toevoegen van stations: Wanneer u extra stations aan het cluster toevoegt, wat anders is dan het vervangen van mislukte stations of het maken van virtuele schijven of volumes die afhankelijk zijn van de bestaande stations, voert u clustervalidatie uit om te bevestigen dat de nieuwe opslag correct werkt.

    • Bij het aanbrengen van wijzigingen die van invloed zijn op firmware of stuurprogramma's: Als u een upgrade uitvoert of wijzigingen aanbrengt in het cluster die van invloed zijn op firmware of stuurprogramma's, moet u clustervalidatie uitvoeren om te bevestigen dat de nieuwe combinatie van hardware, firmware, stuurprogramma's en software failoverclusterfunctionaliteit ondersteunt.

    • Na het herstellen van een systeem vanuit een back-up: Nadat u een systeem vanuit een back-up hebt hersteld, voert u clustervalidatie uit om te bevestigen dat het systeem correct functioneert als onderdeel van een cluster.

Netwerken valideren

Het hulpprogramma Microsoft Validate-DCB is ontworpen om de DCB-configuratie (Data Center Bridging) op het cluster te valideren. Hiervoor neemt het hulpprogramma een verwachte configuratie als invoer en test vervolgens elke server in het cluster. In deze sectie wordt beschreven hoe u het hulpprogramma Validate-DCB installeert en uitvoert, de resultaten bekijkt en netwerkfouten oplost die door het hulpprogramma worden geïdentificeerd.

Notitie

Microsoft raadt aan om uw configuratie te implementeren en te beheren met Network ATC, waardoor de meeste configuratie-uitdagingen worden weggenomen waarop het hulpprogramma Validate-DCB controleert. Zie Hostnetwerken vereenvoudigen met Netwerk ATC voor meer informatie over Netwerk ATC, dat een op intentie gebaseerde benadering biedt voor het hosten van netwerkimplementatie.

Op het netwerk vereist Remote Direct Memory Access (RDMA) via Geconvergeerd Ethernet (RoCE) DCB-technologieën om de netwerkinfrastructuur verliesloos te maken. Met iWARP is DCB optioneel. Het configureren van DCB kan echter complex zijn, waarbij exacte configuratie is vereist voor:

  • Elke server in het cluster
  • Elke netwerkpoort die RDMA-verkeer doorgeeft op de infrastructuurinfrastructuur

Vereisten

  • Netwerkinstallatiegegevens van het servercluster dat u wilt valideren, waaronder:
    • Naam van host- of servercluster
    • Naam van virtuele switch
    • Namen van netwerkadapters
    • Instellingen voor Priority Flow Control (PFC) en Enhanced Transmission Selection (ETS)
  • Een internetverbinding voor het downloaden van de hulpprogrammamodule in Windows PowerShell van Microsoft.

Het hulpprogramma Validate-DCB installeren en uitvoeren

Het hulpprogramma Validate-DCB installeren en uitvoeren:

  1. Open op uw beheer-pc een Windows PowerShell-sessie als beheerder en gebruik vervolgens de volgende opdracht om het hulpprogramma te installeren.

    Install-Module Validate-DCB
    
  2. Accepteer de aanvragen om de NuGet-provider te gebruiken en toegang te krijgen tot de opslagplaats om het hulpprogramma te installeren.

  3. Nadat PowerShell verbinding heeft gemaakt met het Microsoft-netwerk om het hulpprogramma te downloaden, typt Validate-DCB u en drukt u op Enter om de wizard te starten.

    Notitie

    Als u het script Validate-DCB niet kunt uitvoeren, moet u mogelijk uw PowerShell-uitvoeringsbeleid aanpassen. Gebruik de cmdlet Get-ExecutionPolicy om uw huidige beleidsinstellingen voor het uitvoeren van scripts weer te geven. Zie Over uitvoeringsbeleid voor informatie over het instellen van uitvoeringsbeleid in PowerShell.

  4. Selecteer volgende op de pagina Welkom bij de wizard Validate-DCB-configuratie.

  5. Typ op de pagina Clusters en knooppunten de naam van het servercluster dat u wilt valideren, selecteer Oplossen om het op de pagina weer te geven en selecteer vervolgens Volgende.

    De pagina Clusters en knooppunten van de wizard Validate-DCB-configuratie

  6. Op de pagina Adapters:

    1. Schakel het selectievakje gekoppelde vSwitch in en typ de naam van de vSwitch.
    2. Typ onder Adapternaam de naam van elke fysieke NIC, onder Host vNIC-naam, de naam van elke virtuele NIC (vNIC) en onder VLAN de VLAN-id die voor elke adapter wordt gebruikt.
    3. Vouw de vervolgkeuzelijst RDMA-type uit en selecteer het juiste protocol: RoCE of iWARP. Stel Jumbo Frames ook in op de juiste waarde voor uw netwerk en selecteer volgende.

    De pagina Adapters van de wizard Validate-DCB-configuratie

    Notitie

  7. Wijzig op de pagina Data Center Bridging de waarden zodat deze overeenkomen met de instellingen van uw organisatie voor Prioriteit, Beleidsnaam en Bandbreedtereservering. Selecteer vervolgens Volgende.

    De pagina Data Center Bridging van de wizard Validate-DCB-configuratie

    Notitie

    Voor het selecteren van RDMA via RoCE op de vorige wizardpagina is DCB vereist voor netwerk betrouwbaarheid op alle NIC's en switchports.

  8. Sla op de pagina Opslaan en implementeren in het vak Pad van configuratiebestand het configuratiebestand met de extensie.ps1 op een locatie op waar u het indien nodig later opnieuw kunt gebruiken. Selecteer vervolgens Exporteren om het hulpprogramma Validate-DCB uit te voeren.

    • U kunt het configuratiebestand desgewenst implementeren door de sectie Configuratie implementeren op knooppunten van de pagina te voltooien. Dit omvat de mogelijkheid om een Azure Automation-account te gebruiken om de configuratie te implementeren en deze vervolgens te valideren. Zie Een Azure Automation-account maken om aan de slag te gaan met Azure Automation.

    De pagina Opslaan en implementeren van de wizard Validate-DCB-configuratie

Resultaten bekijken en fouten oplossen

Het hulpprogramma Validate-DCB produceert resultaten in twee eenheden:

  1. [Global Unit] results list prerequisites and requirements to run the modal tests.
  2. [Modal Unit] resultaten geven feedback over de configuratie en best practices van elke clusterhost.

In dit voorbeeld ziet u geslaagde scanresultaten van één server voor alle vereisten en modale eenheidstests door het aantal mislukte 0 aan te geven.

Testresultaten van De globale dcb-eenheid en modale eenheid valideren

De volgende stappen laten zien hoe u een Jumbo-pakketfout van vNIC SMB02 kunt identificeren en oplossen:

  1. De resultaten van de scans van het hulpprogramma Validate-DCB tonen de fout Mislukt aantal van 1.

    Scanresultaten van het hulpprogramma Validate-DCB met de fout Mislukt aantal van 1

  2. Als u terug door de resultaten bladert, ziet u een rode fout die aangeeft dat het Jumbo-pakket voor vNIC SMB02 op Host S046036 is ingesteld op de standaardgrootte van 1514, maar moet worden ingesteld op 9014.

    Scanresultaat van het hulpprogramma Validate-DCB met een fout bij het instellen van de jumbopakketgrootte

  3. Als u de geavanceerde eigenschappen van vNIC SMB02 op Host S046036 bekijkt, ziet u dat het Jumbo-pakket is ingesteld op de standaardwaarde Uitgeschakeld.

    De hyper-V geavanceerde eigenschappen van de serverhost Jumbo Pakketinstelling

  4. Als u de fout kunt oplossen, moet u de Jumbo Packet-functie inschakelen en de grootte wijzigen in 9014 bytes. Het opnieuw uitvoeren van de scan op de host S046036 bevestigt deze wijziging door het aantal mislukte pogingen van 0 te retourneren.

    Validate-DCB scanresultaten die bevestigen dat de instelling Jumbo Packet van de serverhost is opgelost

Zie de volgende video voor meer informatie over het oplossen van fouten die het hulpprogramma Validate-DCB identificeert.

U kunt het hulpprogramma ook offline installeren. Voor niet-verbonden systemen gebruikt Save-Module -Name Validate-DCB -Path c:\temp\Validate-DCB en verplaatst u de modules in c:\temp\Validate-DCB naar het niet-verbonden systeem. Bekijk de volgende video voor meer informatie.

Het cluster valideren

Gebruik de volgende stappen om de servers in een bestaand cluster in Windows Admin Center te valideren.

  1. Selecteer in Windows Admin Center onder Alle verbindingen het Azure Stack HCI-cluster dat u wilt valideren en selecteer vervolgens Verbinding maken.

    Op het dashboard Clusterbeheer wordt overzichtsinformatie over het cluster weergegeven.

  2. Selecteer op het dashboard Clusterbeheer onder Extra de optie Servers.

  3. Selecteer op de pagina Inventaris de servers in het cluster, vouw vervolgens het submenu Meer uit en selecteer Cluster valideren.

  4. Selecteer Ja in het pop-upvenster Cluster valideren.

    Pop-upvenster Cluster valideren

  5. Selecteer Ja in het pop-upvenster Credential Security Service Provider (CredSSP).

  6. Geef uw referenties op om CredSSP in te schakelen en selecteer vervolgens Doorgaan.
    Clustervalidatie wordt op de achtergrond uitgevoerd en krijgt u een melding wanneer deze is voltooid, waarna u het validatierapport kunt bekijken, zoals beschreven in de volgende sectie.

Notitie

Nadat uw clusterservers zijn gevalideerd, moet u CredSSP om veiligheidsredenen uitschakelen.

CredSSP uitschakelen

Nadat uw servercluster is gevalideerd, moet u het credSSP-protocol (Credential Security Support Provider) op elke server uitschakelen voor beveiligingsdoeleinden. Zie CVE-2018-0886 voor meer informatie.

  1. Selecteer in Windows Admin Center onder Alle verbindingen de eerste server in uw cluster en selecteer vervolgens Verbinding maken.

  2. Selecteer op de pagina Overzichtde optie CredSSP uitschakelenen selecteer vervolgens ja in het pop-upvenster CredSSP uitschakelen.

    Het resultaat van stap 2 verwijdert de rode banner CredSSP ENABLED boven aan de pagina Overzicht van de server en schakelt CredSSP op de andere servers uit.

Validatierapporten weergeven

U bent nu klaar om uw clustervalidatierapport weer te geven.

Er zijn een aantal manieren om toegang te krijgen tot validatierapporten:

  • Vouw op de pagina Inventaris het submenu Meer uit en selecteer validatierapporten weergeven.

  • Selecteer rechtsboven in Windows Admin Center het belpictogram Meldingen om het deelvenster Meldingen weer te geven. Selecteer de melding Geslaagd gevalideerd cluster en selecteer vervolgens Naar validatierapport failovercluster gaan.

Notitie

Het validatieproces van het servercluster kan enige tijd in beslag nemen. Schakel niet over naar een ander hulpprogramma in Windows Admin Center terwijl het proces wordt uitgevoerd. In het deelvenster Meldingen geeft een statusbalk onder de melding Cluster valideren aan wanneer het proces is voltooid.

Het cluster valideren met behulp van PowerShell

U kunt Windows PowerShell ook gebruiken om validatietests uit te voeren op uw servercluster en de resultaten weer te geven. U kunt tests uitvoeren voor en nadat een cluster is ingesteld.

Als u een validatietest wilt uitvoeren op een servercluster, geeft u de PowerShell-cmdlets Get-Cluster en Test-Cluster-server<clustername> uit vanaf uw beheer-pc of voert u alleen de cmdlet Test-Cluster rechtstreeks op het cluster uit:

$Cluster = Get-Cluster -Name 'server-cluster1'
Test-Cluster -InputObject $Cluster -Verbose

Zie de referentiedocumentatie voor Test-Cluster voor meer voorbeelden en gebruiksinformatie.

Test-NetStack is een op PowerShell gebaseerd testhulpprogramma dat beschikbaar is via GitHub dat u kunt gebruiken om ICMP-, TCP- en RDMA-verkeer van netwerken uit te voeren en mogelijke onjuiste configuraties van de netwerkinfrastructuur en host of operationele instabiliteit te identificeren. Gebruik Test-NetStack om netwerkgegevenspaden te valideren door systeemeigen, synthetische en hardware-offloaded (RDMA) netwerkgegevenspaden te testen op problemen met connectiviteit, pakketfragmentatie, lage doorvoer en congestie.

Replicatie valideren voor Opslagreplica

Als u Opslagreplica gebruikt om volumes te repliceren in een stretched cluster of cluster-naar-cluster, zijn er verschillende gebeurtenissen en cmdlets die u kunt gebruiken om de status van de replicatie op te halen.

In het volgende scenario hebben we Opslagreplica geconfigureerd door replicatiegroepen (RG's) voor twee sites te maken en vervolgens de gegevensvolumes en logboekvolumes op te geven voor de bronserverknooppunten in Site1 (Server1, Server2) en de doelserverknooppunten (gerepliceerd) in Site2 (Server3, Server4).

Als u de voortgang van de replicatie voor Server1 in Site1 wilt bepalen, voert u de opdracht Get-WinEvent uit en bekijkt u gebeurtenissen 5015, 5002, 5004, 1237, 5001 en 2200:

Get-WinEvent -ComputerName Server1 -ProviderName Microsoft-Windows-StorageReplica -max 20

Voer voor Server3 in Site2 de volgende Get-WinEvent opdracht uit om de opslagreplica-gebeurtenissen weer te geven die het maken van het partnerschap laten zien. In deze gebeurtenis wordt vermeld hoeveel bytes zijn gekopieerd en hoe lang dat heeft geduurd. Bijvoorbeeld:

Get-WinEvent -ComputerName Server3 -ProviderName Microsoft-Windows-StorageReplica | Where-Object {$_.ID -eq "1215"} | FL

Voer voor Server3 in Site2 de opdracht uit en bekijk gebeurtenissen Get-WinEvent 5009, 1237, 5001, 5015, 5005 en 2200 om de voortgang van de verwerking te begrijpen. Er mogen in deze reeks geen fouten worden gemeld. Er zullen veel 1237 gebeurtenissen zijn. Deze geven de voortgang aan.

Get-WinEvent -ComputerName Server3 -ProviderName Microsoft-Windows-StorageReplica | FL

De doelservergroep voor de replica geeft ook het aantal bytes op dat te allen tijde moet worden gekopieerd en kan worden opgevraagd via PowerShell met Get-SRGroup. Bijvoorbeeld:

(Get-SRGroup).Replicas | Select-Object numofbytesremaining

Voer voor knooppunt Server3 in Site2 de volgende opdracht uit en bekijk gebeurtenissen 5009, 1237, 5001, 5015, 5005 en 2200 om de voortgang van de replicatie te begrijpen. Er mogen geen waarschuwingen over fouten worden weergegeven. Er zullen echter veel '1237'-gebeurtenissen zijn. Deze geven alleen de voortgang aan.

Get-WinEvent -ComputerName Server3 -ProviderName Microsoft-Windows-StorageReplica | FL

Als een voortgangsscript dat niet wordt beëindigd:

while($true) {
$v = (Get-SRGroup -Name "Replication2").replicas | Select-Object numofbytesremaining
[System.Console]::Write("Number of bytes remaining: {0}`r", $v.numofbytesremaining)
Start-Sleep -s 5
}

Als u de replicatiestatus binnen het stretched cluster wilt ophalen, gebruikt Get-SRGroup u en Get-SRPartnership:

Get-SRGroup -Cluster ClusterS1
Get-SRPartnership -Cluster ClusterS1
(Get-SRGroup).replicas -Cluster ClusterS1

Zodra een geslaagde gegevensreplicatie tussen sites is bevestigd, kunt u uw VM's en andere workloads maken.

Zie ook