Verifiera ett Azure Stack HCI-kluster

Gäller för: Azure Stack HCI, versionerna 21H2 och 20H2; Windows Server 2022, Windows Server 2019

Guiden Skapa kluster i Windows Admin Center utför vissa verifieringar för att skapa ett fungerande kluster med den valda maskinvaran, men klusterverifieringen utför ytterligare kontroller för att se till att klustret fungerar i en produktionsmiljö. Den här artikeln fokuserar på varför klustervalidering är viktigt och när du ska köra det på ett Azure Stack HCI-kluster.

Vi rekommenderar att du utför klusterverifiering för följande primära scenarier:

  • När du har distribuerat ett serverkluster kör du verktyget Validate-DCB för att testa nätverk.
  • När du har uppdaterat ett serverkluster kan du, beroende på ditt scenario, köra båda valideringsalternativen för att felsöka klusterproblem.
  • När du har konfigurerat replikering med Storage Replica kontrollerar du att replikeringen fortsätter normalt genom att kontrollera vissa specifika händelser och köra några kommandon.
  • När du har skapat ett serverkluster kör du verktyget Validate-DCB innan du placerar det i produktion.

Vad är klusterverifiering?

Klustervalidering är avsett att fånga upp maskinvaru- eller konfigurationsproblem innan ett kluster försätts i produktion. Klustervalidering hjälper till att säkerställa att den Azure Stack HCI-lösning som du håller på att distribuera verkligen är tillförlitlig. Du kan också använda klusterverifiering på konfigurerade redundanskluster som ett diagnostikverktyg.

Specifika valideringsscenarier

I det här avsnittet beskrivs scenarier där validering också behövs eller är användbart.

  • Verifiering innan klustret har konfigurerats:

    • En uppsättning servrar som är redo att bli ett redundanskluster: Det här är det enklaste valideringsscenariot. Maskinvarukomponenterna (system, nätverk och lagring) är anslutna, men systemen fungerar ännu inte som ett kluster. Att köra tester i den här situationen påverkar inte tillgängligheten.

    • Virtuella serverdatorer: För virtualiserade servrar i ett kluster kör du klustervalidering på samma sätt som i andra nya kluster. Kravet på att köra funktionen är detsamma oavsett om du har:

      • Ett "värdkluster" där redundansväxling sker mellan två fysiska datorer.
      • Ett "gästkluster" där redundansväxling sker mellan gästoperativsystem på samma fysiska dator.
  • Verifiering när klustret har konfigurerats och används:

    • Innan du lägger till en server i klustret: När du lägger till en server i ett kluster rekommenderar vi starkt att du verifierar klustret. Ange både befintliga klustermedlemmar och den nya servern när du kör klustervalidering.

    • När du lägger till enheter: När du lägger till ytterligare enheter i klustret, som skiljer sig från att ersätta misslyckade enheter eller skapa virtuella diskar eller volymer som förlitar sig på de befintliga enheterna, kör du klustervalidering för att bekräfta att den nya lagringen fungerar korrekt.

    • När du gör ändringar som påverkar inbyggd programvara eller drivrutiner: Om du uppgraderar eller gör ändringar i klustret som påverkar inbyggd programvara eller drivrutiner måste du köra klustervalidering för att bekräfta att den nya kombinationen av maskinvara, inbyggd programvara, drivrutiner och programvara stöder redundansklusterfunktioner.

    • När du har återställt ett system från en säkerhetskopia: När du har återställt ett system från en säkerhetskopia kör du klustervalidering för att bekräfta att systemet fungerar som en del av ett kluster.

Verifiera nätverk

Microsoft Validate-DCB-verktyget är utformat för att verifiera konfigurationen av Data Center Bridging (DCB) i klustret. För att göra detta tar verktyget en förväntad konfiguration som indata och testar sedan varje server i klustret. Det här avsnittet beskriver hur du installerar och kör verktyget Validate-DCB, granskar resultaten och löser nätverksfel som verktyget identifierar.

Anteckning

Microsoft rekommenderar att du distribuerar och hanterar din konfiguration med Network ATC, vilket eliminerar de flesta konfigurationsutmaningar som validate-DCB-verktyget söker efter. Mer information om Network ATC, som tillhandahåller en avsiktsbaserad metod för värdnätverksdistribution, finns i Förenkla värdnätverk med Network ATC.

I nätverket kräver fjärråtkomst till direkt minne (RDMA) via konvergerat Ethernet (RoCE) DCB-teknik för att göra nätverksinfrastrukturen förlustfri. Med iWARP är DCB valfritt. Det kan dock vara komplicerat att konfigurera DCB, med exakt konfiguration som krävs för:

  • Varje server i klustret
  • Varje nätverksport som RDMA-trafik passerar via infrastrukturresurserna

Förutsättningar

  • Information om nätverkskonfiguration för det serverkluster som du vill verifiera, inklusive:
    • Värd- eller serverklusternamn
    • Namn på virtuell växel
    • Namn på nätverkskort
    • Inställningar för prioritetsflödeskontroll (PFC) och förbättrad överföringsval (ETS)
  • En Internetanslutning för att ladda ned verktygsmodulen i Windows PowerShell från Microsoft.

Installera och kör verktyget Validate-DCB

Så här installerar och kör du verktyget Validate-DCB:

  1. Öppna en Windows PowerShell session som administratör på hanteringsdatorn och använd sedan följande kommando för att installera verktyget.

    Install-Module Validate-DCB
    
  2. Godkänn begäranden om att använda NuGet-providern och få åtkomst till lagringsplatsen för att installera verktyget.

  3. När PowerShell ansluter till Microsoft-nätverket för att ladda ned verktyget skriver Validate-DCB du och trycker på Retur för att starta verktygsguiden.

    Anteckning

    Om du inte kan köra validerings-DCB-verktygsskriptet kan du behöva justera dina PowerShell-körningsprinciper. Använd cmdleten Get-ExecutionPolicy för att visa dina aktuella principinställningar för skriptkörning. Information om hur du anger körningsprinciper i PowerShell finns i Om körningsprinciper.

  4. På sidan Välkommen till konfigurationsguiden för Validate-DCB väljer du Nästa.

  5. På sidan Kluster och noder skriver du namnet på det serverkluster som du vill verifiera, väljer Lös för att visa det på sidan och väljer sedan Nästa.

    Sidan Kluster och noder i konfigurationsguiden Validate-DCB

  6. På sidan Kort:

    1. Markera kryssrutan vSwitch-ansluten och skriv namnet på vSwitch.
    2. Under Nätverkskortsnamn skriver du namnet på varje fysiskt nätverkskort under Värd-vNIC-namn, namnet på varje virtuellt nätverkskort (vNIC) och under VLAN används VLAN-ID:t för varje nätverkskort.
    3. Expandera listrutan RDMA-typ och välj lämpligt protokoll: RoCE eller iWARP. Ange även Jumbo-ramar till lämpligt värde för nätverket och välj sedan Nästa.

    Sidan Kort i konfigurationsguiden Validate-DCB

    Anteckning

  7. På sidan Data Center Bridging ändrar du värdena så att de matchar organisationens inställningar för Prioritet, Principnamn och Bandbreddsreservation och väljer sedan Nästa.

    Sidan Data Center Bridging i konfigurationsguiden Validate-DCB

    Anteckning

    Om du väljer RDMA över RoCE på föregående guidesida krävs DCB för nätverkstillförlitlighet på alla nätverkskort och switchportar.

  8. På sidan Spara och distribuera i rutan Sökväg för konfigurationsfil sparar du konfigurationsfilen med hjälp av ett .ps1-tillägg till en plats där du kan använda den igen senare om det behövs och väljer sedan Exportera för att börja köra verktyget Validate-DCB.

    • Om du vill kan du distribuera konfigurationsfilen genom att slutföra avsnittet Distribuera konfiguration till noder på sidan, vilket innefattar möjligheten att använda ett Azure Automation konto för att distribuera konfigurationen och sedan verifiera den. Se Skapa ett Azure Automation-konto för att komma igång med Azure Automation.

    Sidan Spara och distribuera i konfigurationsguiden för Validate-DCB

Granska resultat och åtgärda fel

Verktyget Validate-DCB ger resultat i två enheter:

  1. [Global enhet] resultat visar krav och krav för att köra modala tester.
  2. [Modal Unit]-resultat ger feedback om varje klustervärdkonfiguration och bästa praxis.

Det här exemplet visar lyckade genomsökningsresultat för en enskild server för alla krav och modala enhetstester genom att ange ett misslyckat antal 0.

Testresultat för validate-DCB Global enhet och modal enhet

Följande steg visar hur du identifierar ett Jumbo-paketfel från vNIC SMB02 och åtgärdar det:

  1. Resultatet av genomsökningarna av verktyget Validate-DCB visar felet Antal misslyckade på 1.

    Genomsökningsresultat för verktyget Validate-DCB som visar felet 1 för antal misslyckade försök

  2. När du bläddrar tillbaka genom resultaten visas ett fel i rött som anger att Jumbo-paketet för vNIC SMB02 på värd-S046036 har angetts till standardstorleken 1514, men bör anges till 9014.

    Genomsökningsresultatet för verktyget Validate-DCB visar ett fel i inställningen för jumbopaketstorlek

  3. Om du granskar avancerade egenskaper för vNIC SMB02 på värd-S046036 visas att Jumbo-paketet är inställt på standardvärdet Inaktiverad.

    Servervärdens avancerade Hyper-V-egenskaper, jumbopaketinställningen

  4. För att åtgärda felet krävs att funktionen Jumbo Packet aktiveras och dess storlek ändras till 9 014 byte. Om du kör genomsökningen igen på värden S046036 bekräftas den här ändringen genom att returnera ett misslyckat antal på 0.

    Valid-DCB-genomsökningsresultat som bekräftar att servervärdens jumbopaketinställning är fast

Mer information om hur du löser fel som identifieras av verktyget Validate-DCB finns i följande video.

Du kan också installera verktyget offline. För frånkopplade system använder Save-Module -Name Validate-DCB -Path c:\temp\Validate-DCB du och flyttar sedan modulerna i c:\temp\Validate-DCB till det frånkopplade systemet. Mer information finns i följande video.

Verifiera klustret

Använd följande steg för att verifiera servrarna i ett befintligt kluster i Windows Admin Center.

  1. I Windows Admin Center under Alla anslutningar väljer du det Azure Stack HCI-kluster som du vill verifiera och väljer sedan Anslut.

    Klusterhanterarens instrumentpanel visar översiktsinformation om klustret.

  2. Välj Servrar under Verktyginstrumentpanelen för Klusterhanteraren.

  3. På sidan Inventering väljer du servrarna i klustret, expanderar sedan undermenyn Mer och väljer Verifiera kluster.

  4. I popup-fönstret Verifiera kluster väljer du Ja.

    Validera popup-fönstret För kluster

  5. I popup-fönstret CredSSP (Credential Security Service Provider) väljer du Ja.

  6. Ange dina autentiseringsuppgifter för att aktivera CredSSP och välj sedan Fortsätt.
    Klustervalidering körs i bakgrunden och ger dig ett meddelande när det är klart. Då kan du visa valideringsrapporten enligt beskrivningen i nästa avsnitt.

Anteckning

När klusterservrarna har verifierats måste du inaktivera CredSSP av säkerhetsskäl.

Inaktivera CredSSP

När serverklustret har verifierats måste du inaktivera CredSSP-protokollet (CredSSP) för autentiseringsuppgifter på varje server i säkerhetssyfte. Mer information finns i CVE-2018-0886.

  1. I Windows Admin Center, under Alla anslutningar, väljer du den första servern i klustret och väljer sedan Anslut.

  2. På sidan Översikt väljer du Inaktivera CredSSP och väljer sedan Ja i popup-fönstret Inaktivera CredSSP.

    Resultatet av steg 2 tar bort den röda CredSSP ENABLED-banderollen överst på serverns översiktssida och inaktiverar CredSSP på de andra servrarna.

Visa valideringsrapporter

Nu är du redo att visa klustervalideringsrapporten.

Det finns några sätt att komma åt valideringsrapporter:

  • På sidan Inventering expanderar du undermenyn Mer och väljer sedan Visa valideringsrapporter.

  • Längst upp till höger i Windows Admin Center väljer du klockikonen Meddelanden för att visa fönstret Meddelanden. Välj meddelande om att klustret har verifierats och välj sedan Gå till verifieringsrapport för redundanskluster.

Anteckning

Valideringsprocessen för serverkluster kan ta lite tid att slutföra. Växla inte till ett annat verktyg i Windows Admin Center medan processen körs. I fönstret Meddelanden anger ett statusfält under meddelandet Verifiera kluster när processen är klar.

Verifiera klustret med PowerShell

Du kan också använda Windows PowerShell för att köra valideringstester på serverklustret och visa resultaten. Du kan köra tester både före och efter att ett kluster har konfigurerats.

Om du vill köra ett valideringstest på ett serverkluster utfärdar du Cmdletarna Get-Cluster och Test-Cluster<server clustername> PowerShell från hanteringsdatorn eller kör endast cmdleten Test-Cluster direkt i klustret:

$Cluster = Get-Cluster -Name 'server-cluster1'
Test-Cluster -InputObject $Cluster -Verbose

Fler exempel och användningsinformation finns i referensdokumentationen för testkluster .

Test-NetStack är ett PowerShell-baserat testverktyg som är tillgängligt från GitHub och som du kan använda för att utföra ICMP-, TCP- och RDMA-trafiktestning av nätverk och identifiera potentiella nätverksresurser och värdfelkonfigurationer eller driftinstabilitet. Använd Test-NetStack för att verifiera nätverksdatasökvägar genom att testa interna, syntetiska och maskinvaruavlastade nätverksdatasökvägar (RDMA) för problem med anslutning, paketfragmentering, lågt dataflöde och överbelastning.

Verifiera replikering för Storage Replica

Om du använder Storage Replica för att replikera volymer i ett sträckt kluster eller kluster till kluster finns det flera händelser och cmdletar som du kan använda för att hämta replikeringstillståndet.

I följande scenario konfigurerade vi Storage Replica genom att skapa replikeringsgrupper (RG:er) för två platser och sedan ange datavolymer och loggvolymer för både källservernoderna på Plats1 (Server1, Server2) och målservernoderna (replikerade) på Plats2 (Server3, Server4).

Om du vill fastställa replikeringsstatusen för Server1 på Plats1 kör du kommandot Get-WinEvent och undersöker händelserna 5015, 5002, 5004, 1237, 5001 och 2200:

Get-WinEvent -ComputerName Server1 -ProviderName Microsoft-Windows-StorageReplica -max 20

För Server3 i Site2 kör du följande Get-WinEvent kommando för att se de Storage Replica-händelser som visar skapandet av partnerskapet. Den här händelsen anger antalet kopierade byte och hur lång tid det tog. Ett exempel:

Get-WinEvent -ComputerName Server3 -ProviderName Microsoft-Windows-StorageReplica | Where-Object {$_.ID -eq "1215"} | FL

För Server3 på Plats2 kör Get-WinEvent du kommandot och undersöker händelserna 5009, 1237, 5001, 5015, 5005 och 2200 för att förstå bearbetningens förlopp. Det ska inte finnas några varningar om fel i sekvensen. Det kommer att finnas många 1237 händelser - dessa indikerar förlopp.

Get-WinEvent -ComputerName Server3 -ProviderName Microsoft-Windows-StorageReplica | FL

Alternativt anger målservergruppen för repliken antalet byte som ska kopieras hela tiden och kan efterfrågas via PowerShell med Get-SRGroup. Ett exempel:

(Get-SRGroup).Replicas | Select-Object numofbytesremaining

För noden Server3 på Plats2 kör du följande kommando och undersöker händelserna 5009, 1237, 5001, 5015, 5005 och 2200 för att förstå replikeringsstatusen. Det bör inte finnas några varningar om fel. Det kommer dock att finnas många "1237"-händelser - dessa indikerar helt enkelt förlopp.

Get-WinEvent -ComputerName Server3 -ProviderName Microsoft-Windows-StorageReplica | FL

Som ett förloppsskript som inte avslutas:

while($true) {
$v = (Get-SRGroup -Name "Replication2").replicas | Select-Object numofbytesremaining
[System.Console]::Write("Number of bytes remaining: {0}`r", $v.numofbytesremaining)
Start-Sleep -s 5
}

Om du vill hämta replikeringstillståndet i det utsträckta klustret använder du Get-SRGroup och Get-SRPartnership:

Get-SRGroup -Cluster ClusterS1
Get-SRPartnership -Cluster ClusterS1
(Get-SRGroup).replicas -Cluster ClusterS1

När lyckad datareplikering har bekräftats mellan platser kan du skapa dina virtuella datorer och andra arbetsbelastningar.

Se även