Clusters bewaken met de Health Service

Van toepassing op: Azure Stack HCI, versies 23H2 en 22H2; Windows Server 2022, Windows Server 2019, Windows Server 2016

Health Service, voor het eerst uitgebracht in Windows Server 2016, verbetert de dagelijkse bewakings- en operationele ervaring voor clusters die Opslagruimten Direct worden uitgevoerd.

Vereisten

Health Service is standaard ingeschakeld bij Opslagruimten Direct. Er is geen verdere actie vereist om de service in te stellen of te starten. Zie het overzicht van Opslagruimten Direct voor meer informatie over Opslagruimten Direct.

Geschiedenis van clusterprestaties

Haal live prestatie- en capaciteitsinformatie op uit uw Opslagruimten Direct cluster. Zie Prestatiegeschiedenis van het cluster ophalen.

Health Service-fouten

Geef eventuele huidige fouten weer om eenvoudig de status van uw implementatie te controleren. Zie Health Service-fouten weergeven.

Health Service-acties

De voortgang bijhouden van Health Service-acties die autonoom worden uitgevoerd. Zie Health Service-acties bijhouden.

Automation

In deze sectie worden de werkstromen beschreven die door Health Service worden geautomatiseerd in de levenscyclus van de schijf.

Levenscyclus van schijf

Health Service automatiseert de meeste fasen van de levenscyclus van de fysieke schijf. We gaan ervan uit dat uw implementatie zich aanvankelijk in een perfecte staat bevindt. Dat wil zeggen dat alle fysieke schijven goed werken.

Buiten gebruik stellen

Fysieke schijven worden automatisch buiten gebruik gesteld wanneer ze niet langer kunnen worden gebruikt en een overeenkomstige fout wordt gegenereerd. Dit kan voorkomen in verschillende situaties:

  • Een defecte schijf: de fysieke schijf heeft een onherstelbare beschadiging of is gebroken en moet worden vervangen.
  • Een verbroken verbinding: de verbinding met de fysieke schijf is langer dan 15 minuten achter elkaar verbroken.
  • De fysieke schijf reageert niet: er is voor de fysieke schijf drie of meer keer binnen een uur een wachttijd opgetreden van meer dan 5 seconden.

Notitie

Als de verbinding voor veel fysieke schijven tegelijkertijd, of op een heel knooppunt of voor een complete opslagbehuizing, is verbroken, worden deze schijven niet buiten gebruik gesteld door Health Service omdat ze waarschijnlijk niet de hoofdoorzaak van het probleem zijn.

Als de buiten gebruik gestelde schijf als de cache voor veel andere fysieke schijven fungeerde, worden deze automatisch aan een andere cacheschijf toegewezen, als deze beschikbaar is. De gebruiker hoeft verder geen speciale actie te ondernemen.

De tolerantie herstellen

Wanneer een fysieke schijf eenmaal buiten gebruik is gesteld, begint Health Service onmiddellijk de gegevens naar de resterende fysieke schijven te kopiëren om de volledige tolerantie te herstellen. Zodra dit is voltooid, zijn de gegevens volledig veilig en is de fouttolerantie weer hersteld.

Notitie

Voor deze onmiddellijke herstelbewerking moet voldoende capaciteit beschikbaar zijn op de resterende fysieke schijven.

Het controlelampje laten knipperen

Indien mogelijk laat Health Service het controlelampje knipperen op de buiten gebruik gestelde fysieke schijf of op de bijbehorende sleuf. Dit lampje blijft knipperen totdat de buiten gebruik gestelde schijf is vervangen.

Notitie

In sommige gevallen kan de schijf zodanig defect zijn dat zelfs het controlelampje niet functioneert, bijvoorbeeld bij een totale stroomuitval.

Vervanging van de fysieke schijf

U moet de buiten gebruik gestelde fysieke schijf vervangen wanneer dit mogelijk is. Meestal bestaat dit uit een hot-swap, dat wil zeggen dat het uitschakelen van het knooppunt of de opslagbehuizing niet vereist is. Raadpleeg de fout voor nuttige informatie over de locatie en het onderdeel.

Verificatie

Wanneer de vervangende schijf wordt geplaatst, wordt deze gecontroleerd op basis van het document Ondersteunde onderdelen (zie de volgende sectie).

In een groep plaatsen

Indien toegestaan, wordt de vervangende schijf automatisch in de groep van de vervangen schijf geplaatst en daar in gebruik genomen. Op dat moment is de oorspronkelijke staat met een perfecte status hersteld en verdwijnt de fout.

Document ondersteunde onderdelen

Health Service biedt een afdwingingsmechanisme om de onderdelen die door Opslagruimten Direct worden gebruikt, te beperken tot die in een document met ondersteunde onderdelen dat wordt verstrekt door de beheerder of leverancier van de oplossing. Er kan hiermee worden voorkomen dat door u of anderen abusievelijk gebruik wordt gemaakt van niet-ondersteunde hardware, Dit kan van voordeel zijn bij het naleven van een garantie- of ondersteuningscontract. Deze functionaliteit is momenteel beperkt tot fysieke schijfapparaten, waaronder SSDs, HDD's en NVMe-stations. Het document Ondersteunde onderdelen kan beperkingen voor model, fabrikant (optioneel) en firmwareversie (optioneel) beperken.

Gebruik

Het document Ondersteunde onderdelen gebruikt een op XML geïnspireerde syntaxis. We raden u aan uw favoriete teksteditor te gebruiken, zoals de gratis Visual Studio Code of Kladblok, om een XML-document te maken dat u kunt opslaan en opnieuw kunt gebruiken.

Secties

Het document heeft twee onafhankelijke secties: Disks en Cache.

Als de Disks sectie is opgegeven, mogen alleen de stations die worden vermeld (als Disk) lid worden van pools. Niet-vermelde stations kunnen niet worden gekoppeld aan pools, waardoor het gebruik ervan in de productie effectief wordt uitgesloten. Als deze sectie leeg blijft, mag elk station lid worden van pools.

Als de Cache sectie wordt opgegeven, worden alleen de stations die worden vermeld (als CacheDisk) gebruikt voor caching. Als deze sectie leeg blijft, probeert Opslagruimten Direct te raden op basis van mediatype en bustype. Stations die hier worden vermeld, moeten ook worden vermeld in Disks.

Belangrijk

Het document Ondersteunde onderdelen is niet met terugwerkende kracht van toepassing op stations die al zijn gegroepeerd en in gebruik zijn.

Voorbeeld

<Components>

  <Disks>
    <Disk>
      <Manufacturer>Contoso</Manufacturer>
      <Model>XYZ9000</Model>
      <AllowedFirmware>
        <Version>2.0</Version>
        <Version>2.1</Version>
        <Version>2.2</Version>
      </AllowedFirmware>
      <TargetFirmware>
        <Version>2.1</Version>
        <BinaryPath>C:\ClusterStorage\path\to\image.bin</BinaryPath>
      </TargetFirmware>
    </Disk>
    <Disk>
      <Manufacturer>Fabrikam</Manufacturer>
      <Model>QRSTUV</Model>
    </Disk>
  </Disks>

  <Cache>
    <CacheDisk>
      <Manufacturer>Fabrikam</Manufacturer>
      <Model>QRSTUV</Model>
    </CacheDisk>
  </Cache>

</Components>

Als u meerdere stations wilt weergeven, voegt u gewoon extra <Disk> of <CacheDisk> tags toe.

Als u deze XML wilt injecteren bij het implementeren van Opslagruimten Direct, gebruikt u de -XML parameter :

$MyXML = Get-Content <Filepath> | Out-String
Enable-ClusterS2D -XML $MyXML

Het document Ondersteunde onderdelen instellen of wijzigen nadat Opslagruimten Direct is geïmplementeerd:

$MyXML = Get-Content <Filepath> | Out-String
Get-StorageSubSystem Cluster* | Set-StorageHealthSetting -Name "System.Storage.SupportedComponents.Document" -Value $MyXML

Notitie

De eigenschappen voor model, fabrikant en firmwareversie moeten exact overeenkomen met de waarden die u ophaalt met de cmdlet Get-PhysicalDisk. Dit kan afwijken van uw logische verwachtingen, afhankelijk van de implementatie van uw leverancier. Zo kan bijvoorbeeld voor de fabrikant CONTOSO-LTD in plaats van Contoso zijn weergegeven en kan het veld voor het model leeg zijn terwijl dit Contoso-XZY9000 is.

U kunt een controle uitvoeren met de volgende PowerShell-cmdlet:

Get-PhysicalDisk | Select Model, Manufacturer, FirmwareVersion

Health Service-instellingen

Wijzig Health Service-instellingen om de agressiviteit van fouten of acties af te stemmen, bepaald gedrag in of uit te schakelen en meer. Zie Instellingen voor Health Service wijzigen.

Aanvullende verwijzingen