Überwachen von Clustern mit dem Integritätsdienst

Gilt für: Azure Stack HCI, Versionen 23H2 und 22H2; Windows Server 2022, Windows Server 2019, Windows Server 2016

Der Integritätsdienst wurde erstmals in Windows Server 2016 veröffentlicht und optimiert die tägliche Überwachung und den Betrieb von Clustern, in denen „Direkte Speicherplätze“ ausgeführt wird.

Voraussetzungen

Für „Direkte Speicherplätze“ ist der Integritätsdienst standardmäßig aktiviert. Für seine Einrichtung und seinen Start sind keine weiteren Aktionen erforderlich. Weitere Informationen zu „Direkte Speicherplätze“ finden Sie in der Übersicht über „Direkte Speicherplätze“.

Clusterleistungsverlauf

Hier können Sie Liveinformationen zur Leistung und Kapazität aus Ihrem Cluster vom Typ „Direkte Speicherplätze“ abrufen. Weitere Informationen finden Sie unter Abrufen des Clusterleistungsverlaufs.

Integritätsdienstfehler

Hier können Sie alle aktuellen Fehler anzeigen und mühelos die Integrität Ihrer Bereitstellung überprüfen. Weitere Informationen finden Sie unter Anzeigen von Integritätsdienstfehlern.

Nachverfolgen von Aktionen des Integritätsdiensts

Hier können Sie den Fortschritt autonom ausgeführter Aktionen des Integritätsdiensts nachverfolgen. Weitere Informationen finden Sie unter Nachverfolgen von Aktionen des Integritätsdiensts.

Automation

Im nächsten Abschnitt werden Workflows beschrieben, die vom Integritätsdienst im Lebenszyklus von Datenträgern automatisiert werden.

Lebenszyklus von Datenträgern

Der Integritätsdienst automatisiert die meisten Phasen des Lebenszyklus physischer Datenträger. Angenommen, der Ausgangsstatus Ihrer Bereitstellung ist eine perfekte Integrität, was heißt, dass alle physischen Datenträger ordnungsgemäß funktionieren.

Außerkraftsetzung

Physische Datenträger werden automatisch deaktiviert, wenn sie nicht mehr verwendet werden können, woraufhin ein entsprechender Fehler ausgelöst wird. Es gibt mehrere Fälle:

  • Medienfehler: Der physische Datenträger ist definitiv ausgefallen oder beschädigt und muss ausgetauscht werden.
  • Kommunikationsverlust: Der physische Datenträger hatte 15 Minuten lang keine Verbindung.
  • Keine Reaktion: Der physische Datenträger hatte binnen einer Stunde dreimal oder öfter eine Latenz von 5,0 Sekunden zu verzeichnen.

Hinweis

Wenn die Verbindung mit zahlreichen physischen Datenträgern gleichzeitig bzw. mit einem gesamten Knoten oder Speichergehäuse verloren geht, werden diese Datenträger vom Integritätsdienst nicht deaktiviert, weil sie wahrscheinlich nicht die Ursache sind.

Wenn der deaktivierte Datenträger als Cache für viele andere physische Datenträger fungiert hat, werden diese, sofern verfügbar, automatisch einem anderen Cachedatenträger neu zugewiesen. Es ist keine spezielle Benutzeraktion erforderlich.

Wiederherstellen der Ausfallsicherheit

Nachdem ein physischer Datenträger deaktiviert wurde, beginnt der Integritätsdienst sofort mit dem Kopieren seiner Daten auf die restlichen physischen Datenträger, um die vollständige Ausfallsicherheit wiederherzustellen. Sobald dies abgeschlossen ist, sind die Daten vollständig sicher und wieder fehlertolerant.

Hinweis

Die sofortige Wiederherstellung erfordert ausreichend verfügbare Kapazität auf den verbleibenden physischen Datenträgern.

Blinken der Leuchte

Falls möglich, aktiviert der Integritätsdienst das Blinken der Leuchte auf dem deaktivierten physischen Datenträger oder an seinem Steckplatz. Dies wird dauerhaft fortgesetzt, bis der deaktivierte Datenträger ausgetauscht wird.

Hinweis

Mitunter kann der Datenträger ggf. auf eine Weise ausfallen, die selbst das Funktionieren der Leuchte verhindert, z. B. beim Totalausfall des Stroms.

Physischer Austausch

Nach Möglichkeit sollten Sie den deaktivierten physischen Datenträger austauschen. In den meisten Fällen erfolgt hierfür ein Austausch bei laufendem Betrieb, d. h. das Ausschalten des Knotens oder Speichergehäuses ist nicht erforderlich. In den Informationen zum Fehler finden Sie hilfreiche Angaben zu Stelle und Teil.

Überprüfung

Wenn der Ersatzdatenträger eingesetzt wird, wird er anhand des Dokuments mit unterstützten Komponenten überprüft (siehe nächster Abschnitt).

Pooling

Falls zulässig, wird der Austauschdatenträger automatisch dem Pool seines Vorgängers hinzugefügt, um den Betrieb aufzunehmen. Sobald der Fehler verschwunden ist, wird das System in seinen Ausgangszustand mit perfekter Integrität zurückgesetzt.

Dokument mit unterstützten Komponenten

Der Integritätsdienst stellt einen Erzwingungsmechanismus zur Verfügung, um die von „Direkte Speicherplätze“ verwendeten Komponenten auf die Komponenten in einem Dokument mit unterstützten Komponenten zu beschränken, das vom Administrator oder Lösungsanbieter bereitgestellt wird. Diese kann verwendet werden, um eine versehentliche Nutzung nicht unterstützter Hardware durch Sie oder andere zu verhindern, sodass Garantie- und Supportvertragsbedingungen besser eingehalten werden. Diese Funktionalität ist derzeit auf Geräte mit physischen Datenträgern wie SSD-, HDD- und NVMe-Laufwerke beschränkt. Das Dokument mit unterstützten Komponenten kann auf Modell, Hersteller (optional) und Firmwareversion (optional) beschränkt werden.

Verwendung

Das Dokument mit unterstützten Komponenten verwendet eine von XML inspirierte Syntax. Es wird empfohlen, den bevorzugten Text-Editor (z. B. den kostenlosen Editor Visual Studio Code oder Windows-Editor) für die Erstellung eines XML-Dokuments zu verwenden, das Sie speichern und wiederverwenden können.

Abschnitte

Das Dokument enthält zwei unabhängige Abschnitte: Disks und Cache.

Wird der Abschnitt Disks angegeben, dürfen nur die aufgeführten Laufwerke (als Disk) Pools beitreten. Das Hinzufügen nicht aufgeführter Laufwerke zu Pools wird verhindert, sodass sie nicht in der Produktionsumgebung eingesetzt werden können. Wenn dieser Abschnitt leer gelassen wird, dürfen alle Laufwerke Pools beitreten.

Wird der Abschnitt Cache angegeben, dürfen nur die aufgeführten Laufwerke (als CacheDisk) zum Zwischenspeichern verwendet werden. Wenn dieser Abschnitt leer gelassen wird, versucht „Direkte Speicherplätze“, anhand des Medientyps und des Bustyps eine Schätzung vorzunehmen. Die hier aufgeführten Laufwerke sollten auch in Disks aufgeführt sein.

Wichtig

Das Dokument mit unterstützten Komponenten gilt nicht rückwirkend für Laufwerke, die bereits zu einem Pool gehören und genutzt werden.

Beispiel

<Components>

  <Disks>
    <Disk>
      <Manufacturer>Contoso</Manufacturer>
      <Model>XYZ9000</Model>
      <AllowedFirmware>
        <Version>2.0</Version>
        <Version>2.1</Version>
        <Version>2.2</Version>
      </AllowedFirmware>
      <TargetFirmware>
        <Version>2.1</Version>
        <BinaryPath>C:\ClusterStorage\path\to\image.bin</BinaryPath>
      </TargetFirmware>
    </Disk>
    <Disk>
      <Manufacturer>Fabrikam</Manufacturer>
      <Model>QRSTUV</Model>
    </Disk>
  </Disks>

  <Cache>
    <CacheDisk>
      <Manufacturer>Fabrikam</Manufacturer>
      <Model>QRSTUV</Model>
    </CacheDisk>
  </Cache>

</Components>

Um mehrere Laufwerke auflisten zu können, fügen Sie einfach zusätzliche Tags vom Typ <Disk> oder <CacheDisk> hinzu.

Verwenden Sie den Parameter -XML, um diesen XML-Code beim Bereitstellen von „Direkte Speicherplätze“ einzufügen:

$MyXML = Get-Content <Filepath> | Out-String
Enable-ClusterS2D -XML $MyXML

So legen Sie das Dokument mit unterstützten Komponenten fest oder ändern es, wenn „Direkte Speicherplätze“ bereitgestellt wurde:

$MyXML = Get-Content <Filepath> | Out-String
Get-StorageSubSystem Cluster* | Set-StorageHealthSetting -Name "System.Storage.SupportedComponents.Document" -Value $MyXML

Hinweis

Die Eigenschaften „Model“, „Manufacturer“ und „FirmwareVersion“ müssen exakt mit den Werten übereinstimmen, die Sie mit dem Cmdlet Get-PhysicalDisk abrufen. Je nach Implementierung des Herstellers weichen diese von Ihren Erwartungen ab. Anstatt „Contoso“ kann der Hersteller (Manufacturer) „CONTOSO-LTD“ heißen, oder dieser Eintrag ist leer, während das Modell „Contoso-XZY9000“ ist.

Sie können dies mit dem folgenden PowerShell-Cmdlet überprüfen:

Get-PhysicalDisk | Select Model, Manufacturer, FirmwareVersion

Ändern der Integritätsdiensteinstellungen

Durch Ändern der Integritätsdiensteinstellungen können Sie unter anderem die Aggressivität von Fehlern oder Aktionen anpassen oder bestimmte Verhaltensweisen aktivieren bzw. deaktivieren. Weitere Informationen finden Sie unter Ändern der Integritätsdiensteinstellungen.

Zusätzliche Referenzen