Freigeben über


Verstehen und Überwachen der Speicherneusynchronisierung

Gilt für: Azure Stack HCI, Versionen 22H2 und 21H2; Windows Server 2022, Windows Server 2019

Die Benachrichtigung über die erneute Speichersynchronisierung ist eine Funktion von "Direkte Speicherplätze" in Azure Stack HCI und Windows Server. Dies ermöglicht dem Integritätsdienst, einen Fehler auszulösen, mit dem Sie über die erneute Synchronisierung benachrichtigt werden. Dadurch können Sie verhindern, dass versehentlich weitere Server abgeschaltet werden, was sich auf mehrere Fehlerdomänen auswirken könnte und dazu führt, dass Ihr Cluster ausfällt.

Dieser Artikel enthält eine Übersicht über die Speicher-Resynchronisierung und wie Sie diese in einem Failovercluster mit Storage Spaces Direct überwachen können.

Informationen zur Speicher-Resynchronisierung

Beginnen wir mit einem einfachen Beispiel, um zu verstehen, wie Speicher außer Takt geraten könnte. Beachten Sie, dass alle nicht geteilten (nur lokale Laufwerke) verteilten Speicherlösungen dieses Verhalten aufweisen. Im folgenden Abschnitt wird demonstriert, wie der Speicher aus dem Takt gerät, wenn ein Server-Node ausfällt. Die Laufwerke werden erst aktualisiert, wenn sie wieder online sind – dieses Verhalten gilt für jede hyperkonvergente Architektur.

Angenommen, Sie möchten die Zeichenfolge "HELLO" speichern.

Abbildung des ASCII -Codes einer Zeichenfolge „hello“

Wenn Sie über Resilienz mit Drei-Wege-Spiegelung verfügen, haben Sie drei Kopien dieser Zeichenfolge. Wenn Sie Server #1 vorübergehend (zur Wartung) außer Betrieb nehmen, können Sie nicht auf Instanz Nr. 1 zugreifen.

Abbildung, die zeigt, dass Sie nicht auf Kopie Nummer 1 zugreifen können, wenn Sie Server Nr. 1 abschalten.

Angenommen, Sie aktualisieren die Zeichenfolge von „HELLO“ zu diesem Zeitpunkt in „HELP!“.

Abbildung des ASCII-Codes einer Zeichenfolge „help!“

Nachdem Sie die Zeichenfolge aktualisiert haben, werden die Kopien 2 und 3 erfolgreich aktualisiert. Auf "Copy #1" kann jedoch nicht zugegriffen werden, da server #1 vorübergehend deaktiviert ist (zur Wartung).

GIF des Schreibens in Kopie 2 und 3

Sie haben jetzt Kopie #1 mit nicht synchronisierten Daten. Das Betriebssystem verwendet eine differenzierte Nachverfolgung von schmutzigen Regionen, um die nicht synchronisierten Bits nachzuverfolgen. Auf diese Weise können Sie, wenn Server Nr. 1 online ist, die Änderungen synchronisieren, indem Sie die Daten aus Kopie #2 oder #3 lesen und die Daten in Kopie #1 überschreiben. Bei diesem Ansatz müssen Sie nur die veralteten Daten kopieren, anstatt alle Daten von Server #2 oder Server #3 neu zu synchronisieren.

GIF des Überschreibens in Kopie 1

Im vorherigen Abschnitt wird beschrieben, wie Daten nicht mehr synchronisiert werden können. Aber wie sieht dies auf hoher Ebene aus? Angenommen, Sie haben einen hyperkonvergenten Cluster mit drei Servern. Wenn sich Server Nr. 1 in der Wartung befindet, sehen Sie, dass sie nicht mehr funktioniert. Wenn Sie Server Nr. 1 wieder hochfahren, wird sein gesamter Speicherplatz mithilfe der granularen Nachverfolgung des schmutzigen Bereichs neu synchronisiert (im vorherigen Abschnitt erläutert). Sobald die Daten wieder synchronisiert sind, werden alle Server als betriebsbereit angezeigt.

Das folgende GIF zeigt, wie die Speicher resync in einem hyperkonvergenten Cluster funktioniert:

GIF der Administratoransicht der erneuten Synchronisierung.

So überwachen Sie die Erneute Synchronisierung des Speichers

Ab Windows Server 2019 wurde dem Integritätsdienst ein neuer Fehler hinzugefügt, der angezeigt wird, wenn der Speicher erneut synchronisiert wird.

Führen Sie das folgende Cmdlet aus, um diesen Fehler in PowerShell anzuzeigen:

Get-HealthFault

Dieser neue Fehler wird in PowerShell, im Clusterüberprüfungsbericht und an anderen Stellen angezeigt, die auf Integritätsfehlern basieren.

Um eine tiefere Ansicht zu erhalten, können Sie die Zeitreihendatenbank in PowerShell wie folgt abfragen:

Get-ClusterNode | Get-ClusterPerf -ClusterNodeSeriesName ClusterNode.Storage.Degraded

Hier ist ein Beispiel für das Ergebnis:

Object Description: ClusterNode Server1

Series                       Time                Value Unit
------                       ----                ----- ----
ClusterNode.Storage.Degraded 01/11/2019 16:26:48     214 GB

Windows Admin Center verwendet Integritätsfehler, um den Status und die Farbe der Clusterknoten festzulegen. Auf dem HCI-Dashboard ermöglicht dieser neue Fehler einen Clusterknoten-Farbübergang von Rot (heruntergefahren) zu Gelb (wird neu synchronisiert) zu Grün (hochgefahren) statt eines direkten Wechsels von Rot zu Grün.

Die folgende Abbildung vergleicht den Fortschritt der Speicher resync in Windows Server 2016 und Windows Server 2019.

Abbildung der Ansichten unter Windows Server 2016 und Window Server 2019 bei der erneuten Synchronisierung

Indem Sie den gesamten Fortschritt der Resynchronisierung des Speichers anzeigen, können Sie genau wissen, wie viele Daten nicht synchronisiert sind und ob Ihr System Fortschritte macht. Wechseln Sie im Windows Admin Center zum Dashboard , um die neue Warnung anzuzeigen, wie im folgenden Screenshot gezeigt:

Bildschirmaufnahme der Warnung im Windows Admin Center.

Die Warnung ist hilfreich, um Sie zu benachrichtigen, wenn eine erneute Synchronisierung stattfindet, sodass Sie nicht versehentlich mehr Server abschalten (was dazu führen kann, dass mehrere Fehlerdomänen betroffen sind und Ihr Cluster ausfällt).

Um eine detaillierte Ansicht zu erhalten, wie der Speicherneuabgleich pro Server im Windows Admin Center erscheint, navigieren Sie zur Seite Server, klicken Sie auf Bestand, und wählen Sie dann einen bestimmten Server aus. Navigieren Sie zu Ihrem Server, und sehen Sie sich das Speicherdiagramm an, um die Datenmenge anzuzeigen, die in einer violetten Linie mit einer genauen Zahl direkt darüber repariert werden muss. Dieser Wert erhöht sich, wenn der Server heruntergefahren ist (mehr Daten müssen neu synchronisiert werden), und er verringert sich schrittweise, wenn der Server wieder online ist (Daten werden synchronisiert). Wenn die Datenmenge, die repariert werden muss, null ist, ist die Synchronisierung des Speichers abgeschlossen, und Sie können jetzt einen Server herunterfahren, wenn Sie dies benötigen.

Der folgende Screenshot zeigt die Serveransicht im Windows Admin Center an:

Bildschirmaufnahme der Serveransicht im Windows Admin Center.

So überwachen Sie die Erneute Synchronisierung von Speicher in Windows Server 2016

Die in Windows Server 2019 und höher verfügbare Warnung ist hilfreich, um einen ganzheitlichen Überblick darüber zu erhalten, was auf der Speicherebene geschieht. Es fasst die Informationen zusammen, die Sie aus dem Get-StorageJob Cmdlet abrufen können. Dieses Cmdlet gibt Informationen zu lange ausgeführten Speichermodulaufträgen zurück, z. B. einen Reparaturvorgang für einen Speicherplatz, wie in der folgenden Beispielausgabe gezeigt.

Get-StorageJob

Hier ist eine Beispielausgabe:

Name                  ElapsedTime           JobState              PercentComplete       IsBackgroundTask
----                  -----------           --------              ---------------       ----------------
Regeneration          00:01:19              Running               50                    True

Diese Ansicht ist präziser, da die Speicheraufträge pro Volume aufgelistet werden. Sie können die Liste der ausgeführten Aufträge anzeigen und deren individuellen Fortschritt nachverfolgen. Dieses Cmdlet funktioniert sowohl für Windows Server 2016 als auch für 2019.

Weitere Verweise