Freigeben über


Integritätsverwaltung für PMEM

Dieser Artikel enthält Informationen zur Fehlerbehandlung und Integritätsverwaltung für PMEM-Geräte (persistenter Speicher), die häufig als Speicherklassenspeicher (Storage-Class Memory, SCM) bezeichnet werden. Hierbei handelt es sich um eine Art von nicht-flüchtigen Medien, die als Speicher der obersten Ebene verwendet werden können.

Diese kurzen Videos bieten eine Übersicht über die Windows-Unterstützung für PMEM:

Siehe auch Grundlagen und Bereitstellung des persistenten Speichers.

PMEM-Geräte werden ab Windows Server 2016 und Windows 10 (Version 1607) mit nativen Treibern unterstützt. PMEM-Geräte verhalten sich zwar ähnlich wie andere Datenträger (HDDs und SSDs), es gibt jedoch auch einige Unterschiede.

Häufig werden zwei PMEM-Module als gespiegeltes Zurückschreibcache in einem Speicherplatz verwendet. Informationen zum Einrichten einer solchen Konfiguration finden Sie unter Konfigurieren von Speicherplätzen mit NVDIMM-N-Zurückschreibcache.

In Windows Server 2016 zeigt die GUI für Speicherplätze den NVDIMM-N-Bustyp als UNBEKANNT an. Hier gibt es keinen Verlust von Funktionen oder der Möglichkeit zur Erstellung von Pools, Speicher-VD. Durch die Ausführung des folgenden Cmdlet können Sie den Bustyp überprüfen:

Get-PhysicalDisk | fl

Der Parameter BusType in der Ausgabe zeigt den Bustyp ordnungsgemäß als SCM an.

Anzeigen des PMEM-Integritätsstatus

In diesem Abschnitt wird beschrieben, wie Sie sich den Integritätsstatus Ihrer PMEM-Module anzeigen lassen. Bei der Verwendung von persistentem Speicher gibt es einige Unterschiede in der Überwachung:

  • Persistenter Speicher erstellt keine Performance-Counter für physische Datenträger, sodass er nicht in den Diagrammen des Windows Admin Centers angezeigt wird.
  • Persistenter Speicher erstellt keine Storport 505-Daten, sodass Ausreißer nicht proaktiv erkannt werden können.

Ansonsten ist die Überwachung jedoch mit der von anderen physischen Datenträgern identisch.

Sie können die Integrität eines PMEM-Disks abfragen, indem Sie die folgenden Cmdlets ausführen:

Get-PmemDisk

DiskNumber Size   HealthStatus AtomicityType CanBeRemoved PhysicalDeviceIds UnsafeShutdownCount
---------- ----   ------------ ------------- ------------ ----------------- -------------------
2          252 GB Unhealthy    None          True         {20, 120}         2
3          252 GB Healthy      None          True         {1020, 1120}      0

Get-PmemDisk | Get-PhysicalDisk | select SerialNumber, HealthStatus, OperationalStatus, OperationalDetails

SerialNumber               HealthStatus OperationalStatus  OperationalDetails
------------               ------------ ------------------ ------------------
802c-01-1602-117cb5fc      Healthy      OK
802c-01-1602-117cb64f      Warning      Predictive Failure {Threshold Exceeded,NVDIMM_N Error}

Beachten Sie dabei, dass Sie dieselben Informationen mithilfe des Get-PhysicalDisk-Cmdlets und durch die Angabe von SCM als Bustyp abrufen können:

Get-PhysicalDisk | where BusType -eq "SCM" | select SerialNumber, HealthStatus, OperationalStatus, OperationalDetails

Note

Um den physischen Standort eines in einem Ereignis angegebenen persistenten Speichergeräts zu finden, wechseln Sie auf der Registerkarte "Details" des Ereignisses in der Ereignisanzeige zum EventData-Speicherort>. Beachten Sie dabei, dass in Windows Server 2016 der falsche Speicherort der PMEM-Geräte aufgelistet wird. Dies ist jedoch in Windows Server, Version 1709, behoben.

HealthStatus zeigt an, ob der persistente Speicherdatenträger fehlerfrei ist.

Der Wert "UnsafeshutdownCount " verfolgt die Anzahl der Herunterfahren, die zu Datenverlusten auf diesem logischen Datenträger führen können. Dies ist die Summe der Zähler für unsicheres Herunterfahren aller zugrunde liegenden persistenten Speichergeräte dieses Datenträgers. Weitere Informationen zum Gesundheitsstatus erhalten Sie, indem Sie das Get-PmemPhysicalDevice Cmdlet verwenden, um Details wie den OperationalStatus abzurufen.

Get-PmemPhysicalDevice

DeviceId DeviceType           HealthStatus OperationalStatus PhysicalLocation FirmwareRevision Persistent memory size Volatile memory size
-------- ----------           ------------ ----------------- ---------------- ---------------- ---------------------- --------------------
1020     Intel INVDIMM device Healthy      {Ok}              CPU2_DIMM_C1     102005310        126 GB                 0 GB
1120     Intel INVDIMM device Healthy      {Ok}              CPU2_DIMM_F1     102005310        126 GB                 0 GB
120      Intel INVDIMM device Healthy      {Ok}              CPU1_DIMM_F1     102005310        126 GB                 0 GB
20       Intel INVDIMM device Unhealthy    {HardwareError}   CPU1_DIMM_C1     102005310        126 GB                 0 GB

Dieses Cmdlet zeigt die fehlerhaften PMEM-Geräte an. Das ungesunde Gerät (DeviceId 20) entspricht dem Fall im vorherigen Beispiel. Die PhysicalLocation im BIOS kann helfen, zu identifizieren, welches persistente Speichergerät fehlerhaft ist.

In den folgenden Abschnitten finden Sie Informationen zu den verschiedenen Integritätszuständen.

Integritätsstatus „Warning“

Diese Bedingung ist vorhanden, wenn Sie den Status eines persistenten Speichergeräts überprüfen und sehen, dass der Integritätsstatus als Warnung aufgeführt ist, wie in diesem Beispiel gezeigt:

SerialNumber HealthStatus OperationalStatus OperationalDetails
802c-01-1602-117cb5fc Healthy OK
802c-01-1602-117cb64f Warning Vorhersehbarer Fehler {Schwellenwert überschritten,NVDIMM_N Fehler}

In der folgenden Tabelle werden einige Informationen über die Bedingung aufgelistet:

Heading Description
Wahrscheinliche Bedingung Schwellenwert für Warnung überschritten
Grundursache PMEM-Geräte überwachen eine Reihe von Schwellenwerten, z. B. für Temperatur, NVM-Lebensdauer und/oder Lebensdauer der Energiequelle. Wenn einer dieser Schwellenwerte überschritten wird, wird das Betriebssystem benachrichtigt.
Allgemeines Verhalten Das Gerät bleibt voll funktionsfähig. Dies ist eine Warnung, kein Fehler.
Speicherplatzverhalten Das Gerät bleibt voll funktionsfähig. Dies ist eine Warnung, kein Fehler.
Mehr Informationen OperationalStatus-Feld des PhysicalDisk-Objekts. EventLog – Microsoft-Windows-ScmDisk0101/Operational
Aktion Je nach dem überschrittenen Schwellenwert kann es ratsam sein, das PMEM-Gerät zu ersetzen.

Fehler bei Schreibvorgängen auf ein PMEM-Gerät

Diese Bedingung ist vorhanden, wenn Sie den Status eines persistenten Speichergeräts überprüfen und den Integritätsstatus sehen, der als fehlerhaft aufgeführt ist, und der Betriebsstatus gibt einen E/A-Fehler an, wie in dieser Beispielausgabe gezeigt:

SerialNumber HealthStatus OperationalStatus OperationalDetails
802c-01-1602-117cb5fc Healthy OK
802c-01-1602-117cb64f Unhealthy {Veraltete Metadaten, E/A-Fehler, temporärer Fehler} {Persistenz verlorener Daten, Verlorene Daten, NV...}

In der folgenden Tabelle werden einige Informationen über die Bedingung aufgelistet:

Heading Description
Wahrscheinliche Bedingung Unterbrechung der Energiequelle für Persistenz/Sicherungen
Grundursache Um Persistenz sicherzustellen, sind PMEM-Geräte von einer Energiequelle für Sicherungen abhängig – üblicherweise ein Akku oder Superkondensator. Wenn diese Energiequelle nicht verfügbar ist oder das Gerät aus einem anderen Grund keine Sicherung durchführen kann (Controller-/Flash-Fehler), besteht das Risiko von Datenverlust. Windows verhindert daher, dass weitere Schreibvorgänge auf den betroffenen Geräten durchgeführt werden. Lesevorgänge sind weiterhin möglich, um Daten zu verschieben.
Allgemeines Verhalten Die Bereitstellung des NTFS-Volumes wird aufgehoben.
Im Integritätsstatusfeld PhysicalDisk wird der Status „Unhealthy“ für alle betroffenen NVDIMM-N-Geräte angezeigt.
Speicherplatzverhalten Sofern nur ein PMEM-Modul betroffen ist, ist der Speicherplatz weiterhin verfügbar. Wenn mehrere Geräte betroffen sind, werden Schreibvorgänge auf dem Speicherplatz mit einem Fehler beendet.
Im Integritätsstatusfeld PhysicalDisk wird der Status „Unhealthy“ für alle betroffenen PMEM-Geräte angezeigt.
Mehr Informationen OperationalStatus-Feld des PhysicalDisk-Objekts.
Ereignisprotokoll – Microsoft-Windows-ScmDisk0101/Operational
Aktion Die Daten des betroffenen PMEM sollten gesichert werden. Um Lesezugriff zu erhalten, können Sie den Datenträger manuell verfügbar machen (er wird als schreibgeschütztes NTFS-Volume angezeigt).

Um dieses Problem vollständig zu lösen, muss die Ursache behandelt werden (abhängig vom Problem muss die Stromversorgung wiederhergestellt oder das PMEM-Modul ersetzt werden). Außerdem muss das Volume auf dem Modul offline und dann erneut online geschaltet bzw. das System neu gestartet werden.

Um das PMEM-Modul erneut im Speicherplatzfeature nutzen zu können, verwenden Sie das Reset-PhysicalDisk-Cmdlet, mit dem das Gerät erneut integriert und der Reparaturvorgang gestartet wird.

Das Gerät wird mit einer Kapazität von 0 Bytes oder als „Generic Physical Disk“ angezeigt

Diese Bedingung ist vorhanden, wenn ein dauerhaftes Speichergerät mit einer Kapazität von 0 Byte angezeigt wird und nicht initialisiert werden kann oder als "Generic Physical Disk" -Objekt ohne Seriennummer verfügbar gemacht wird, die einen Betriebsstatus der verlorenen Kommunikation anzeigt, wie in diesem Beispiel gezeigt:

SerialNumber HealthStatus OperationalStatus OperationalDetails
802c-01-1602-117cb5fc Healthy OK
Warning Kommunikation verloren

In der folgenden Tabelle werden einige Informationen über die Bedingung aufgelistet:

Heading Description
Wahrscheinliche Bedingung Das BIOS hat dem Betriebssystem das Modul für persistenten Arbeitsspeicher nicht zur Verfügung gestellt
Grundursache PMEM-Geräte sind DRAM-basiert. Wenn auf eine beschädigte DRAM-Adresse verwiesen wird, initiieren die meisten CPUs eine Computerprüfung und starten den Server neu. Einige Serverplattformen heben dann die Zuordnung des PMEM-Moduls auf und verhindern damit, dass das Betriebssystem darauf zugreifen kann. Außerdem wird durch diesen Vorgang möglicherweise erneut eine Computerprüfung ausgelöst. Dieser Fehler kann auch auftreten, wenn das BIOS erkennt, dass das PMEM-Modul fehlerhaft ist und ersetzt werden muss.
Allgemeines Verhalten Das Modul für den persistenten Arbeitsspeicher wird als nicht initialisiert angezeigt, hat eine Kapazität von 0 Byte und kann nicht gelesen oder beschrieben werden.
Speicherplatzverhalten Das Speicherplatzfeature bleibt funktionsfähig (sofern nur ein PMEM-Modul betroffen ist).
Das PMEM-PhysicalDisk-Objekt wird mit dem Integritätsstatus „Warning“ und als „General Physical Disk“ angezeigt
Mehr Informationen OperationalStatus-Feld des PhysicalDisk-Objekts.
EventLog – Microsoft-Windows-ScmDisk0101/Operational
Aktion Das PMEM-Gerät muss ersetzt oder bereinigt werden, damit es erneut von der Serverplattform für das Hostbetriebssystem zur Verfügung gestellt werden kann. Da weitere nicht behebbare Fehler auftreten können, sollte das Gerät ersetzt werden. Das Hinzufügen eines Ersatzgeräts zu einer Speicherplatzkonfiguration ist über das Add-PhysicalDisk-Cmdlet möglich.

Das Gerät wird nach einem Neustart als Rohdatenträger oder leerer Datenträger angezeigt

Diese Bedingung tritt auf, wenn Sie den Status eines persistenten Speichergeräts überprüfen und einen Integritätsstatus von Ungesund sowie einen Betriebsstatus von Nicht erkannte Metadaten sehen, wie in diesem Beispiel gezeigt:

SerialNumber HealthStatus OperationalStatus OperationalDetails
802c-01-1602-117cb5fc Healthy OK {Unknown}
802c-01-1602-117cb64f Unhealthy {Unbekannte Metadaten, veraltete Metadaten} {Unknown}

In der folgenden Tabelle werden einige Informationen über die Bedingung aufgelistet:

Heading Description
Wahrscheinliche Bedingung Sicherungs-/Wiederherstellungsfehler
Grundursache Ein Fehler beim Sicherungs- oder Wiederherstellungsvorgang führt höchstwahrscheinlich dazu, dass alle Daten im PMEM-Modul verloren gehen. Nachdem das Betriebssystem geladen wurde, wird es als ganz neues PMEM-Gerät ohne Partition oder Dateisystem und mit RAW-Oberfläche (d. h. ohne Dateisystem) angezeigt.
Allgemeines Verhalten PMEM befindet sich nur im Lesemodus. Um das Gerät erneut zu verwenden, muss der Benutzer eine explizite Aktion ausführen.
Speicherplatzverhalten Das Speicherplatzfeature bleibt funktionsfähig (sofern nur ein PMEM-Modul betroffen ist).
Für das physische PMem-Datenträgerobjekt wird der Integritätsstatus „Unhealthy“ angezeigt, und das Gerät wird nicht von Storage Spaces verwendet.
Mehr Informationen OperationalStatus-Feld des PhysicalDisk-Objekts.
EventLog – Microsoft-Windows-ScmDisk0101/Operational
Aktion Wenn der Benutzer das betroffene Gerät nicht ersetzen möchte, kann er mithilfe des Reset-PhysicalDisk-Cmdlets den Schreibschutz des betroffenen PMEM-Moduls entfernen. In einer Speicherplatzumgebung wird dabei außerdem versucht, das PMEM-Gerät erneut in die Speicherplätze zu integrieren und den Reparaturvorgang zu starten.

Nächste Schritte

Verwandte Informationen finden Sie auch unter: