Sdílet prostřednictvím


Správa stavu trvalé paměti

Platí pro: Azure Stack HCI verze 22H2 a 21H2; Windows Server 2022, Windows Server 2019, Windows Server 2016 Windows 10

Tento článek obsahuje informace o zpracování chyb a správě stavu specifické pro zařízení s trvalou pamětí (PMem), která se často označuje jako paměť třídy úložiště (SCM), což je typ nestálého média, které lze použít jako úložiště nejvyšší úrovně.

Tato krátká videa poskytují přehled podpory trvalé paměti ve Windows:

Přečtěte si také téma Principy a nasazení trvalé paměti.

Zařízení s trvalou pamětí jsou podporována nativními ovladači počínaje Windows Server 2016 a Windows 10 (verze 1607). I když se zařízení s trvalou pamětí chovají podobně jako jiné disky (HDD a SSD), existují určité rozdíly.

Běžným případem použití je použití dvou modulů trvalé paměti jako zrcadlené mezipaměti se zpětným zápisem v prostoru úložiště. Zřízení této konfigurace je popsané v části Konfigurace prostorů úložiště s mezipamětí se zpětným zápisem NVDIMM-N.

V Windows Server 2016 se v grafickém uživatelském rozhraní Prostory úložiště zobrazuje typ sběrnice NVDIMM-N jako NEZNÁMÝ. Nemá žádnou ztrátu funkčnosti nebo nemožnost při vytváření virtuálního virtuálního počítače úložiště. Typ sběrnice můžete ověřit spuštěním následující rutiny:

Get-PhysicalDisk | fl

Parametr BusType ve výstupu správně zobrazí typ sběrnice jako SCM.

Zobrazení stavu trvalé paměti

Tato část popisuje, jak zobrazit stav modulů trvalé paměti. Pokud používáte trvalou paměť, existuje několik rozdílů v prostředí monitorování:

  • Trvalá paměť nevytvoří čítače výkonu fyzického disku, takže se nezobrazí v grafech v Windows Admin Center.
  • Trvalá paměť nevytvoří data Storportu 505, takže nebudete mít proaktivní zjišťování odlehlejších hodnot.

V opačném případě je prostředí monitorování stejné jako u jakéhokoli jiného fyzického disku.

Spuštěním následujících rutin se můžete dotazovat na stav disku s trvalou pamětí:

Get-PmemDisk

DiskNumber Size   HealthStatus AtomicityType CanBeRemoved PhysicalDeviceIds UnsafeShutdownCount
---------- ----   ------------ ------------- ------------ ----------------- -------------------
2          252 GB Unhealthy    None          True         {20, 120}         2
3          252 GB Healthy      None          True         {1020, 1120}      0

Get-PmemDisk | Get-PhysicalDisk | select SerialNumber, HealthStatus, OperationalStatus, OperationalDetails

SerialNumber               HealthStatus OperationalStatus  OperationalDetails
------------               ------------ ------------------ ------------------
802c-01-1602-117cb5fc      Healthy      OK
802c-01-1602-117cb64f      Warning      Predictive Failure {Threshold Exceeded,NVDIMM_N Error}

Stojí za zmínku, že stejné informace můžete získat pomocí Get-PhysicalDisk rutiny a zadáním typu BusType jako SCM:

Get-PhysicalDisk | where BusType -eq "SCM" | select SerialNumber, HealthStatus, OperationalStatus, OperationalDetails

Poznámka

Pokud chcete najít fyzické umístění trvalého paměťového zařízení zadaného v události, přejděte na kartě Podrobnosti události v Prohlížeč událostí na EventData>Location. Všimněte si, že Windows Server 2016 uvádí nesprávné umístění zařízení s trvalou pamětí, ale toto je opravené ve Windows Serveru verze 1709.

Stav stavu ukazuje, jestli je disk s trvalou pamětí v pořádku.

Hodnota UnsafeshutdownCount sleduje počet vypnutí, která mohou způsobit ztrátu dat na tomto logickém disku. Jedná se o součet počtu nebezpečných vypnutí všech základních zařízení s trvalou pamětí tohoto disku. Další informace o stavu najdete pomocí rutiny Get-PmemPhysicalDevice , například OperationalStatus.

Get-PmemPhysicalDevice

DeviceId DeviceType           HealthStatus OperationalStatus PhysicalLocation FirmwareRevision Persistent memory size Volatile memory size
-------- ----------           ------------ ----------------- ---------------- ---------------- ---------------------- --------------------
1020     Intel INVDIMM device Healthy      {Ok}              CPU2_DIMM_C1     102005310        126 GB                 0 GB
1120     Intel INVDIMM device Healthy      {Ok}              CPU2_DIMM_F1     102005310        126 GB                 0 GB
120      Intel INVDIMM device Healthy      {Ok}              CPU1_DIMM_F1     102005310        126 GB                 0 GB
20       Intel INVDIMM device Unhealthy    {HardwareError}   CPU1_DIMM_C1     102005310        126 GB                 0 GB

Tato rutina ukazuje, které trvalé paměťové zařízení není v pořádku. Zařízení, které není v pořádku (DeviceId 20), odpovídá případu v předchozím příkladu. Funkce PhysicalLocation v systému BIOS může pomoct určit, které zařízení s trvalou pamětí je v chybném stavu.

Podmínky různých stavů jsou vysvětlené v následujících odstavcích.

Stav upozornění

Tato podmínka se zobrazí, když zkontrolujete stav zařízení s trvalou pamětí a zjistíte, že jeho stav je uvedený jako Upozornění, jak je znázorněno v tomto ukázkovém výstupu:

SerialNumber HealthStatus OperationalStatus OperationalDetails
802c-01-1602-117cb5fc V pořádku OK
802c-01-1602-117cb64f Upozornění Prediktivní selhání {Překročení prahové hodnoty, chyba NVDIMM_N}

V následující tabulce jsou uvedeny některé informace o této podmínce.

Čísla Description
Pravděpodobná podmínka Překročení prahové hodnoty upozornění
Původní příčina Zařízení s trvalou pamětí sledují různé prahové hodnoty, jako je teplota, životnost nvm nebo životnost zdroje energie. Překročení některé z těchto prahových hodnot se oznámí systému.
Obecné chování Zařízení zůstává plně funkční. Jedná se o upozornění, ne o chybu.
Chování Prostorů úložiště Zařízení zůstává plně funkční. Jedná se o upozornění, ne o chybu.
Další informace Pole s provozním stavem objektu fyzického disku Protokol událostí – Microsoft-Windows-ScmDisk0101/Operational
Co dělat V závislosti na překročení prahové hodnoty upozornění může být vhodné vyměnit zařízení s trvalou pamětí.

Selhání zápisů do trvalého paměťového zařízení

Tato podmínka nastane, když zkontrolujete stav zařízení s trvalou pamětí a zobrazí se stav Není v pořádku a provozní stav zmíní chybu vstupně-výstupních operací, jak je znázorněno v tomto příkladu výstupu:

SerialNumber HealthStatus OperationalStatus OperationalDetails
802c-01-1602-117cb5fc V pořádku OK
802c-01-1602-117cb64f Není v pořádku {Zastaralá metadata, Vstupně-výstupní chyba, Přechodná chyba} {Ztráta trvalosti dat, Ztráta dat, NV...}

V následující tabulce jsou uvedeny některé informace o této podmínce.

Čísla Description
Pravděpodobná podmínka Ztráta výkonu trvalosti / zálohování
Původní příčina Trvalá paměťová zařízení se kvůli své stálosti spoléhají na záložní zdroj napájení – obvykle na baterii nebo super-cap. Pokud tento záložní zdroj napájení není dostupný nebo zařízení nemůže z nějakého důvodu provést zálohu (chyba řadiče/flash disku), jsou data ohrožená a systém Windows zabrání dalším zápisům na ovlivněná zařízení. Kvůli vyklizení dat je pořád možné čtení.
Obecné chování Svazek NTFS bude odpojen.
V poli Stav fyzického disku se pro všechna ovlivněná zařízení NVDIMM-N zobrazí stav Není v pořádku.
Chování Prostorů úložiště Prostor úložiště zůstane funkční, dokud bude ovlivněn pouze jeden modul trvalé paměti. Pokud je ovlivněných více zařízení, zápisy do Prostorů úložiště selžou.
V poli Stav fyzického disku se pro všechna ovlivněná zařízení s trvalou pamětí zobrazí stav Není v pořádku.
Další informace Pole s provozním stavem objektu fyzického disku
Protokol událostí – Microsoft-Windows-ScmDisk0101/Operational
Co dělat Doporučujeme zálohovat data ovlivněných PMem. Přístup ke čtení získáte ručním uvedením disku do online režimu (zobrazí se jako svazek NTFS jen pro čtení).

Pokud chcete tuto podmínku zcela vymazat, je nutné vyřešit původní příčinu (to znamená, že zdroj napájení služby nebo nahradit modul trvalé paměti v závislosti na problému) a svazek v modulu se musí buď převést do režimu offline a znovu převést do režimu online, nebo je nutné restartovat systém.

Pokud chcete modul trvalé paměti znovu použít v Prostory úložiště, použijte rutinuReset-PhysicalDisk, která zařízení znovu integruje a spustí proces opravy.

Zařízení se zobrazuje s kapacitou 0 bajtů nebo jako obecný fyzický disk.

Tato podmínka nastane, když se zobrazí trvalé paměťové zařízení s kapacitou 0 bajtů a nedá se inicializovat nebo je vystaveno jako objekt obecného fyzického disku bez sériového čísla, který zobrazuje provozní stav ztracené komunikace, jak je znázorněno v tomto příkladu výstupu:

SerialNumber HealthStatus OperationalStatus OperationalDetails
802c-01-1602-117cb5fc V pořádku OK
Upozornění Ztráta komunikace

V následující tabulce jsou uvedeny některé informace o této podmínce.

Čísla Description
Pravděpodobná podmínka Systém BIOS nevystavil modulu trvalé paměti operačnímu systému
Původní příčina Zařízení s trvalou pamětí jsou založená na DRAM. Při odkazování na poškozenou adresu paměti DRAM spustí většina procesorů kontrolu počítače a restartuje server. Některé serverové platformy pak odmapují modul trvalé paměti, což brání operačnímu systému v přístupu k němu a potenciálně způsobí další kontrolu počítače. K tomu může dojít také v případě, že systém BIOS zjistí, že modul trvalé paměti selhal a je třeba ho nahradit.
Obecné chování Modul trvalé paměti se zobrazuje jako neinicializovaný s kapacitou 0 bajtů a nelze ho číst ani zapisovat.
Chování Prostorů úložiště Prostor úložiště zůstává funkční (za předpokladu, že je ovlivněn pouze jeden modul trvalé paměti).
Objekt PMem PhysicalDisk se zobrazuje se stavem upozornění a jako obecný fyzický disk.
Další informace Pole s provozním stavem objektu fyzického disku
Protokol událostí – Microsoft-Windows-ScmDisk0101/Operational
Co dělat Trvalé paměťové zařízení musí být nahrazeno nebo sanitizováno tak, aby ho serverová platforma znovu zpřístupnila hostitelskému operačnímu systému. Doporučuje se vyměnit zařízení, protože může dojít k dalším neopravitelným chybám. Přidání náhradního zařízení do konfigurace prostorů úložiště je možné provést pomocí rutiny Add-PhysicalDisk .

Zařízení se po restartování zobrazí jako raw nebo prázdný disk.

Tato podmínka nastane, když zkontrolujete stav zařízení s trvalou pamětí a zobrazíte stav Není v pořádku a provozní stav nerozpoznaných metadat, jak je znázorněno v tomto příkladu výstupu:

SerialNumber HealthStatus OperationalStatus OperationalDetails
802c-01-1602-117cb5fc V pořádku OK {Neznámé}
802c-01-1602-117cb64f Není v pořádku {Nerozpoznaná metadata, Zastaralá metadata} {Neznámé}

V následující tabulce jsou uvedeny některé informace o této podmínce.

Čísla Description
Pravděpodobná podmínka Chyba při zálohování/obnovení
Původní příčina Selhání v postupu zálohování nebo obnovení pravděpodobně způsobí ztrátu všech dat v modulu trvalé paměti. Když se operační systém načte, zobrazí se jako zcela nové trvalé paměťové zařízení bez oddílu nebo systému souborů a zobrazí se jako RAW, což znamená, že nemá systém souborů.
Obecné chování Trvalá paměť bude v režimu jen pro čtení. Jeho opětovné použití vyžaduje explicitní akci uživatele.
Chování Prostorů úložiště Prostory úložiště zůstane funkční, pokud je ovlivněn pouze jeden modul trvalé paměti).
Objekt fyzického disku PMem se zobrazí se stavem Není v pořádku a nepoužívá ho Prostory úložiště.
Další informace Pole s provozním stavem objektu fyzického disku
Protokol událostí – Microsoft-Windows-ScmDisk0101/Operational
Co dělat Pokud uživatel nechce nahradit ovlivněné zařízení, může pomocí Reset-PhysicalDisk rutiny vymazat podmínku jen pro čtení v příslušném modulu trvalé paměti. V Prostory úložiště prostředích se také pokusíte znovu integrovat modul trvalé paměti do Prostory úložiště a zahájit proces opravy.

Další kroky

Související informace najdete také v tématu: