Compartir a través de


El volumen ReFS que utiliza DPM deja de responder en Windows Server 2016

Este artículo ayuda a resolver un problema en el que el volumen DPM o ReFS deja de responder en Windows Server 2016.

Se aplica a: Windows Server 2016
Número de KB original: 4035951

Síntoma

Observa que un volumen del sistema de archivos Resiliente (ReFS) que usa Administración de Protección de Datos (DPM) deja de responder o se inmoviliza cuando realiza copias de seguridad, específicamente cuando DPM emite operaciones de clonación de bloques grandes.

Causa

DPM utiliza VHDs montados en modo loopback. Estos aparecen como discos normales en el sistema operativo. Por lo tanto, estos discos se muestran en el Explorador de Windows, Diskmgt y otras herramientas de GUI. Estas herramientas sondean periódicamente los discos para asegurarse de que funcionan correctamente. Esto provoca que las E/S se envíen a través de la pila de loopback hacia el volumen ReFS. Si el volumen ReFS está ocupado, estas E/S tendrán que esperar. Por lo tanto, cuando ReFS realiza una operación de larga duración, como una descarga de datos o una llamada de clonación de bloques grandes, estas E/S tendrán que esperar más. Cuando estas E/S están bloqueadas, la interfaz de usuario del Explorador o Diskmgt no se actualizará. Como resultado, parece que los discos parecen estar colgados o desmontados.

Además, el controlador de miniporte de montaje de bucle invertido (vhdmp) comienza a generar eventos de advertencia si alguna E/S no se completa en un plazo de 30 segundos.

Nota:

No se produce ningún error en la operación de E/S o del sistema de archivos durante este proceso. Todas las operaciones se realizarán correctamente y solo tardarán más tiempo. Además, no se desmontará ningún volumen. Este problema es solo un problema de latencia de operación del sistema de archivos, lo que hace que la interfaz de usuario se bloquee y los controladores de puerto registren errores.

Solución

Este problema se resuelve en la actualización acumulativa del 18 de julio de 2017. La corrección contiene:

  • Tres parámetros de registro ajustables
  • Un cambio de política que evita realizar flujos de volumen innecesarios, lo que impide que ReFS agregue una latencia intensa a las operaciones de E/S de ReFS en curso.

Más información

Cómo establecer los parámetros ajustables

Importante

Antes de seguir estos pasos, asegúrese de que ha leído e implementado los tres parámetros del Registro, tal como se describe en el artículo de KB 4016173. Si no abordan adecuadamente los problemas que encuentre, no deshabilite estos parámetros del Registro. Estos parámetros y los descritos en esta sección no se superponen funcionalmente, por lo que se pueden usar juntos.

Esta actualización describe parámetros adicionales del Registro que ayudan a solucionar los problemas de latencia descritos en la sección "Síntomas". Estos parámetros se pueden usar en cualquier combinación.

Advertencia

Es posible que se produzcan problemas graves si cambia el registro incorrectamente mediante el Editor del Registro o mediante otro método. Estos problemas podrían requerir volver a instalar el sistema operativo. Microsoft no puede garantizar que estos problemas se puedan resolver. Cambie el Registro bajo su propia responsabilidad.

Importante

  • Se requiere un reinicio para que estos cambios de parámetro surtan efecto.
  • Estos parámetros deben establecerse de forma coherente en cada nodo de un clúster de conmutación por error.

Parámetros ajustables

Opción 1

Esta opción deshabilita los pines almacenados en caché, que eran una causa principal del gran conjunto de tareas activas.

Especifique los valores indicados en la subclave siguiente:

  • HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\FileSystem
  • Nombre del valor: RefsDisableCachedPins
  • Establecer RefsDisableCachedPins = 1
  • Tipo de valor: REG_DWORD

Opción 2

Esta opción agrega una heurística a la lógica de punto de control de ReFS, lo que hace que ReFS realice un punto de control cuando la cola de eliminación alcance un tamaño específico. Las operaciones de entrada/salida están atascadas en ReFS porque la lógica del punto de control se detendría al procesar una cola de eliminación grande.

Especifique los valores indicados en la subclave siguiente:

  • HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\FileSystem
  • Nombre del valor: RefsProcessedDeleteQueueEntryCountThreshold
  • Establezca el RefsProcessedDeleteQueueEntryCountThreshold = 2048
  • Tipo de valor: REG_DWORD

Nota:

Al ajustar RefsProcessedDeleteQueueEntryThreshold a valores más bajos, ReFS realiza puntos de control con más frecuencia. Establezca el valor en 2048 y, a continuación, reduzca el valor a 1024 y, a continuación, 512.

Opción 3

Las llamadas a grandes extensiones duplicadas introducen latencia en el sistema, ya que otras operaciones tendrán que esperar hasta que se completen estas operaciones de larga duración. Esta opción reduce el tamaño de la llamada a extensiones duplicadas.

Nota:

DPM establecerá este cambio de clave del Registro como valor predeterminado como parte de UR4, que se publicará en agosto de 2017.

Especifique los valores indicados en la subclave siguiente:

  • HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft Data Protection Manager\Configuration\DiskStorage
  • Nombre del valor: DuplicateExtentBatchSizeinMB
  • Configure el parámetro DuplicateExtentBatchSizeinMB a 100. (El valor predeterminado es 2000 [2 GB]. Se acepta cualquier valor de 1 a 4095).
  • Tipo de valor: REG_DWORD

Opción 4

Esta opción amplía el valor del tiempo de espera (TimeOutValue).

Especifique los valores indicados en la subclave siguiente:

  • HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Disk
  • Nombre del valor: TimeOutValue
  • Establecer TimeOutValue (en segundos) = 0x78
  • Tipo de valor: REG_DWORD

Nota:

El valor predeterminado de TimeOutValue es 0x41 (65 decimales). 0x78 se traduce en 120 decimales.