Compartir a través de


Optimización del almacenamiento con desduplicación y compresión de ReFS en Azure Stack HCI

Se aplica a: Azure Stack HCI, versión 23H2

En este artículo se describe la característica de desduplicación y compresión del sistema de archivos resistente (ReFS) y cómo usar esta característica en Azure Stack HCI para optimizar el almacenamiento.

¿Qué es la desduplicación y compresión de ReFS?

La desduplicación y compresión de ReFS es una característica de optimización de almacenamiento diseñada específicamente para cargas de trabajo activas, como la infraestructura de escritorio virtual (VDI) de Azure en Azure Stack HCI. Esta característica ayuda a optimizar el uso del almacenamiento y a reducir el costo de almacenamiento.

Esta característica usa la clonación de bloques reFS para reducir el movimiento de datos y habilitar solo las operaciones de metadatos. La característica funciona en el nivel de bloque de datos y usa el tamaño fijo del bloque en función del tamaño del clúster. El motor de compresión genera un mapa térmico para identificar si un bloque debe ser apto para la compresión, optimizando para el uso de CPU.

Puede ejecutar la desduplicación y compresión de ReFS como un trabajo único o automatizarlo con trabajos programados. Esta característica funciona con sistemas híbridos y todo flash, y admite varias configuraciones de resistencia, como reflejo bidireccional, espejo bidireccional anidado, reflejo triple y paridad acelerada de reflejo.

Ventajas

Estas son las ventajas de usar la desduplicación y compresión de ReFS:

  • Ahorros de almacenamiento para cargas de trabajo activas. Diseñado para cargas de trabajo activas, como VDI, lo que garantiza un rendimiento eficaz en entornos exigentes.
  • Varios modos. Funciona en tres modos: desduplicación solo, compresión y desduplicación y compresión (modo predeterminado), lo que permite la optimización en función de sus necesidades.
  • Desduplicación incremental. Desduplica solo los datos nuevos o modificados en lugar de examinar todo el volumen cada vez, optimizando la duración del trabajo y reduciendo el impacto en el rendimiento del sistema.

Requisitos previos

Antes de comenzar, asegúrese de que se completan los siguientes requisitos previos:

  • Tiene acceso a un clúster de Azure Stack HCI que se implementa y registra.
  • Tiene el volumen compartido de clúster (CSV) creado en el clúster y tiene acceso a él.
  • El CSV no tiene habilitada la característica Desduplicación de datos de Windows.

Uso de la desduplicación y compresión de ReFS

Puedes usar la desduplicación y compresión de ReFS a través de Windows Admin Center o PowerShell. PowerShell permite trabajos manuales y automatizados, mientras que Windows Admin Center solo admite trabajos programados. Independientemente del método, puede personalizar la configuración del trabajo y usar el seguimiento de cambios de archivos para las ejecuciones posteriores más rápidas.

Habilitación y ejecución de la desduplicación y compresión de ReFS

En Windows Admin Center, puedes crear una programación para la desduplicación y compresión de ReFS para que se ejecute en un volumen existente o en un nuevo volumen durante la creación del volumen.

Siga estos pasos para habilitar la desduplicación y compresión de ReFS a través de Windows Admin Center y establecer una programación cuando se debe ejecutar:

  1. Conéctese a un clúster y, a continuación, en el panel Herramientas de la izquierda, seleccione Volúmenes.

  2. En la página Volúmenes , seleccione la pestaña Inventario , seleccione el volumen adecuado y, a continuación, seleccione Configuración. Para activar la desduplicación y compresión de ReFS para un nuevo volumen, seleccione + Crear.

  3. En el panel Configuración del volumen de la derecha, en la lista desplegable Más opciones , active la casilla Usar desduplicación y compresión de ReFS.

  4. Seleccione los días de la semana en los que se debe ejecutar la desduplicación y compresión de ReFS, el tiempo para que un trabajo empiece a ejecutarse y la duración máxima (el valor predeterminado es ilimitado) y, a continuación, seleccione Guardar.

    En la captura de pantalla siguiente se muestra que la desduplicación y compresión de ReFS se ejecuta el viernes y sábado a las 10:40 am con una duración máxima de 2 horas, a partir del 22/9/22/2023. Si la fecha de inicio se cambió al 21/9/2023, la primera ejecución seguirá siendo 22/9/2023 10:40 a. m. como el primer viernes después del 21/9/2023.

    Captura de pantalla del panel Configuración del volumen que muestra la configuración de desduplicación y compresión de ReFS.

  5. Compruebe los cambios en la sección Propiedades del volumen. La programación aparece en la sección Propiedades y muestra el desglose del ahorro y el siguiente tiempo de ejecución programado. Estos ahorros se actualizan después de cada ejecución y puede observar el impacto en el rendimiento en los gráficos de la sección Rendimiento .

    Captura de pantalla de la sección de propiedades de un volumen que muestra el desglose de ahorros y el siguiente tiempo de ejecución programado.

Suspender trabajos programados

Suspender la programación cancela los trabajos en ejecución y detiene las ejecuciones programadas en el futuro. Esta opción conserva la desduplicación de ReFS y los metadatos relacionados con la compresión y continúa realizando un seguimiento de los cambios de archivos para futuras ejecuciones futuras optimizadas. Puede reanudar la programación en cualquier momento, con la configuración de programación conservada.

Siga estos pasos para suspender trabajos programados mediante Windows Admin Center:

  1. Conéctese a un clúster y, a continuación, en el panel Herramientas de la izquierda, seleccione Volúmenes.

  2. En la página Volúmenes , seleccione la pestaña Inventario , seleccione el volumen adecuado y, a continuación, seleccione Configuración.

  3. En el panel Configuración del volumen de la derecha, en la lista desplegable Más opciones , anule la selección de la casilla Establecer programación y, a continuación, seleccione Guardar.

Deshabilitación de la desduplicación y compresión de ReFS en un volumen

Al deshabilitar la desduplicación y la compresión de ReFS en un volumen, se detiene cualquier ejecución que esté en curso y se cancelan los trabajos programados futuros. Además, los metadatos del volumen relacionados no se conservan y se detiene el seguimiento de cambios de archivos.

Al deshabilitar esta característica, no deshace la desduplicación ni la compresión, ya que todas las operaciones se producen en la capa de metadatos. Con el tiempo, los datos vuelven a su estado original a medida que el volumen incurre en lecturas y escrituras.

Nota:

Puede realizar operaciones de descompresión mediante ReFSUtil.

Siga estos pasos para deshabilitar la característica mediante Windows Admin Center:

  1. Conéctese a un clúster y, a continuación, en el panel Herramientas de la izquierda, seleccione Volúmenes.

  2. En la página Volúmenes , seleccione la pestaña Inventario , seleccione el volumen adecuado y, a continuación, seleccione Configuración.

  3. En el panel Configuración del volumen de la derecha, en la lista desplegable Más opciones , anule la selección de la casilla Usar desduplicación y compresión de ReFS y, a continuación, seleccione Guardar.

Preguntas más frecuentes (P+F)

En esta sección se responden las preguntas más frecuentes sobre la desduplicación y compresión de ReFS.

¿La característica de desduplicación y compresión de ReFS es diferente de la desduplicación de datos de Windows?

Sí, esta característica es completamente diferente de la característica Desduplicación de datos de Windows.

Importante

No se admite la habilitación de la desduplicación y compresión de ReFS y la desduplicación de datos de Windows simultáneamente.

La desduplicación y compresión de ReFS está diseñada para cargas de trabajo activas, centrándose en minimizar el impacto en el rendimiento después de la optimización. A diferencia de la desduplicación de datos de Windows, la desduplicación y compresión de ReFS no usa un almacén de fragmentos para almacenar datos desduplicados y no hay ningún movimiento de datos físico implicado. La característica se basa en la clonación de bloques de ReFS para habilitar operaciones de solo metadatos. La desduplicación de datos de Windows puede proporcionar un mejor ahorro de almacenamiento debido a su uso de tamaños de bloque variable, también es adecuado para una gama más amplia de tipos de carga de trabajo, como servidores de archivos de uso general (GPFS), destinos de copia de seguridad, etc.

¿Cuáles son las fases de desduplicación y compresión de ReFS?

El proceso de optimización consta de las siguientes fases que se producen secuencialmente y dependen del modo especificado. Si una ejecución de optimización alcanza un límite de duración, es posible que la compresión no se ejecute.

  • Inicialización. En esta fase, el volumen de almacenamiento se examina para identificar bloques redundantes de datos.

  • Desduplicación de datos. En esta fase, los bloques redundantes se realizan un seguimiento de instancias únicas mediante la clonación de bloques ReFS.

  • Compresión. En esta fase, se genera un mapa térmico para identificar si un bloque debe ser apto para la compresión. La configuración predeterminada comprime los datos con acceso frecuente o en frío para reducir su tamaño. Puede cambiar los niveles de compresión para ajustar el intervalo de bloques aptos para la compresión.

¿Qué ocurre cuando se alcanza el límite de duración antes de que el volumen esté totalmente optimizado?

El límite de duración se aplica para evitar cualquier impacto en el rendimiento en las cargas de trabajo del cliente causadas por el trabajo de optimización durante el horario comercial. Un servicio de desduplicación supervisa las partes optimizadas de un volumen y las modificaciones de archivos entrantes. Estos datos se usan en trabajos futuros para reducir el tiempo de optimización. Por ejemplo, si un volumen solo se procesa un 30 % en la primera ejecución debido al límite de duración, la ejecución posterior aborda el 70 % restante y los datos nuevos.

Problemas conocidos

En la sección siguiente se enumeran los problemas conocidos que existen actualmente con la desduplicación y compresión de ReFS.

Cuando la compresión está habilitada, el uso del -FullRun parámetro en los trabajos después de la primera ejecución de optimización podría dar lugar a un interbloqueo en el sistema.

Estado: Abierto.

Evite el uso -FullRun de trabajos iniciados manualmente a menos que Type sea Dedup.

Siga estos pasos como solución temporal para mitigar este problema:

  1. Deshabilite la desduplicación y compresión de ReFS en el volumen:

    Disable-ReFSDedup -Volume <path>
    
  2. Descomprima el volumen mediante refsutil:

    refsutil compression /c /f NONE <vol>
    
  3. Vuelva a habilitar la desduplicación y compresión de ReFS con el Dedup único modo, si es necesario:

    Enable-ReFSDedup -Volume <path> -Type Dedup
    

La programación de trabajos para que se ejecuten simultáneamente en varios CSV dentro de un único clúster puede desencadenar movimientos CSV y afectar negativamente al rendimiento.

Estado: Abierto.

Como procedimiento recomendado, considere la posibilidad de escalonar la hora de inicio de los trabajos para evitar cualquier superposición. Sin embargo, si todos los trabajos deben ejecutarse simultáneamente, ajuste la asignación de CPU por trabajo en todos los CSV para que sea inferior al 50 % del uso general de la CPU del clúster. Tenga en cuenta que imponer limitaciones de CPU puede dar lugar a tiempos de ejecución de trabajos más largos.

El trabajo de desduplicación y compresión de ReFS completado (ya sea correctamente o cancelado) y los ahorros de almacenamiento no aparecen en Get-ReFSDedupStatus o Windows Admin Center.

Estado: resuelto.

La solución temporal para este problema es iniciar un trabajo único y la actualización de resultados inmediatamente.

Start-ReFSDedupJob -Volume <path>

El envío de eventos detenidos de supervisión de eventos para Windows (ETW) después de deshabilitar la desduplicación y compresión de ReFS en un volumen.

Estado: resuelto.

Una vez que la desduplicación y compresión de ReFS están deshabilitadas en un volumen, el canal ETW para los registros de desduplicación de ReFS repite eventos de supervisión detenidos. Sin embargo, no se prevé un impacto significativo en el uso debido a este problema.

Evento de error de trabajo no registrado si el volumen se mueve a otro nodo durante la compresión.

Estado: resuelto.

Si el CSV se mueve a otro servidor del clúster mientras la compresión está en curso, el evento de error del trabajo no se registra en el canal de desduplicación de ReFS. Sin embargo, no se prevé un impacto significativo en el uso debido a este problema.

Pasos siguientes