Share via


Optimización del almacenamiento con desduplicación y compresión de ReFS en Azure Stack HCI

Se aplica a: Azure Stack HCI, versión 23H2

En este artículo se describe la característica de desduplicación y compresión del sistema de archivos resistente (ReFS) y cómo usar esta característica en Azure Stack HCI para optimizar el almacenamiento.

¿Qué es la desduplicación y compresión de ReFS?

La desduplicación y compresión de ReFS es una característica de optimización de almacenamiento diseñada específicamente para cargas de trabajo activas, como la infraestructura de escritorio virtual de Azure (VDI) en Azure Stack HCI. Esta característica ayuda a optimizar el uso del almacenamiento y a reducir el costo de almacenamiento.

Esta característica usa la clonación de bloques ReFS para reducir el movimiento de datos y habilitar solo las operaciones de metadatos. La característica funciona en el nivel de bloque de datos y usa el tamaño fijo del bloque en función del tamaño del clúster. El motor de compresión genera un mapa térmico para identificar si un bloque debe ser apto para la compresión, optimizando el uso de cpu.

Puede ejecutar la desduplicación y compresión de ReFS como un trabajo único o automatizarlo con trabajos programados. Esta característica funciona con sistemas híbridos y todo flash, y admite varias configuraciones de resistencia, como espejo bidireccional, espejo bidireccional anidado, espejo triple y paridad acelerada de reflejo.

Ventajas

Estas son las ventajas de usar la desduplicación y compresión de ReFS:

  • Ahorros de almacenamiento para cargas de trabajo activas. Diseñado para cargas de trabajo activas, como VDI, garantizando un rendimiento eficaz en entornos exigentes.
  • Varios modos. Funciona en tres modos: solo desduplicación, solo compresión y desduplicación y compresión (modo predeterminado), lo que permite la optimización en función de sus necesidades.
  • Desduplicación incremental. Desduplica solo los datos nuevos o modificados en lugar de examinar todo el volumen cada vez, optimizando la duración del trabajo y reduciendo el impacto en el rendimiento del sistema.

Requisitos previos

Antes de comenzar, asegúrese de que se completan los siguientes requisitos previos:

  • Tiene acceso a un clúster de Azure Stack HCI que se implementa y registra.
  • Tiene el volumen compartido de clúster (CSV) creado en el clúster y tiene acceso a él.
  • El ARCHIVO CSV no tiene habilitada la característica Desduplicación de datos de Windows.

Uso de la desduplicación y compresión de ReFS

Puede usar la desduplicación y compresión de ReFS a través de Windows Admin Center o PowerShell. PowerShell permite trabajos manuales y automatizados, mientras que Windows Admin Center solo admite trabajos programados. Independientemente del método, puede personalizar la configuración del trabajo y usar el seguimiento de cambios de archivos para ejecutarse más rápido.

Habilitación y ejecución de la desduplicación y compresión de ReFS

En Windows Admin Center, puede crear una programación para que la desduplicación y compresión de ReFS se ejecuten en un volumen existente o en un nuevo volumen durante la creación del volumen.

Siga estos pasos para habilitar la desduplicación y compresión de ReFS a través de Windows Admin Center y establecer una programación cuando se debe ejecutar:

  1. Conéctese a un clúster y, a continuación, en el panel Herramientas de la izquierda, seleccione Volúmenes.

  2. En la página Volúmenes , seleccione la pestaña Inventario , seleccione el volumen adecuado y, a continuación, seleccione Configuración. Para activar la desduplicación y compresión de ReFS para un nuevo volumen, seleccione + Crear.

  3. En el panel Configuración del volumen de la derecha, en la lista desplegable Más opciones , active la casilla Usar desduplicación y compresión de ReFS .

  4. Seleccione los días de la semana en que se debe ejecutar la desduplicación y compresión de ReFS, el tiempo para que un trabajo empiece a ejecutarse y la duración máxima (el valor predeterminado es ilimitado) y, a continuación, seleccione Guardar.

    En la captura de pantalla siguiente se muestra que la desduplicación y compresión de ReFS se ejecuta el viernes y el sábado a las 10:40 AM con una duración máxima de 2 horas, a partir del 22/9/2023. Si la fecha de inicio se cambió al 21/9/2023, la primera ejecución seguirá siendo 22/9/2023 10:40 a.m. como el primer viernes después del 21/9/21/2023.

    Captura de pantalla del panel Configuración del volumen que muestra la configuración de desduplicación y compresión de ReFS.

  5. Compruebe los cambios en la sección Propiedades del volumen. La programación aparece en la sección Propiedades y muestra el desglose de ahorros y el siguiente tiempo de ejecución programado. Estos ahorros se actualizan después de cada ejecución y puede observar el impacto en el rendimiento en los gráficos de la sección Rendimiento .

    Captura de pantalla de la sección de propiedades de un volumen que muestra el desglose de ahorros y el siguiente tiempo de ejecución programado.

Suspender trabajos programados

La suspensión de la programación cancela los trabajos en ejecución y detiene las ejecuciones programadas en el futuro. Esta opción conserva la desduplicación de ReFS y los metadatos relacionados con la compresión y continúa realizando un seguimiento de los cambios de archivos para futuras ejecuciones futuras optimizadas. Puede reanudar la programación en cualquier momento, con la configuración de programación conservada.

Siga estos pasos para suspender trabajos programados mediante Windows Admin Center:

  1. Conéctese a un clúster y, a continuación, en el panel Herramientas de la izquierda, seleccione Volúmenes.

  2. En la página Volúmenes , seleccione la pestaña Inventario , seleccione el volumen adecuado y, a continuación, seleccione Configuración.

  3. En el panel Configuración del volumen de la derecha, en la lista desplegable Más opciones , anule la selección de la casilla Establecer programación y, a continuación, seleccione Guardar.

Deshabilitación de la desduplicación y compresión de ReFS en un volumen

Al deshabilitar la desduplicación y compresión de ReFS en un volumen, se detiene cualquier ejecución en curso y se cancelan los trabajos programados futuros. Además, no se conservan los metadatos de volumen relacionados y se detiene el seguimiento de cambios de archivos.

Al deshabilitar esta característica, no deshace la desduplicación ni la compresión, ya que todas las operaciones se producen en la capa de metadatos. Con el tiempo, los datos vuelven a su estado original a medida que el volumen incurre en lecturas y escrituras.

Nota

Puede realizar operaciones de descompresión mediante ReFSUtil.

Siga estos pasos para deshabilitar la característica mediante Windows Admin Center:

  1. Conéctese a un clúster y, a continuación, en el panel Herramientas de la izquierda, seleccione Volúmenes.

  2. En la página Volúmenes , seleccione la pestaña Inventario , seleccione el volumen adecuado y, a continuación, seleccione Configuración.

  3. En el panel Configuración del volumen de la derecha, en la lista desplegable Más opciones , anule la selección de la casilla Usar desduplicación y compresión de ReFS y, a continuación, seleccione Guardar.

Preguntas más frecuentes (P+F)

En esta sección se responden las preguntas más frecuentes sobre la desduplicación y la compresión de ReFS.

¿La característica de desduplicación y compresión de ReFS es diferente de la desduplicación de datos de Windows?

Sí, esta característica es totalmente diferente de la característica Desduplicación de datos de Windows .

Importante

No se admite la habilitación de la desduplicación y la compresión de ReFS y la desduplicación de datos de Windows simultáneamente.

La desduplicación y compresión de ReFS está diseñada para cargas de trabajo activas, centrándose en minimizar el impacto en el rendimiento después de la optimización. A diferencia de desduplicación de datos de Windows, la desduplicación y compresión de ReFS no usa un almacén de fragmentos para almacenar datos desduplicados y no hay ningún movimiento de datos físico implicado. La característica se basa en la clonación de bloques reFS para habilitar las operaciones de solo metadatos. Desduplicación de datos de Windows podría proporcionar un mejor ahorro de almacenamiento debido a su uso de tamaños de bloque variable, también es adecuado para una gama más amplia de tipos de cargas de trabajo, como servidores de archivos de uso general (GPFS), destinos de copia de seguridad y mucho más.

¿Cuáles son las fases de desduplicación y compresión de ReFS?

El proceso de optimización consta de las siguientes fases que se producen secuencialmente y dependen del modo especificado. Si una ejecución de optimización alcanza un límite de duración, es posible que la compresión no se ejecute.

  • Inicialización. En esta fase, el volumen de almacenamiento se examina para identificar bloques redundantes de datos.

  • Desduplicación de datos. En esta fase, los bloques redundantes son de instancia única y se realiza un seguimiento mediante la clonación de bloques ReFS.

  • Compression. En esta fase, se genera un mapa térmico para identificar si un bloque debe ser apto para la compresión. La configuración predeterminada comprime los datos de acceso frecuente o en frío para reducir su tamaño. Puede cambiar los niveles de compresión para ajustar el intervalo de bloques aptos para la compresión.

¿Qué ocurre cuando se alcanza el límite de duración antes de que el volumen esté totalmente optimizado?

El límite de duración está establecido para evitar cualquier impacto en el rendimiento en las cargas de trabajo del cliente causadas por el trabajo de optimización durante el horario comercial. Un servicio de desduplicación supervisa las partes optimizadas de un volumen y las modificaciones de archivos entrantes. Estos datos se usan en trabajos futuros para reducir el tiempo de optimización. Por ejemplo, si un volumen es solo un 30 % procesado en la primera ejecución debido al límite de duración, la ejecución posterior direcciona el 70 % restante y los datos nuevos.

Problemas conocidos

En la siguiente sección se enumeran los problemas conocidos que existen actualmente con la desduplicación y la compresión de ReFS.

La programación de trabajos para que se ejecuten simultáneamente en varios CSV dentro de un único clúster puede desencadenar movimientos CSV y afectar negativamente al rendimiento.

Estado: Abierto.

Como procedimiento recomendado, considere la posibilidad de escalonar la hora de inicio de los trabajos para evitar cualquier superposición. Sin embargo, si todos los trabajos se deben ejecutar simultáneamente, ajuste la asignación de CPU por trabajo en todos los CSV para que sea inferior al 50 % del uso general de la CPU del clúster. Tenga en cuenta que imponer limitaciones de CPU puede dar lugar a tiempos de ejecución de trabajos más largos.

Se completó el trabajo de desduplicación y compresión de ReFS (ya sea correctamente o se canceló) y los ahorros de almacenamiento no aparecen en Get-ReFSDedupStatus ni Windows Admin Center.

Estado: Resuelto.

La solución temporal para este problema es iniciar un trabajo único y la actualización de resultados inmediatamente.

Start-ReFSDedupJob -Volume <path>

El envío de eventos de supervisión detenida para eventos de seguimiento de eventos para Windows (ETW) después de deshabilitar la desduplicación y compresión de ReFS en un volumen.

Estado: Resuelto.

Una vez deshabilitada la desduplicación y compresión de ReFS en un volumen, el canal ETW para los registros de desduplicación de ReFS repite eventos de supervisión detenidos. Sin embargo, no se prevé un impacto significativo en el uso debido a este problema.

Evento de error de trabajo no registrado si el volumen se mueve a otro nodo durante la compresión.

Estado: Resuelto.

Si el CSV se mueve a otro servidor del clúster mientras la compresión está en curso, el evento de error del trabajo no se registra en el canal de desduplicación de ReFS. Sin embargo, no se prevé un impacto significativo en el uso debido a este problema.

Pasos siguientes