Compartir a través de


Planeamiento de volúmenes en clústeres de Azure Stack HCI y Windows Server

Se aplica a: Azure Stack HCI, versiones 22H2 y 21H2; Windows Server 2022, Windows Server 2019

En este artículo se proporcionan instrucciones sobre cómo planear volúmenes de clúster para satisfacer las necesidades de rendimiento y capacidad de las cargas de trabajo, incluida la elección de su sistema de archivos, el tipo de resistencia y el tamaño.

Note

Espacios de Almacenamiento Directo no admite un servidor de archivos para uso general. Si necesita ejecutar el servidor de archivos u otros servicios genéricos en Espacio de almacenamiento directo, configúrelo en las máquinas virtuales.

Reseña: ¿Qué son los volúmenes?

Los volúmenes son donde colocas los archivos que necesitan tus cargas de trabajo, como los archivos VHD o VHDX para máquinas virtuales Hyper-V. Los volúmenes combinan las unidades del bloque de almacenamiento para introducir las ventajas de tolerancia a errores, escalabilidad y rendimiento de Espacios de almacenamiento directo, la tecnología de almacenamiento definida por software detrás de Azure Stack HCI y Windows Server.

Note

Usamos el término "volumen" para hacer referencia conjuntamente al volumen y al disco virtual en él, incluida la funcionalidad proporcionada por otras características integradas de Windows, como volúmenes compartidos de clúster (CSV) y ReFS. No es necesario comprender estas distinciones de nivel de implementación para planear e implementar Espacios de almacenamiento directo correctamente.

En el diagrama se muestran tres carpetas etiquetadas como volúmenes asociados a un disco virtual etiquetado como volúmenes, todos asociados a un grupo de almacenamiento común de discos.

Todos los volúmenes son accesibles por todos los servidores del clúster al mismo tiempo. Once created, they show up at C:\ClusterStorage\ on all servers.

Captura de pantalla que muestra una ventana del explorador de archivos titulada ClusterStorage que contiene volúmenes denominados Volume1, Volume2 y Volume3.

Elección del número de volúmenes que se van a crear

Se recomienda hacer que el número de volúmenes sea un múltiplo del número de servidores del clúster. Por ejemplo, si tiene 4 servidores, experimentará un rendimiento más coherente con 4 volúmenes totales que con 3 o 5. Esto permite que el clúster distribuya el volumen "propiedad" (un servidor controla la orquestación de metadatos para cada volumen) uniformemente entre los servidores.

Se recomienda limitar el número total de volúmenes a 64 volúmenes por clúster.

Elección del sistema de archivos

Se recomienda usar el nuevo sistema de archivos resistente (ReFS) para Espacios de almacenamiento directo. ReFS es el sistema de archivos premier diseñado para la virtualización y ofrece muchas ventajas, incluidas las aceleraciones de rendimiento dramáticas y la protección integrada contra daños en los datos. Admite casi todas las características ntfs clave, incluida la desduplicación de datos en Windows Server versión 1709 y posteriores. Consulte la tabla de comparación de características de ReFS para obtener más información.

Si la carga de trabajo requiere una característica que ReFS aún no admite, puede usar NTFS en su lugar.

Tip

Los volúmenes con diferentes sistemas de archivos pueden coexistir en el mismo clúster.

Elección del tipo de resistencia

Los volúmenes de Storage Spaces Direct ofrecen resistencia para protegerse frente a problemas de hardware, como fallos de unidad o servidor, y para garantizar la disponibilidad continua durante el mantenimiento del servidor, como las actualizaciones de software.

Note

Los tipos de resistencia que puede elegir son independientes de los tipos de unidades que tenga.

Con dos servidores

Con dos servidores en el clúster, puede utilizar la duplicación bidireccional o puede utilizar la resistencia anidada.

El reflejo bidireccional mantiene dos copias de todos los datos, una copia en los discos de cada servidor. Su eficiencia de almacenamiento es del 50 por ciento; para escribir 1 TB de datos, necesita al menos 2 TB de capacidad de almacenamiento físico en el bloque de almacenamiento. La creación de reflejo bidireccional puede tolerar de forma segura un error de hardware a la vez (un servidor o una unidad).

El diagrama muestra volúmenes etiquetados como datos y copia, conectados por flechas circulares, y ambos volúmenes están asociados a un banco de discos en los servidores.

La resiliencia anidada proporciona resiliencia de datos entre servidores con reflejo bidireccional y, a continuación, agrega resiliencia dentro de un servidor con reflejo bidireccional o paridad acelerada por reflejo. El anidamiento proporciona resiliencia de datos incluso cuando un servidor se reinicia o no está disponible. Su eficacia de almacenamiento es del 25 por ciento con creación de reflejo bidireccional anidada y de alrededor del 35-40 por ciento para paridad acelerada con reflejo anidado. La resistencia anidada puede tolerar de forma segura dos errores de hardware a la vez (dos unidades, o un servidor y una unidad en el servidor restante). Debido a esta resistencia de datos agregada, se recomienda usar resistencia anidada en implementaciones de producción de clústeres de dos servidores. For more info, see Nested resiliency.

En el diagrama se muestra la paridad acelerada del reflejo anidado con reflejo bidireccional entre servidores asociados a un reflejo bidireccional dentro de cada servidor correspondiente a una capa de paridad dentro de cada servidor.

Con tres servidores

Con tres servidores, debe usar la creación de reflejo triple para mejorar la tolerancia a errores y el rendimiento. La creación de reflejo triple mantiene tres copias de todos los datos, una copia en las unidades de cada servidor. Su eficacia de almacenamiento es del 33,3 por ciento: para escribir 1 TB de datos, necesita al menos 3 TB de capacidad de almacenamiento físico en el bloque de almacenamiento. La creación de reflejo triple puede tolerar de forma segura al menos dos problemas de hardware (unidad o servidor) a la vez. Si 2 nodos no están disponibles, el bloque de almacenamiento pierde el cuórum, ya que el 2/3 de los discos no está disponible y los discos virtuales no son accesibles. Sin embargo, un nodo puede estar inactivo y uno o varios discos de otro nodo pueden producir un error y los discos virtuales permanecen en línea. Por ejemplo, si reinicia un servidor cuando se produce un error de repente en otra unidad o servidor, todos los datos permanecen seguros y accesibles continuamente.

El diagrama muestra un volumen etiquetado como datos y dos copias etiquetadas, conectadas por flechas circulares, con cada volumen asociado a un servidor que contiene discos físicos.

Con cuatro o más servidores

Con cuatro o más servidores, puede elegir para cada volumen si desea usar la creación de reflejo triple, paridad doble (a menudo denominada "codificación de borrado") o mezclar las dos con paridad acelerada por reflejo.

La paridad dual proporciona la misma tolerancia a errores que el triple reflejo, pero con una mejor eficiencia de almacenamiento. Con cuatro servidores, su eficiencia de almacenamiento es del 50,0 por ciento; para almacenar 2 TB de datos, necesita 4 TB de capacidad de almacenamiento físico en el bloque de almacenamiento. Esto aumenta a un 66,7 % de eficiencia de almacenamiento con siete servidores y continúa hasta un 80,0 % de eficiencia de almacenamiento. El inconveniente es que la codificación de paridad es más intensiva en proceso, lo que puede limitar su rendimiento.

En el diagrama se muestran dos volúmenes de datos y dos de paridad, conectados mediante flechas circulares, con cada volumen asociado a un servidor que contiene discos físicos.

El tipo de resistencia que se va a usar depende de los requisitos de rendimiento y capacidad para su entorno. Esta es una tabla que resume el rendimiento y la eficacia del almacenamiento de cada tipo de resistencia.

Resiliency type Capacity efficiency Speed
Mirror Eficiencia del almacenamiento que muestra el 33 %
Reflejo triple: 33 %
Two-way-mirror: 50%
Rendimiento que muestra el 100 %
Highest performance
Mirror-accelerated parity Eficiencia del almacenamiento que muestra alrededor del 50 %
Depende de la proporción de reflejo y paridad
El rendimiento muestra aproximadamente 20%
Mucho más lento que el reflejo, pero hasta dos veces más rápido que la paridad doble
Ideal para escrituras y lecturas secuenciales grandes
Dual-parity Eficiencia del almacenamiento que muestra alrededor del 80 %
4 servidores: 50 %
16 servidores: hasta 80%
Rendimiento que muestra alrededor del 10 %
Latencia de E/S más alta y uso de CPU en escrituras
Ideal para escrituras y lecturas secuenciales grandes

Cuando más importa el rendimiento

Las cargas de trabajo que tienen requisitos de latencia estrictos o que necesitan una gran cantidad de IOPS aleatorias mixtas, como bases de datos de SQL Server o máquinas virtuales de Hyper-V sensibles al rendimiento, deben ejecutarse en volúmenes que usan la creación de reflejo para maximizar el rendimiento.

Tip

El reflejo es más rápido que cualquier otro tipo de resiliencia. Usamos el reflejo para casi todos nuestros ejemplos de rendimiento.

Cuando la capacidad importa más

Las cargas de trabajo que escriben con poca frecuencia, como almacenes de datos o almacenamiento "en frío", deben ejecutarse en volúmenes que usan paridad dual para maximizar la eficacia del almacenamiento. Algunas otras cargas de trabajo, como servidor de archivos Scale-Out (SoFS), infraestructura de escritorio virtual (VDI) u otras que no crean gran cantidad de tráfico aleatorio de E/S que cambia rápidamente y/o que no requieren el mejor rendimiento también pueden usar la paridad dual, a su discreción. La paridad aumenta inevitablemente el uso de la CPU y la latencia de E/S, especialmente en las escrituras, en comparación con la creación de reflejo.

Cuando los datos se escriben de forma masiva

Las cargas de trabajo que escriben en grandes pasadas secuenciales, como los objetivos de archivado o copia de seguridad, tienen otra opción: un volumen puede mezclar la creación de reflejo y doble paridad. Las escrituras se encuentran primero en la porción reflejada y se mueven gradualmente a la porción de paridad más tarde. Esto acelera la ingesta y reduce el uso de recursos cuando llegan escrituras grandes al permitir que la codificación de paridad, que requiere un procesamiento intensivo, se lleve a cabo durante más tiempo. A la hora de dimensionar las partes, tenga en cuenta que la cantidad de escrituras que se producen a la vez (como una copia de seguridad diaria) debe caber cómodamente en la porción de reflejo. Por ejemplo, si ingiere 100 GB una vez al día, considere la posibilidad de usar la creación de reflejo de 150 GB a 200 GB y la paridad dual para el resto.

La eficiencia de almacenamiento resultante depende de las proporciones que elija.

Tip

Si observa una disminución abrupta del rendimiento de escritura durante la ingesta de datos, puede indicar que la parte del reflejo no es lo suficientemente grande o que la paridad acelerada por espejo no es adecuada para su caso de uso. Por ejemplo, si el rendimiento de escritura disminuye de 400 MB/s a 40 MB/s, considere ampliar la parte de reflejo o cambiar a reflejo triple.

Acerca de las implementaciones con NVMe, SSD y HDD

En las implementaciones con dos tipos de unidades, las unidades más rápidas proporcionan almacenamiento en caché, mientras que las unidades más lentas proporcionan capacidad. Esto sucede automáticamente: para obtener más información, consulte Descripción de la memoria caché en Espacios de almacenamiento directo. En estas implementaciones, todos los volúmenes residen en última instancia en el mismo tipo de unidades: las unidades de capacidad.

En las implementaciones con los tres tipos de unidades, solo las unidades más rápidas (NVMe) proporcionan almacenamiento en caché, dejando dos tipos de unidades (SSD y HDD) para proporcionar capacidad. Para cada volumen, puede elegir si reside completamente en el nivel DE SSD, completamente en el nivel de HDD o si abarca los dos.

Important

Se recomienda usar el nivel SSD para colocar las cargas de trabajo más sensibles al rendimiento completamente en almacenamiento flash.

Elección del tamaño de los volúmenes

Se recomienda limitar el tamaño de cada volumen a 64 TB en Azure Stack HCI.

Tip

Si usa una solución de copia de seguridad que se basa en el servicio de instantáneas de volumen (VSS) y el proveedor de software Volsnap, como sucede con las cargas de trabajo del servidor de archivos, limitar el tamaño del volumen a 10 TB mejorará el rendimiento y la confiabilidad. Las soluciones de copia de seguridad que usan la API de RCT más reciente Hyper-V o la clonación de bloques ReFS o las API nativas de copia de seguridad de SQL funcionan bien hasta 32 TB y versiones posteriores.

Footprint

El tamaño de un volumen hace referencia a su capacidad utilizable, la cantidad de datos que puede almacenar. This is provided by the -Size parameter of the New-Volume cmdlet and then appears in the Size property when you run the Get-Volume cmdlet.

Size is distinct from volume's footprint, the total physical storage capacity it occupies on the storage pool. La superficie depende de su tipo de resistencia. Por ejemplo, los volúmenes que usan la creación de reflejo triple tienen una superficie tres veces su tamaño.

Las superficies de sus volúmenes deben caber en el bloque de almacenamiento.

El diagrama muestra un volumen de 2 TB comparado con una superficie de 6 TB en el grupo de almacenamiento con un multiplicador de tres especificado.

Reserve capacity

Al dejar parte de la capacidad del grupo de almacenamiento sin asignar, los volúmenes disponen de espacio para repararse localmente cuando se produce un error en las unidades, lo que mejora la seguridad de los datos y el rendimiento. Si hay capacidad suficiente, una reparación paralela inmediata local puede restaurar los volúmenes a su plena capacidad de recuperación incluso antes de sustituir las unidades con errores. Esto ocurre automáticamente.

Se recomienda reservar el equivalente de una unidad de capacidad por servidor, hasta 4 unidades. Puede reservar más a su discreción, pero esta recomendación mínima garantiza que una reparación paralela inmediata y local se realice correctamente después del error de cualquier unidad.

En el diagrama se muestra un volumen asociado a varios discos de un grupo de almacenamiento y discos sin asociar marcados como reserva.

Por ejemplo, si tiene 2 servidores y usa unidades de 1 TB, destine 2 x 1 = 2 TB del grupo como reserva. Si tiene 3 servidores y unidades de capacidad de 1 TB, reserve 3 x 1 = 3 TB como reserva. Si tiene 4 o más servidores y unidades de capacidad de 1 TB, reserve 4 x 1 = 4 TB como reserva.

Note

En clústeres con unidades de los tres tipos (NVMe + SSD + HDD), se recomienda reservar el equivalente de un SSD más un HDD por servidor, hasta 4 unidades de cada uno.

Ejemplo: Planeamiento de capacidad

Considere un clúster de cuatro servidores. Cada servidor tiene algunas unidades de caché más dieciséis unidades de 2 TB para la capacidad.

4 servers x 16 drives each x 2 TB each = 128 TB

A partir de estos 128 TB en el bloque de almacenamiento, se han reservado cuatro unidades u 8 TB, de modo que las reparaciones en contexto puedan producirse sin necesidad de reemplazar las unidades después de que produzcan un error. Esto deja 120 TB de capacidad de almacenamiento físico en el grupo con el que podemos crear volúmenes.

128 TB – (4 x 2 TB) = 120 TB

Supongamos que necesitamos nuestra implementación para hospedar algunas máquinas virtuales muy activas Hyper-V, pero también tenemos un gran almacenamiento en frío: archivos antiguos y copias de seguridad que necesitamos conservar. Dado que tenemos cuatro servidores, vamos a crear cuatro volúmenes.

Let's put the virtual machines on the first two volumes, Volume1 and Volume2. Elegimos ReFS como sistema de archivos (para una creación y puntos de control más rápidos) y el reflejo triple para mejorar la resiliencia y maximizar el rendimiento. Let's put the cold storage on the other two volumes, Volume 3 and Volume 4. Elegimos NTFS como sistema de archivos (para Desduplicación de datos) y paridad dual para lograr resistencia para maximizar la capacidad.

No es necesario que todos los volúmenes sean del mismo tamaño, pero por motivos de simplicidad, por ejemplo, podemos convertirlos en todos los 12 TB.

Volume1 and Volume2 each occupy 12 TB x 33.3 percent efficiency = 36 TB of physical storage capacity.

Volume3 and Volume4 each occupy 12 TB x 50.0 percent efficiency = 24 TB of physical storage capacity.

36 TB + 36 TB + 24 TB + 24 TB = 120 TB

Los cuatro volúmenes encajan exactamente en la capacidad de almacenamiento física disponible en nuestro grupo. Perfect!

En el diagrama se muestran dos volúmenes de reflejo triple de 12 TB cada uno asociado a 36 TB de almacenamiento y dos volúmenes de paridad dual de 12 TB cada uno asociado a 24 TB, todos ellos ocupando 120 TB en un grupo de almacenamiento.

Tip

No es necesario crear todos los volúmenes inmediatamente. Siempre puede extender volúmenes o crear nuevos volúmenes más adelante.

Por motivos de simplicidad, en este ejemplo se usan unidades decimales (base-10), lo que significa que 1 TB = 1000 000 000 000 bytes. Sin embargo, las cantidades de almacenamiento de Windows aparecen en unidades binarias (base-2). Por ejemplo, cada unidad de 2 TB aparecería como 1,82 TiB en Windows. Del mismo modo, el grupo de almacenamiento de 128 TB aparecería como 116.41 TiB. Esto es lo esperado.

Usage

See Creating volumes.

Next steps

Para obtener más información, consulte también: