Nota
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Se aplica a: Azure Stack HCI, versiones 22H2 y 21H2; Windows Server 2022, Windows Server 2019
En este artículo se explican las opciones de resistencia disponibles y se describen los requisitos de escala, la eficiencia del almacenamiento y las ventajas y desventajas generales de cada uno.
Información general
Espacios de almacenamiento directo proporciona tolerancia a errores, a menudo denominada "resistencia", para los datos. Su implementación es similar a RAID, excepto que se distribuye a través de servidores y se implementa en software.
Al igual que con RAID, hay algunas formas diferentes en que los espacios de almacenamiento pueden hacer esto, que hacen diferentes compensaciones entre la tolerancia a errores, la eficiencia del almacenamiento y la complejidad del proceso. A grandes rasgos, se dividen en dos categorías: "duplicación" y "paridad", esta última a veces llamada "codificación de borrado".
Espejado
La creación de reflejo proporciona tolerancia a errores gracias al mantenimiento de varias copias de todos los datos. Esto se parece más a RAID-1. La forma en que se dividen y colocan esos datos no es trivial (consulte este blog para obtener más información), pero es absolutamente cierto que cualquier dato almacenado mediante la duplicación se escribe, en su totalidad, varias veces. Cada copia se escribe en hardware físico diferente (unidades diferentes en distintos servidores) que se supone que producen errores de forma independiente.
Puede elegir entre dos tipos de duplicación: "bidireccional" y "tridireccional".
Reflejo bidireccional
La duplicación bidireccional escribe dos copias de todo. Su eficiencia de almacenamiento es del 50 por ciento: para escribir 1 TB de datos, necesita al menos 2 TB de capacidad de almacenamiento físico. Del mismo modo, necesita al menos dos "dominios de error" de hardware : con Espacios de almacenamiento directo, eso significa dos servidores.
Advertencia
Si tiene más de dos servidores, le recomendamos que utilice la duplicación tridireccional en su lugar.
Reflejo triple
La duplicación tridireccional escribe tres copias de todo. Su eficiencia de almacenamiento es del 33,3 por ciento: para escribir 1 TB de datos, necesita al menos 3 TB de capacidad de almacenamiento físico. Del mismo modo, necesita al menos tres dominios de error de hardware: con Espacios de almacenamiento directo, eso significa tres servidores.
La duplicación tridireccional puede tolerar de forma segura al menos dos problemas de hardware (unidad o servidor) a la vez. Por ejemplo, si reinicia un servidor cuando se produce un error de repente en otra unidad o servidor, todos los datos permanecen seguros y accesibles continuamente.
Paridad
La codificación de paridad, a menudo denominada "codificación de borrado", proporciona tolerancia a errores mediante aritmética bit a bit, que puede resultar muy complicada. La forma en que esto funciona es menos obvia que la duplicación, y hay muchos recursos en línea excelentes (por ejemplo, esta Guía de dummies de terceros para la codificación de borrado) que pueden ayudarlo a hacerse una idea. Basta con decir que proporciona una mejor eficiencia de almacenamiento sin comprometer la tolerancia a fallos.
Espacios de almacenamiento ofrece dos tipos de paridad: paridad "única" y paridad "dual", esta última empleando una técnica avanzada llamada "códigos de reconstrucción local" a escalas más grandes.
Importante
Se recomienda usar la creación de reflejo para la mayoría de las cargas de trabajo sensibles al rendimiento. Para obtener más información sobre cómo equilibrar el rendimiento y la capacidad en función de la carga de trabajo, consulte Planificación de volúmenes.
Paridad única
La paridad única mantiene solo un símbolo de paridad bit a bit, lo que proporciona tolerancia a errores contra un solo error a la vez. Se parece más a RAID-5. Para usar la paridad única, necesita al menos tres dominios de error de hardware, lo que significa tres servidores, es decir, tres servidores. Dado que la creación de reflejo tridireccional proporciona más tolerancia a errores a la misma escala, se desaconseja el uso de la paridad única. Pero, está ahí si insistes en usarlo, y es totalmente compatible.
Advertencia
Desaconsejamos el uso de la paridad única porque solo puede tolerar de forma segura un error de hardware a la vez: si está reiniciando un servidor cuando de repente falla otra unidad o servidor, experimentará tiempo de inactividad. Si solo tiene tres servidores, le recomendamos que utilice la duplicación tridireccional. Si tiene cuatro o más, consulte la siguiente sección.
Paridad dual
La paridad dual implementa códigos de corrección de errores Reed-Solomon para mantener dos símbolos de paridad bit a bit, lo que proporciona la misma tolerancia a errores que la duplicación tridireccional (es decir, hasta dos errores a la vez), pero con una mejor eficiencia de almacenamiento. Se parece más a RAID-6. Para usar la paridad dual, necesita al menos cuatro dominios de error de hardware, con Espacios de almacenamiento directo, eso significa cuatro servidores. A esa escala, la eficiencia del almacenamiento es del 50%: para almacenar 2 TB de datos, necesita 4 TB de capacidad de almacenamiento físico.
La eficiencia del almacenamiento de la paridad dual aumenta cuantos más dominios de errores de hardware tenga, del 50 al 80 por ciento. Por ejemplo, a siete (con Espacios de almacenamiento directo, eso significa siete servidores) la eficiencia salta al 66,7 por ciento: para almacenar 4 TB de datos, solo necesita 6 TB de capacidad de almacenamiento físico.
Consulte la sección Resumen para conocer la eficiencia de los códigos de reconstrucción locales y de doble partido en todas las escalas.
Códigos locales de reconstrucción
Espacios de almacenamiento presenta una técnica avanzada desarrollada por Microsoft Research denominada "códigos de reconstrucción local" o LRC. A gran escala, la paridad dual utiliza LRC para dividir su codificación/decodificación en algunos grupos más pequeños, para reducir la sobrecarga necesaria para realizar escrituras o recuperarse de errores.
Con las unidades de disco duro (HDD), el tamaño del grupo es de cuatro símbolos; con las unidades de estado sólido (SSD), el tamaño del grupo es de seis símbolos. Por ejemplo, así es como se ve el diseño con unidades de disco duro y 12 dominios de falla de hardware (es decir, 12 servidores): hay dos grupos de cuatro símbolos de datos. Logra una eficiencia de almacenamiento del 72,7 por ciento.
Recomendamos este recorrido detallado pero eminentemente legible de cómo los códigos de reconstrucción locales manejan varios escenarios de falla y por qué son atractivos, de Claus Joergensen.
Paridad acelerada por reflejo
Un volumen de Espacios de almacenamiento directo puede ser en parte reflejo y en parte paridad. Las escrituras se encuentran primero en la porción reflejada y se mueven gradualmente a la porción de paridad más tarde. Efectivamente, se trata de utilizar la duplicación para acelerar la codificación de borrado.
Para combinar la duplicación tridireccional y la paridad dual, necesita al menos cuatro dominios de error, es decir, cuatro servidores.
La eficacia del almacenamiento de la paridad acelerada por reflejo se encuentra entre lo que se obtendría al usar todo el reflejo o toda la paridad, y depende de las proporciones que elija.
Importante
Se recomienda usar la creación de reflejo para la mayoría de las cargas de trabajo sensibles al rendimiento. Para obtener más información sobre cómo equilibrar el rendimiento y la capacidad en función de la carga de trabajo, consulte Planificación de volúmenes.
Resumen
En esta sección se resumen los tipos de resistencia disponibles en Espacios de almacenamiento directo, los requisitos de escala mínima para usar cada tipo, el número de errores que puede tolerar cada tipo y la eficacia del almacenamiento correspondiente.
Tipos de resistencia
Resiliencia | Tolerancia a fallos | Eficiencia de almacenamiento |
---|---|---|
Reflejo bidireccional | 1 | 50.0% |
Reflejo triple | 2 | 33.3% |
Paridad dual | 2 | 50,0% - 80,0% |
Mixto | 2 | 33,3% - 80,0% |
Requisitos mínimos de escala
Resiliencia | Dominios de error mínimos requeridos |
---|---|
Reflejo bidireccional | 2 |
Reflejo triple | 3 |
Paridad dual | 4 |
Mixto | 4 |
Sugerencia
A menos que utilice la tolerancia a errores de chasis o bastidor, el número de dominios de error se refiere al número de servidores. El número de unidades de cada servidor no afecta a los tipos de resistencia que puede usar, siempre y cuando cumpla los requisitos mínimos de Espacios de almacenamiento directo.
Eficiencia de paridad dual para implementaciones híbridas
En esta tabla se muestra la eficiencia del almacenamiento de los códigos de paridad dual y reconstrucción local en cada escala para implementaciones híbridas, que contienen unidades de disco duro (HDD) y unidades de estado sólido (SSD).
Dominios de error | Diseño | Eficacia |
---|---|---|
2 | – | – |
3 | – | – |
4 | RS 2+2 | 50.0% |
5 | RS 2+2 | 50.0% |
6 | RS 2+2 | 50.0% |
7 | RS 4+2 | 66,7% |
8 | RS 4+2 | 66,7% |
9 | RS 4+2 | 66,7% |
10 | RS 4+2 | 66,7% |
11 | RS 4+2 | 66,7% |
12 | LRC (8, 2, 1) | 72,7% |
13 | LRC (8, 2, 1) | 72,7% |
14 | LRC (8, 2, 1) | 72,7% |
15 | LRC (8, 2, 1) | 72,7% |
16 | LRC (8, 2, 1) | 72,7% |
Eficiencia de paridad dual para implementaciones all-flash
En esta tabla se muestra la eficiencia del almacenamiento de los códigos de paridad dual y reconstrucción local en cada escala para implementaciones basadas íntegramente en tecnología flash, que solo contienen unidades de estado sólido (SSD). El diseño de paridad puede usar grupos de mayor tamaño y lograr una mejor eficiencia de almacenamiento en una configuración basada íntegramente en tecnología flash.
Dominios de error | Diseño | Eficacia |
---|---|---|
2 | – | – |
3 | – | – |
4 | RS 2+2 | 50.0% |
5 | RS 2+2 | 50.0% |
6 | RS 2+2 | 50.0% |
7 | RS 4+2 | 66,7% |
8 | RS 4+2 | 66,7% |
9 | RS 6+2 | 75.0% |
10 | RS 6+2 | 75.0% |
11 | RS 6+2 | 75.0% |
12 | RS 6+2 | 75.0% |
13 | RS 6+2 | 75.0% |
14 | RS 6+2 | 75.0% |
15 | RS 6+2 | 75.0% |
16 | LRC (12, 2, 1) | 80.0% |
Ejemplos
A menos que solo tenga dos servidores, se recomienda utilizar la duplicación tridireccional y/o la paridad dual, ya que ofrecen una mejor tolerancia a errores. En concreto, garantizan que todos los datos permanezcan seguros y accesibles de forma continua, incluso cuando dos dominios de error (con Espacios de almacenamiento directo, es decir, dos servidores) se vean afectados por errores simultáneos.
Ejemplos en los que todo se queda en línea
Estos seis ejemplos muestran lo que puede tolerar la duplicación tridireccional y/o la paridad dual.
- 1. Una unidad perdida (incluye unidades de caché)
- 2. Un servidor perdido
- 3. Un servidor y una unidad perdidos
- 4. Dos unidades perdidas en diferentes servidores
- 5. Más de dos unidades perdidas, siempre que como máximo dos servidores estén afectados
- 6. Dos servidores perdidos
... En todos los casos, todos los volúmenes permanecen en línea. (Asegúrese de que el clúster mantenga el quórum).
Ejemplos en los que todo se desconecta
A lo largo de su vigencia, Espacios de almacenamiento puede tolerar cualquier número de errores, ya que se restaura a la resistencia completa después de cada uno, si se le da el tiempo suficiente. Sin embargo, a lo sumo, dos dominios de error pueden verse afectados de forma segura por errores en un momento dado. Por lo tanto, los siguientes son ejemplos de lo que la duplicación tridireccional y/o la paridad dual no pueden tolerar.
- 7. Unidades perdidas en tres o más servidores a la vez
- 8. Tres o más servidores perdidos a la vez
Uso
Echa un vistazo a Crear volúmenes.
Pasos siguientes
Para obtener más información sobre los temas mencionados en este artículo, consulte lo siguiente: