Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Aplica-se a: Azure Stack HCI, versões 22H2 e 21H2; Windows Server 2022, Windows Server 2019
Este artigo explica as opções de resiliência disponíveis e descreve os requisitos de escala, a eficiência de armazenamento e as vantagens gerais e as compensações de cada um.
Visão geral
Os Espaços de Armazenamento Diretos fornecem tolerância a falhas, muitas vezes chamadas de "resiliência", para seus dados. Sua implementação é semelhante a RAID, exceto distribuída entre servidores e implementada em software.
Assim como acontece com RAID, há algumas maneiras diferentes de espaços de armazenamento fazerem isso, o que faz diferentes compensações entre tolerância a falhas, eficiência de armazenamento e complexidade de computação. Em geral, eles se enquadram em duas categorias: “espelhamento” e “paridade”, esta última às vezes chamada de “codificação de apagamento”.
Espelhamento
O espelhamento fornece tolerância a falhas mantendo várias cópias de todos os dados. Isso se assemelha mais ao RAID-1. Como esses dados são distribuídos e colocados não é trivial (consulte este blog para saber mais), mas é absolutamente verdadeiro dizer que todos os dados armazenados usando espelhamento são gravados, em sua totalidade, várias vezes. Cada cópia é gravada em hardware físico diferente (unidades diferentes em servidores diferentes) que são presumidas para falhar de forma independente.
Você pode escolher entre dois tipos de espelhamento - "bidirecional" e "de três vias".
Espelho unidirecional
O espelhamento bidirecional grava duas cópias de tudo. Sua eficiência de armazenamento é de 50% – para gravar 1 TB de dados, você precisa de pelo menos 2 TB de capacidade de armazenamento físico. Da mesma forma, você precisa de pelo menos dois ''domínios de falha'' de hardware - com Espaços de Armazenamento Diretos, e isso significa dois servidores.
Aviso
Se você tiver mais de dois servidores, recomendamos usar o espelhamento de três vias.
Espelho de três vias
O espelhamento de três vias grava três cópias de tudo. Sua eficiência de armazenamento é de 33,3% – para gravar 1 TB de dados, você precisa de pelo menos 3 TB de capacidade de armazenamento físico. Da mesma forma, você precisa de pelo menos três domínios de falha de hardware – com o Storage Spaces Direct, isso significa três servidores.
O espelhamento de três vias pode tolerar com segurança pelo menos dois problemas de hardware (unidade ou servidor) por vez. Por exemplo, se você estiver reinicializando um servidor quando, de repente, outra unidade ou servidor falhar, todos os dados permanecerão seguros e continuamente acessíveis.
Paridade
A codificação de paridade, muitas vezes chamada de "codificação de apagamento", fornece tolerância a falhas usando aritmética bit a bit, que pode ficar notavelmente complicada. A maneira como isso funciona é menos óbvia do que o espelhamento, e há muitos recursos on-line excelentes (por exemplo, este Guia para leigos sobre codificação de apagamento) que podem ajudá-lo a entender a ideia. Basta dizer que ele fornece melhor eficiência de armazenamento sem comprometer a tolerância a falhas.
Os Espaços de Armazenamento oferecem dois tipos de paridade : paridade "única" e paridade "dupla", este último empregando uma técnica avançada chamada "códigos de reconstrução local" em escalas maiores.
Importante
Recomendamos usar o espelhamento para a maioria das cargas de trabalho sensíveis ao desempenho. Para saber mais sobre como equilibrar o desempenho e a capacidade de acordo com a sua carga de trabalho, consulte Plan volumes.
Paridade única
A paridade única mantém apenas um símbolo de paridade bit a bit, o que oferece tolerância a falhas contra apenas uma falha por vez. Ele se assemelha mais ao RAID-5. Para usar a paridade única, você precisa de pelo menos três domínios de falha de hardware – com o Storage Spaces Direct, isso significa três servidores. Como o espelhamento de três vias oferece mais tolerância a falhas na mesma escala, não recomendamos o uso de paridade única. Mas, se você insistir em usá-lo, ele está disponível e tem suporte total.
Aviso
Desencorajamos o uso de paridade única porque ele só pode tolerar com segurança uma falha de hardware de cada vez: se você estiver reinicializando um servidor quando, de repente, outra unidade ou servidor falhar, você experimentará tempo de inatividade. Se você tiver apenas três servidores, recomendamos usar o espelhamento de três vias. Se você tiver quatro ou mais, consulte a próxima seção.
Paridade dupla
A paridade dupla implementa códigos de correção de erros Reed-Solomon para manter dois símbolos de paridade bit a bit, fornecendo assim a mesma tolerância a falhas que o espelhamento triplo (ou seja, até duas falhas simultâneas), mas com melhor eficiência de armazenamento. Ele se assemelha mais ao RAID-6. Para usar a paridade dupla, você precisa de pelo menos quatro domínios de falha de hardware – com o Storage Spaces Direct, isso significa quatro servidores. Nessa escala, a eficiência de armazenamento é de 50% – para armazenar 2 TB de dados, você precisa de 4 TB de capacidade de armazenamento físico.
A eficiência de armazenamento da paridade dupla aumenta quanto mais domínios de falha de hardware você tiver, de 50% para 80%. Por exemplo, em sete (com espaços de armazenamento diretos, isso significa sete servidores), a eficiência salta para 66,7% – para armazenar 4 TB de dados, você precisa de apenas 6 TB de capacidade de armazenamento físico.
Consulte a seção Resumo para obter a eficiência dos códigos de reconstrução dupla e local em cada escala.
Códigos de reconstrução local
Os Espaços de Armazenamento introduzem uma técnica avançada desenvolvida pela Microsoft Research chamada "códigos de reconstrução local" ou LRC. Em grande escala, a paridade dupla usa LRC para dividir sua codificação/decodificação em alguns grupos menores, para reduzir a sobrecarga necessária para fazer gravações ou se recuperar de falhas.
Com unidades de disco rígido (HDD), o tamanho do grupo é de quatro símbolos; com unidades de estado sólido (SSD), o tamanho do grupo é de seis símbolos. Por exemplo, veja a aparência do layout com unidades de disco rígido e 12 domínios de falha de hardware (ou seja, 12 servidores) – há dois grupos de quatro símbolos de dados. Ele atinge 72,7% de eficiência de armazenamento.
Recomendamos este passo a passo aprofundado, mas eminentemente legível, de como os códigos de reconstrução locais lidam com vários cenários de falha, e por que são atraentes, por Claus Joergensen.
Paridade acelerada pelo uso de espelhos
Um volume de Espaços de Armazenamento Diretos pode ser parte espelho e parte paridade. Os registros são feitos primeiro na parte espelhada e depois são gradualmente movidos para a parte de paridade. Basicamente, isso está usando o espelhamento para acelerar a codificação de eliminação.
Para misturar espelhamento de três vias e paridade dupla, você precisa de pelo menos quatro domínios de falha, o que significa dizer que são necessários quatro servidores.
A eficiência de armazenamento da paridade acelerada por espelhamento está entre o que você obteria usando todo o espelhamento ou toda a paridade, e depende das proporções que você escolher.
Importante
Recomendamos usar o espelhamento para a maioria das cargas de trabalho sensíveis ao desempenho. Para saber mais sobre como equilibrar o desempenho e a capacidade de acordo com a sua carga de trabalho, consulte Plan volumes.
Resumo
Esta seção resume os tipos de resiliência disponíveis nos Espaços de Armazenamento Diretos, os requisitos mínimos de escala para usar cada tipo, quantas falhas cada tipo pode tolerar e a eficiência de armazenamento correspondente.
Tipos de resiliência
Resiliência | Tolerância a falhas | Eficiência de armazenamento |
---|---|---|
Espelho unidirecional | 1 | 50.0% |
Espelho de três vias | 2 | 33,3% |
Paridade dupla | 2 | 50.0% - 80.0% |
Misturado | 2 | 33,3% - 80,0% |
Requisitos mínimos de escala
Resiliência | Domínios de falha mínimos necessários |
---|---|
Espelho unidirecional | 2 |
Espelho de três vias | 3 |
Paridade dupla | 4 |
Misturado | 4 |
Dica
A menos que você esteja usando a tolerância a falhas de chassi ou rack, o número de domínios de falha se refere ao número de servidores. O número de unidades em cada servidor não afeta quais tipos de resiliência você pode usar, desde que você atenda aos requisitos mínimos dos Espaços de Armazenamento Diretos.
Eficiência de paridade dupla para implantações híbridas
Esta tabela mostra a eficiência de armazenamento de códigos de paridade dupla e reconstrução local em cada escala para implantações híbridas, que contêm unidades de disco rígido (HDD) e SSD (unidades de estado sólido).
Domínios de falha | Esquema | Eficiência |
---|---|---|
2 | – | – |
3 | – | – |
4 | RS 2+2 | 50.0% |
5 | RS 2+2 | 50.0% |
6 | RS 2+2 | 50.0% |
7 | RS 4+2 | 66,7% |
oito | RS 4+2 | 66,7% |
9 | RS 4+2 | 66,7% |
10 | RS 4+2 | 66,7% |
11 | RS 4+2 | 66,7% |
12 | LRC (8, 2, 1) | 72,7% |
13 | LRC (8, 2, 1) | 72,7% |
14 | LRC (8, 2, 1) | 72,7% |
15 | LRC (8, 2, 1) | 72,7% |
16 | LRC (8, 2, 1) | 72,7% |
Eficiência de paridade dupla para implementações totalmente em flash
Esta tabela mostra a eficiência de armazenamento de códigos de paridade dupla e reconstrução local em cada escala para implantações totalmente em flash, que contêm apenas unidades de estado sólido (SSD). O layout de paridade pode usar tamanhos de grupo maiores e obter melhor eficiência de armazenamento em uma configuração totalmente flash.
Domínios de falha | Esquema | Eficiência |
---|---|---|
2 | – | – |
3 | – | – |
4 | RS 2+2 | 50.0% |
5 | RS 2+2 | 50.0% |
6 | RS 2+2 | 50.0% |
7 | RS 4+2 | 66,7% |
oito | RS 4+2 | 66,7% |
9 | RS 6+2 | 75.0% |
10 | RS 6+2 | 75.0% |
11 | RS 6+2 | 75.0% |
12 | RS 6+2 | 75.0% |
13 | RS 6+2 | 75.0% |
14 | RS 6+2 | 75.0% |
15 | RS 6+2 | 75.0% |
16 | LRC (12, 2, 1) | 80.0% |
Exemplos
A menos que você tenha apenas dois servidores, é recomendável usar espelhamento de três vias e/ou paridade dupla, pois eles oferecem melhor tolerância a falhas. Especificamente, eles garantem que todos os dados permaneçam seguros e continuamente acessíveis mesmo quando dois domínios de falha – com espaços de armazenamento diretos, o que significa dois servidores – são afetados por falhas simultâneas.
Exemplos em que tudo fica online
Esses seis exemplos mostram o que o espelhamento de três vias e/ou paridade dupla podem tolerar.
- 1. Uma unidade perdida (inclui unidades de cache)
- 2. Um servidor perdido
- 3. Um servidor e um drive perdidos
- 4. Duas unidades perdidas em servidores diferentes
- 5. Mais de duas unidades perdidas, desde que, no máximo, dois servidores sejam afetados
- 6. Dois servidores perdidos
... em todos os casos, todos os volumes permanecem online. (Verifique se o cluster mantém o quorum.)
Exemplos em que tudo fica offline
Ao longo de seu tempo de vida, os Espaços de Armazenamento podem tolerar qualquer número de falhas, pois restauram a resiliência total após cada uma delas, dado tempo suficiente. No entanto, no máximo dois domínios de falha podem ser afetados com segurança por falhas a qualquer momento. A seguir estão, portanto, exemplos do que o espelhamento de três vias e/ou paridade dupla não podem tolerar.
- 7. Unidades perdidas em três ou mais servidores ao mesmo tempo
- 8. Três ou mais servidores perdidos ao mesmo tempo
Uso
Consulte Criar volumes.
Próximas etapas
Para obter mais leitura sobre os assuntos mencionados neste artigo, consulte o seguinte: