Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Azure Elastic SAN é um serviço san (rede de área de armazenamento nativo de nuvem) que fornece uma solução de armazenamento escalonável, econômica, de alto desempenho e abrangente para uma variedade de opções de computação. A SAN Elástica permite que você crie e gerencie volumes, que são discos virtuais que podem ser conectados a máquinas virtuais, contêineres ou outros serviços Azure por meio do protocolo iSCSI.
Quando você usa o Azure, a confiabilidade é uma responsabilidade compartilhada. A Microsoft fornece uma variedade de recursos para dar suporte à resiliência e recuperação. Você é responsável por entender como esses recursos funcionam em todos os serviços que você usa e selecionar os recursos necessários para atender aos seus objetivos de negócios e metas de tempo de atividade.
Este artigo descreve como tornar Azure Elastic SAN resilientes a uma variedade de possíveis interrupções e problemas, incluindo falhas transitórias, falhas na zona de disponibilidade e falhas em toda a região. Ele também descreve as opções de backup e recuperação e realça as principais informações sobre o SLA (contrato de nível de serviço) Azure Elastic SAN.
Recomendações de implantação de produção para confiabilidade
Para cargas de trabalho de produção, recomendamos que você:
- Usar ZRS (armazenamento com redundância de zona): O ZRS distribui cópias de seus dados em três zonas de disponibilidade.
- Configure o acesso à rede para reduzir a intervenção manual durante falhas de zona: Os pontos de extremidade privados permitem o failover automático de zona sem intervenção manual, enquanto os pontos de extremidade de serviço podem exigir intervenção manual.
- Para cargas de trabalho que exigem recuperação de desastre entre regiões: Crie instantâneos de seus volumes regularmente e exporte-os para instantâneos de disco gerenciado para proteção de dados. Copie os instantâneos para uma região secundária geograficamente distante da região primária.
Visão geral da arquitetura de confiabilidade
A SAN elástica tem uma hierarquia de recursos de três níveis:
- SAN Elástico: o recurso de nível superior em que você configura a redundância, aloca a capacidade de armazenamento e define limites de desempenho. O número de unidades base alocadas para sua SAN Elástica determina o IOPS total e a taxa de transferência disponíveis em toda a SAN.
- Grupos de volumes: constructos de gerenciamento usados para gerenciar volumes em escala. As configurações de acesso à rede, como pontos de extremidade privados ou pontos de extremidade de serviço, são configuradas no nível do grupo de volumes e herdadas por todos os volumes do grupo.
- Volumes: volumes de armazenamento individuais particionados da capacidade total da SAN. Os volumes são conectados a recursos de computação por meio do protocolo iSCSI.
Para obter mais detalhes sobre os recursos que você implanta, consulte os recursos de SAN Elástico.
Internamente, a SAN Elástica armazena seus dados em clusters de armazenamento. Quando você configura sua SAN Elástica para usar o LRS (armazenamento com redundância local), seus dados são replicados três vezes em um único cluster de armazenamento em um datacenter. Você pode configurar o ZRS (armazenamento com redundância de zona) para armazenar cópias dos dados em três zonas de disponibilidade. Para obter mais informações, consulte Resiliência a falhas de zona de disponibilidade.
Resiliência a falhas transitórias
Falhas transitórias são falhas curtas e intermitentes nos componentes. Elas ocorrem com frequência em um ambiente distribuído, como a nuvem, e são uma parte normal das operações. Falhas transitórias se corrigem após um curto período de tempo. É importante que seus aplicativos possam lidar com falhas transitórias, geralmente repetindo solicitações afetadas.
Todos os aplicativos hospedados na nuvem devem seguir as diretrizes transitórias de tratamento de falhas do Azure quando eles se comunicam com qualquer APIs, bancos de dados e outros componentes hospedados na nuvem. Para obter mais informações, confira Recomendações para tratamento de falhas transitórias.
Se a conexão iSCSI com um volume de SAN Elástico for interrompida, o iniciador iSCSI no cliente tentará se reconectar automaticamente. Você pode experimentar uma breve pausa nas operações de E/S durante a reconexão. Defina o iniciador iSCSI com as configurações de repetição e tempo limite apropriadas para lidar com interrupções transitórias. Para obter recomendações detalhadas de configuração de iSCSI e MPIO, consulte Otimizar o desempenho de sua SAN Elástica.
Resiliência a falhas de zona de disponibilidade
As zonas de disponibilidade são grupos fisicamente separados de datacenters em uma região do Azure. Quando uma zona falha, os serviços podem fazer o failover de uma das zonas restantes.
Azure Elastic SAN pode ser configurado para usar o ZRS (armazenamento com redundância de zona), o que significa que seus dados são replicados de forma síncrona em três zonas de disponibilidade na região. A redundância de zona ajuda você a obter resiliência e confiabilidade para suas cargas de trabalho de produção.
Sua abordagem de conectividade afeta a capacidade da carga de trabalho de fazer failover de forma transparente durante uma falha de zona. É recomendável usar pontos de extremidade privados para se conectar aos volumes. Os endereços de rede privados dão suporte ao failover automático. Se você usar endpoints de serviço, o failover pode exigir intervenção manual. Para obter mais informações sobre as abordagens de conectividade, consulte Saiba mais sobre as configurações de rede para a SAN Elástica.
O uso de LRS (armazenamento com redundância local) deixa a SAN elástica desprotegida contra falhas na zona de disponibilidade. O LRS torna o SAN elástico não zonal por armazenar dados em uma única zona de disponibilidade em vez de distribuí-los entre zonas com ZRS.
Requisitos
Suporte à região: Os recursos de SAN Elástico com redundância de zona podem ser implantados em um subconjunto de regiões. Para obter uma lista de regiões, confira Destinos de escala do Elastic SAN.
Custo
Quando você cria uma SAN elástica com ZRS, o custo é maior que LRS. Para obter mais informações sobre preços, consulte Azure Elastic SAN preços.
Configurar o suporte à zona de disponibilidade
Crie uma SAN Elástica com ZRS: Quando você cria uma SAN Elástica e seleciona o ZRS como a opção de redundância, sua SAN Elástica é automaticamente com redundância de zona. Não é possível alterar a opção de redundância após a criação da SAN Elástica. Para obter mais informações sobre como criar um novo recurso de SAN Elástico, consulte Implantar uma SAN Elástica.
Ative a redundância de zona em uma SAN Elástica LRS existente: Não é possível converter uma SAN Elástica LRS para ZRS diretamente no local. Para migrar, tire um instantâneo dos volumes do SAN Elástico, exporte-os como instantâneos de disco gerenciado, implante um novo Elastic SAN em ZRS e crie volumes no novo Elastic SAN usando esses instantâneos de disco. Para obter mais informações, consulte Snapshot Azure Elastic SAN volumes.
Comportamento quando todas as zonas estão saudáveis
Esta seção descreve o que esperar quando você configura uma SAN elástica para redundância de zona e todas as zonas estão operacionais.
Operação entre zonas: Quando você se conecta a um volume de SAN Elástico, sua conexão iSCSI é roteada para um cluster em uma das zonas de disponibilidade. A plataforma roteia automaticamente o tráfego entre zonas.
Replicação de dados entre zonas: Quando um cliente grava dados em um volume de SAN Elástico, esses dados são gravados de forma síncrona em clusters dentro de três zonas de disponibilidade antes que a operação de gravação seja reconhecida. A replicação síncrona garante um alto nível de consistência de dados e garante que não haja perda de dados durante uma falha de zona.
A implantação de uma Elastic SAN ZRS fornece mais confiabilidade do que uma Elastic SAN LRS, mas adiciona mais latência de gravação. Faça o parâmetro de comparação de sua Elastic SAN e simule a carga de trabalho do aplicativo para comparar a latência entre o LRS e o ZRS, para ver se isso afeta sua carga de trabalho.
Comportamento durante uma falha de zona
Esta seção descreve o que esperar quando você configura uma SAN elástica para redundância de zona e há uma interrupção em uma das zonas.
Detecção e resposta: A plataforma SAN elástica detecta quaisquer falhas em uma zona de disponibilidade. Você não precisa fazer nada para iniciar um failover de zona para SANs elásticas ZRS.
Notificação: A Microsoft não notifica você automaticamente quando uma zona está inoperante. No entanto, você pode usar Integridade do Serviço do Azure para entender a integridade geral do serviço, incluindo quaisquer falhas de zona, e pode configurar alertas Service Health para notificar você sobre problemas.
Solicitações ativas: Quando uma zona de disponibilidade fica indisponível, o serviço pode encerrar operações de E/S em andamento que se conectam a réplicas na zona afetada e você deve repetir essas operações. Se você usar pontos de extremidade privados, o serviço fará failover automaticamente. Se você usar pontos de extremidade de serviço, talvez seja necessário reiniciar o iniciador iSCSI para realizar a comutação em uma zona saudável.
Perda de dados esperada: A SAN elástica impede a perda de dados durante uma falha de zona replicando dados de forma síncrona em três zonas de disponibilidade.
Tempo de inatividade esperado: Quando você usa pontos de extremidade privados, o failover de zona ocorre automaticamente. Você pode enfrentar degradação de desempenho e disponibilidade por alguns minutos após um failover enquanto o SAN se reequilibra.
Quando você usa endpoints de serviço, a SAN Elástica não muda automaticamente para uma zona saudável. Talvez seja necessário reiniciar o iniciador iSCSI para iniciar um failover para uma zona diferente e íntegra.
Redirecionamento de tráfego: Quando uma zona não está disponível, a plataforma SAN Elástica detecta a perda da zona e roteia o tráfego para as zonas íntegras restantes.
Para garantir o failover automático de zona sem intervenção manual, use pontos de extremidade privados para se conectar à Elastic SAN. Ao usar pontos de extremidade de serviço em vez de pontos de extremidade privados, talvez seja necessário reiniciar o iniciador iSCSI manualmente para executar um failover para uma zona saudável.
Recuperação de zona
Quando a zona de disponibilidade se recupera, a plataforma SAN Elástica restaura automaticamente as operações normais e retoma a replicação em três zonas. Você não precisa realizar nenhuma ação.
Testar falhas em zonas
A plataforma Azure Elastic SAN gerencia o roteamento de tráfego, o failover e a recuperação de zona para recursos com redundância de zona. Como esse recurso é totalmente gerenciado, você não precisa validar os processos de falha da zona de disponibilidade.
Resiliência a falhas em toda a região
Azure Elastic SAN é um serviço de região única. Se a região ficar indisponível, o recurso SAN Elástico também ficará indisponível. Não há replicação integrada entre regiões ou failover para o Elastic SAN. Você será responsável por arquitetar sua própria solução de recuperação de desastre de várias regiões se sua carga de trabalho exigir resiliência no nível da região.
Soluções personalizadas de várias regiões para resiliência
Você é responsável por implementar a recuperação de desastre de várias regiões para seus dados de SAN Elástico. A abordagem recomendada é usar instantâneos de volumes:
Crie instantâneos regularmente. Use instantâneos de volume para tirar cópias pontuais de seus volumes Elastic SAN.
O objetivo de ponto de recuperação (RPO) depende da frequência com que você cria e copia os snapshots (instantâneos) para a região secundária. Quanto mais freqüentemente você criar instantâneos e copiá-los, menor será sua possível perda de dados durante um desastre.
Exporte instantâneos para instantâneos de disco gerenciado.Exporte seus instantâneos de volume para instantâneos gerenciados de disco, que podem ser copiados para outras regiões.
Copie instantâneos para uma região secundária.Copie o instantâneo incremental para outra região geograficamente distante da região primária. Isso reduz o risco de várias regiões serem afetadas por um único desastre.
Restaurar a partir de instantâneos. Em um cenário de recuperação de desastre, crie novos volumes na SAN elástica secundária a partir dos instantâneos de disco gerenciado copiados.
O RTO (objetivo de tempo de recuperação) depende do tamanho dos dados, do tempo necessário para copiar instantâneos entre regiões e do tempo necessário para implantar e configurar uma nova SAN Elástica na região secundária. Para reduzir o tempo de recuperação, considere implantar uma SAN elástica secundária em sua região de recuperação antes que ocorra um desastre. Isso também ajuda a evitar restrições de capacidade durante uma interrupção.
Backup e restauração
Para a maioria das soluções, você não deve depender exclusivamente de backups. Em vez disso, use as outras funcionalidades descritas neste guia para dar suporte aos seus requisitos de resiliência. No entanto, os backups protegem contra alguns riscos que outras abordagens não protegem. Para obter mais informações, consulte O que são redundância, replicação e backup?.
A SAN elástica dá suporte a dois tipos de backup:
Azure Elastic SAN backup: Essa funcionalidade de Backup do Azure oferece uma solução totalmente gerenciada para agendar backups, definir cronogramas de expiração para pontos de recuperação e dados de recuperação para um novo volume. Ele ajuda a proteger contra perda de dados contra exclusões acidentais, ransomware e atualizações de aplicativos. Para obter mais informações, consulte Azure Elastic SAN backup (versão prévia).
Importante
Como essa solução é abordada pelos Termos Complementares da Microsoft para Visualizações do Azure, use-a para teste e não para uso em produção.
Instantâneos: Como alternativa, você pode criar e gerenciar instantâneos com base em seus requisitos de proteção de dados.
Azure Elastic SAN suporta instantâneos de volume para proteção de dados. Os instantâneos são cópias incrementais e pontuais de seus volumes que consomem espaço da capacidade total da SAN Elástica. Para proteger seus dados, crie instantâneos regularmente. A frequência depende da quantidade de dados que você pode perder sem comprometer suas operações (seu RPO). Você pode criar instantâneos manualmente ou desenvolver sua própria automação para criá-los de acordo com uma programação.
Os instantâneos são armazenados na mesma SAN Elástica que seus volumes e usam a mesma configuração de redundância. Para proteger contra falhas em toda a região, exporte seus instantâneos para instantâneos de disco gerenciado e copie-os para uma região diferente. Para obter mais informações, consulte Exportar snapshot de volume e Copiar um snapshot incremental para uma nova região.
Você pode criar um novo volume de SAN Elástico a partir de um instantâneo, seja ele um instantâneo comum ou de disco gerenciado. Para obter mais informações, consulte Criar um volume a partir de um instantâneo.
Resiliência à manutenção do serviço
A Microsoft aplica regularmente as atualizações de serviço e executa outras manutenções. A plataforma Azure manipula essas atividades automaticamente, garantindo que a manutenção seja perfeita e transparente para você. Não se espera tempo de inatividade durante eventos de manutenção, a menos que você tenha sido avisado por meio de manutenção planejada do Integridade do Serviço do Azure.
Contrato de nível de serviço
O SLA (contrato de nível de serviço) para serviços de Azure descreve a disponibilidade esperada de cada serviço e as condições que sua solução deve atender para atingir essa expectativa de disponibilidade. Para obter mais informações, consulte SLAs para serviços online.