Topologia de serviço de dados
Em um nível mais alto, a topologia de serviço de dados para a plataforma de dados da Contoso pode ser ilustrada como: Este diagrama lógico abstrai as principais funções do ecossistema de dados da Contoso em uma exibição simplificada e avançada. Essa exibição abstraída dá suporte às seções que abrangem as implantações de cenários, de acordo com a seleção de estratégia de DR (recuperação de desastre) e a segregação de responsabilidades em um processo de recuperação de serviços.
Impacto da recuperação de desastre versus atividade do cliente
As seções a seguir apresentam um detalhamento da atividade da Contoso que é necessária em eventos de DR de impactos variados.
Área: Componentes fundamentais
O Microsoft Entra ID, incluindo direitos de função
- Seleção de SKU da Contoso: Premium P1
- Impacto da DR
- Falha no Data Center do Azure: N/A
- Falha na Zona de Disponibilidade: N/A
- Falha Regional do Azure: N/A
Grupos de Gerenciamento
- Seleção de SKU da Contoso: N/A
- Impacto da DR
- Falha no Data Center do Azure: N/A
- Falha na Zona de Disponibilidade: N/A
- Falha Regional do Azure: N/A
Assinaturas
- Seleção de SKU da Contoso: N/A
- Impacto da DR
- Falha no Data Center do Azure: N/A
- Falha na Zona de Disponibilidade: N/A
- Falha Regional do Azure: N/A
Azure Key Vault
- Seleção de SKU da Contoso: Standard
- Impacto da DR
- Falha no Data Center do Azure: N/A
- Falha na Zona de Disponibilidade: N/A
- Falha Regional do Azure: N/A
Azure Monitor
- Seleção de SKU da Contoso: N/A
- Impacto da DR
- Falha no Data Center do Azure: N/A
- Falha na Zona de Disponibilidade: N/A
- Falha Regional do Azure: N/A
Microsoft Defender para Nuvem
- Seleção de SKU da Contoso: N/A
- Impacto da DR
- Falha no Data Center do Azure: N/A
- Falha na Zona de Disponibilidade: N/A
- Falha Regional do Azure: N/A
Gerenciamento de Custos
- Seleção de SKU da Contoso: N/A
- Impacto da DR
- Falha no Data Center do Azure: N/A
- Falha na Zona de Disponibilidade: N/A
- Falha Regional do Azure: N/A
DNS do Azure
- Seleção de SKU da Contoso: N/A
- Impacto da DR
- Falha no Data Center do Azure: N/A
- Falha na Zona de Disponibilidade: N/A
- Falha Regional do Azure: N/A
Observador de Rede
- Seleção de SKU da Contoso: N/A
- Impacto da DR
- Falha no Data Center do Azure: N/A
- Falha na Zona de Disponibilidade: N/A
- Falha Regional do Azure: N/A
Cofre dos Serviços de Recuperação
- Seleção de SKU da Contoso: padrão (GRS (armazenamento com redundância geográfica))
- Impacto da DR
- Falha no Data Center do Azure: N/A
- Falha na Zona de Disponibilidade: N/A
- Falha Regional do Azure: N/A
- Notas
- A Restauração entre regiões permitirá a realização de simulações de recuperação de desastre e fazer failover do cliente para a região secundária
Redes virtuais, incluindo sub-redes, UDR (rota definida pelo usuário) e NSG (grupos de segurança de rede)
- Seleção de SKU da Contoso: N/A
- Impacto da DR
- Falha no Data Center do Azure: N/A
- Falha na Zona de Disponibilidade: N/A
- Falha Regional do Azure: a Contoso precisaria reimplantar as VNets da plataforma Foundation and Data com os UDRs & NSGs anexados na região secundária
- Notas
- O Gerenciador de Tráfego pode ser usado para rotear geograficamente o tráfego entre regiões que contêm estruturas VNet de réplica. Se tiverem o mesmo espaço de endereço, não poderão ser conectados à rede local, pois isso causaria problemas de roteamento. No momento de um desastre e da perda de uma VNet em uma região, você pode conectar a outra VNet na região disponível com o espaço de endereço correspondente à rede local
Grupos de recursos
- Seleção de SKU da Contoso: N/A
- Impacto da DR
- Falha no Data Center do Azure: N/A
- Falha na Zona de Disponibilidade: N/A
- Falha Regional do Azure: a Contoso precisaria reimplantar os grupos de recursos da plataforma Foundation and Data na região secundária
- Notas
- Essa atividade seria atenuada implementando a estratégia "Warm Spare", tendo a topologia de rede e grupo de recursos disponível na região secundária
Firewall do Azure
- Seleção de SKU da Contoso: Standard
- Impacto da DR
- Falha no Data Center do Azure: N/A
- Falha na Zona de Disponibilidade: a Contoso precisaria validar a disponibilidade e reimplantar, se necessário
- Falha Regional do Azure: a Contoso precisaria reimplantar os Firewalls do Azure Foundation na região secundária
- Notas
- O Firewall do Azure pode ser criado com Zonas de Disponibilidade para aumentar a disponibilidade
- Uma estratégia "Warm Spare" atenuaria essa atividade
Azure DDoS
- Seleção de SKU da Contoso: Proteção de Rede
- Impacto da DR
- Falha no Data Center do Azure: N/A
- Falha na Zona de Disponibilidade: N/A
- Falha Regional do Azure: a Contoso precisaria criar um plano de proteção contra DDoS para os VNETs do Foundation na região secundária
ExpressRoute – Circuito
- Seleção de SKU da Contoso: Standard
- Impacto da DR
- Falha no Data Center do Azure: N/A
- Falha na Zona de Disponibilidade: N/A
- Falha Regional do Azure: N/A
- Notas
- O circuito físico continua a ser responsabilidade da Microsoft e do parceiro de conectividade a recuperar
Gateway de VPN
- Seleção de SKU da Contoso: VpnGw1
- Impacto da DR
- Falha no Data Center do Azure: N/A
- Falha na Zona de Disponibilidade: a Contoso precisaria validar a disponibilidade e reimplantar, se necessário
- Falha Regional do Azure: a Contoso precisaria reimplantar os Gateways de VPN Foundation na região secundária
- Notas
- Os Gateways de VPN podem ser criados com Zonas de Disponibilidade para aumentar a disponibilidade
- Uma estratégia "Warm Spare" atenuaria essa atividade
Load Balancer
- Seleção de SKU da Contoso: Standard
- Impacto da DR
- Falha no Data Center do Azure: N/A
- Falha na Zona de Disponibilidade: a Contoso precisaria validar a disponibilidade e reimplantar, se necessário
- Falha Regional do Azure: a Contoso precisaria reimplantar os Load Balancers Foundation na região secundária
- Notas
- Dependendo da região primária, é possível usar um design com redundância de zona ou entre regiões para elevar essa postura
Azure DevOps
- Seleção de SKU da Contoso: DevOps Services
- Impacto da DR
- Falha no Data Center do Azure: N/A
- Falha na Zona de Disponibilidade: N/A
- Falha Regional do Azure: N/A
- Notas
- O DevOps Services é criado com base no backbone do Azure e usa o armazenamento de blobs do Azure com replicação geográfica para garantir a resiliência
Área: componentes da Plataforma de Dados
Conta de armazenamento – Azure Data Lake Gen2
- Seleção de SKU da Contoso: LRS (armazenamento com redundância local)
- Impacto da DR
- Falha no Data Center do Azure: N/A
- Falha na Zona de Disponibilidade: a Contoso precisaria validar a disponibilidade e reimplantar, se necessário
- Falha Regional do Azure: a Contoso precisaria reimplantar as Contas de Armazenamento da Plataforma de Dados e reidratá-las com dados na região secundária
- Notas
- As contas de armazenamento têm uma ampla gama de opções de redundância de dados da redundância de região primária até a redundância de região secundária
- Para a região secundária, os dados de redundância são replicados para a região secundária de maneira assíncrona. Uma falha que afeta a região primária pode resultar em perda de dados quando a região primária não pode ser recuperada. O Armazenamento do Azure geralmente tem um RPO (objetivo de ponto de recuperação) de menos de 15 minutos
- No caso de uma interrupção regional, as contas de armazenamento com redundância geográfica estariam disponíveis na região secundária como LRS. Seria necessário aplicar uma configuração adicional para elevar esses componentes na região secundária para que sejam redundantes geograficamente
Azure Synapse – Pipelines
- Seleção de SKU da Contoso: Computação Otimizada Gen2
- Impacto da DR
- Falha no Data Center do Azure: N/A
- Falha na Zona de Disponibilidade: N/A
- Falha Regional do Azure: a Contoso precisaria implantar e restaurar o Azure Synapse Analytics da Plataforma de Dados na região secundária e reimplantar os pipelines
- Notas
- Os pontos de restauração automática são excluídos após sete dias
- Os pontos de restauração definidos pelo usuário estão disponíveis. Atualmente, há um teto de 42 pontos de restauração definidos pelo usuário que são automaticamente excluídos após sete dias
- O Synapse também pode executar uma restauração de BD na região local ou remota e, em seguida, PAUSAR a instância imediatamente. Esse processo gerará apenas custos de armazenamento e terá custo zero de computação. Isso proporciona uma maneira de manter uma cópia "dinâmica" do BD em intervalos específicos
Hubs de eventos do Azure
- Seleção de SKU da Contoso: Standard
- Impacto da DR
- Falha no Data Center do Azure: N/A
- Falha na Zona de Disponibilidade: N/A
- Falha Regional do Azure: a Contoso precisaria reimplantar a instância dos Hubs de Eventos na região secundária
- Notas
- Quando você usa o portal do Azure, a redundância de zona por meio do suporte para zonas de disponibilidade é habilitada automaticamente, isso pode ser desabilitado por meio da CLI do Azure ou comandos do PowerShell
- Essa resiliência pode ser estendida para cobrir uma interrupção completa da região com Recuperação de desastre geográfico
Hubs IoT do Azure
- Seleção de SKU da Contoso: Standard
- Impacto da DR
- Falha no Data Center do Azure: N/A
- Falha na Zona de Disponibilidade: N/A
- Falha Regional do Azure: a Contoso precisaria reimplantar o Hub IoT na região secundária
- Notas
- O Hub IoT fornece HA entre Regiões e usará automaticamente uma zona de disponibilidade se criado em um conjunto predefinido de regiões do Azure
Azure Stream Analytics
- Seleção de SKU da Contoso: Standard
- Impacto da DR
- Falha no Data Center do Azure: N/A
- Falha na Zona de Disponibilidade: N/A
- Falha Regional do Azure: a Contoso precisaria reimplantar o Hub IoT na região secundária
- Notas
- Um dos principais recursos do Stream Analytics é sua capacidade de se recuperar de Falhas no nó
Serviços de IA do Azure (anteriormente Serviços Cognitivos)
- Seleção de SKU da Contoso: Pré-pago
- Impacto da DR
- Falha no Data Center do Azure: N/A
- Falha na Zona de Disponibilidade: N/A
- Falha Regional do Azure: N/A
Azure Machine Learning
- Seleção de SKU da Contoso: Uso Geral – Instâncias da Série D
- Impacto da DR
- Falha no Data Center do Azure: a Contoso precisaria validar a disponibilidade e reimplantar, se necessário
- Falha na Zona de Disponibilidade: a Contoso precisaria validar a disponibilidade e reimplantar, se necessário
- Falha Regional do Azure: a Contoso precisaria reimplantar o Machine Learning na região secundária
- Notas
- Enquanto a infraestrutura do Machine Learning é gerenciada pela Microsoft; os recursos associados são gerenciados pelo cliente. Apenas o Key Vault está altamente disponível por padrão
- Dependendo da criticidade do serviço com suporte, a Microsoft recomenda uma implantação multirregional
Azure Synapse – Pools do Data Explorer
- Seleção de SKU da Contoso: Computação Otimizada, Pequena (4 núcleos)
- Impacto da DR
- Falha no Data Center do Azure: N/A
- Falha na Zona de Disponibilidade: N/A
- Falha Regional do Azure: a Contoso precisaria reimplantar o Azure Synapse – Pools do Data Explorer e pipelines na região secundária
Azure Synapse – Pools do Spark
- Seleção de SKU da Contoso: Computação Otimizada Gen2
- Impacto da DR
- Falha no Data Center do Azure: N/A
- Falha na Zona de Disponibilidade: N/A
- Falha Regional do Azure: a Contoso precisaria reimplantar o Azure Synapse – Pools do Spark e pipelines na região secundária
- Notas
- Se um metastore externo do Hive for usado, isso também precisará de uma estratégia de recuperação em vigor
- O Azure Site Recovery pode ser usado para um metastore do SQL Server
- Um metastore do MySQL usaria o recurso de restauração geográfica ou réplicas de leitura entre regiões
- Se um metastore externo do Hive for usado, isso também precisará de uma estratégia de recuperação em vigor
Azure Synapse – Pools de SQL dedicados e sem servidor
- Seleção de SKU da Contoso: Computação Otimizada Gen2
- Impacto da DR
- Falha no Data Center do Azure: N/A
- Falha na Zona de Disponibilidade: N/A
- Falha Regional do Azure: a Contoso precisaria implantar e restaurar o Azure Synapse Analytics da Plataforma de Dados na região secundária
- Notas
- Os pontos de restauração automática são excluídos após sete dias
- Os pontos de restauração definidos pelo usuário estão disponíveis. Atualmente, há um teto de 42 pontos de restauração definidos pelo usuário que são automaticamente excluídos após sete dias
- O Synapse também pode executar uma restauração de BD na região local ou remota e, em seguida, PAUSAR a instância imediatamente. Isso gerará apenas custos de armazenamento e terá custo zero de computação. Essa solução proporciona uma maneira de manter uma cópia "dinâmica" do BD em intervalos específicos
Power BI
- Seleção de SKU da Contoso: Power BI Pro
- Impacto da DR
- Falha no Data Center do Azure: N/A
- Falha na Zona de Disponibilidade: N/A
- Falha Regional do Azure: N/A
- Notas
- O cliente não precisará fazer nada se a interrupção for decidida/declarada pela equipe do Power BI
- Uma instância de serviço do Power BI com failover só dá suporte a operações de leitura. Relatórios que usam Direct Query ou Live Connect não funcionarão durante um failover
- O cliente não precisará fazer nada se a interrupção for decidida/declarada pela equipe do Power BI
Azure Cosmos DB
- Seleção de SKU da Contoso: Gravação de Região Única com Backup periódico
- Impacto da DR
- Falha no Data Center do Azure: N/A
- Falha na Zona de Disponibilidade: N/A
- Falha Regional do Azure: a Contoso deve monitorar, garantindo que haja RUs (unidades de solicitação) provisionadas suficientes nas regiões restantes para dar suporte a atividades de leitura e gravação
- Notas
- Contas de região única poderão perder disponibilidade após uma indisponibilidade regional. Para garantir a alta disponibilidade da instância do Cosmos DB, configure-a com uma única região de gravação e pelo menos uma segunda região (leitura) e habilite o failover gerenciado pelo serviço
- Para evitar a perda de disponibilidade de gravação, ele avisou que as cargas de trabalho de produção estão configuradas com a opção "habilitar failover gerenciado pelo serviço", permitindo o failover automático para regiões disponíveis
Azure AI Search (anteriormente Cognitive Search)
- Seleção de SKU da Contoso: Standard S1
- Impacto da DR
- Falha no Data Center do Azure: a Contoso precisaria validar a disponibilidade e reimplantar, se necessário
- Falha na Zona de Disponibilidade: a Contoso precisaria validar a disponibilidade e reimplantar, se necessário
- Falha Regional do Azure: a Contoso precisaria reimplantar o AI Search na região secundária
- Notas
- não existe mecanismo integrado para recuperação de desastres
- Implementar várias réplicas do AI Search entre zonas de disponibilidade resolverá o risco de interrupção do data center
Azure Data Share
- Seleção de SKU da Contoso: N/A
- Impacto da DR
- Falha no Data Center do Azure: a Contoso precisaria validar a disponibilidade e reimplantar, se necessário
- Falha na Zona de Disponibilidade: a Contoso precisaria validar a disponibilidade e reimplantar, se necessário
- Falha Regional do Azure: a Contoso precisaria reimplantar o Data Share na região secundária
- Notas
- No momento, o Azure Data Share não é compatível com as zonas de disponibilidade
- A elevação do Data Share para uma implantação de HA resolverá cada um desses riscos de interrupção
Purview
- Seleção de SKU da Contoso: N/A
- Impacto da DR
- Falha no Data Center do Azure: N/A
- Falha na Zona de Disponibilidade: a Contoso precisaria validar a disponibilidade e reimplantar, se necessário
- Falha Regional do Azure: a Contoso precisaria implantar uma instância do Purview na região secundária
- Notas
- Essa atividade seria atenuada implementando a estratégia "Warm Spare", tendo uma segunda instância do Azure Purview disponível na região secundária
- Uma abordagem "Warm Spare" tem as seguintes características principais:
- As contas primárias e secundárias do Azure Purview não podem ser configuradas para as mesmas contas do Azure Data Factory, do Azure Data Share nem do Synapse Analytics, se aplicável. Como resultado, a linhagem do Azure Data Factory e do Azure Data Share não pode ser vista nas contas secundárias do Azure Purview
- Os runtimes de integração são específicos de uma conta do Azure Purview. Portanto, caso as verificações devam ser executadas em paralelo nas contas primárias e secundárias do Azure Purview, vários runtimes de integração auto-hospedada deverão ser mantidos
Observação
Esta seção serve como orientação geral. A documentação do fornecedor sobre recuperação de desastre, redundância e backup deve ser consultada para determinar a abordagem correta para um novo componente/serviço que esteja considerando.
"Falha no Data Center do Azure" aborda a situação em que a região afetada não tem Zonas de Disponibilidade oferecidas.
Se a configuração ou as versões novas/atualizadas ocorreram no momento do evento de desastre, elas deverão ser verificadas e reimplantadas (se necessário) como parte do trabalho para atualizar a plataforma até a data atual.
Próximas etapas
Agora que você aprendeu sobre os detalhes do cenário, saiba mais sobre as recomendações relacionadas a esse cenário