Editar

Share via


DR para Plataforma de Dados do Azure - Detalhes do cenário

Azure Synapse Analytics
Azure Machine Learning
Azure Cosmos DB
Azure Data Lake
Azure Event Hubs

Topologia de serviço de dados

Em um alto nível, a topologia de serviço de dados para a plataforma de dados da Contoso pode ser ilustrada como: Diagrama da topologia de serviço de dados de alto nível da Contoso. Este diagrama lógico abstrai as principais funções do ecossistema de dados da Contoso em uma exibição simplificada e de alto nível. Essa visão abstrata suporta as seções que abrangem as implantações de cenário, de acordo com a seleção da estratégia de DR e a segregação de responsabilidades em um processo de recuperação de serviço.

Impacto DR vs Atividade do Cliente

As seções a seguir apresentam um detalhamento da atividade da Contoso necessária em eventos de DR de impactos variados.

Área: Componentes fundamentais

  • ID do Microsoft Entra, incluindo direitos de função

    • Seleção de SKU da Contoso: Premium P1
    • Impacto DR
      • Falha do Data Center do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha Regional do Azure: N/A
  • Grupos de Gestão

    • Seleção de SKU da Contoso: N/A
    • Impacto DR
      • Falha do Data Center do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha Regional do Azure: N/A
  • Subscrições

    • Seleção de SKU da Contoso: N/A
    • Impacto DR
      • Falha do Data Center do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha Regional do Azure: N/A
  • Azure Key Vault

    • Seleção de SKU da Contoso: padrão
    • Impacto DR
      • Falha do Data Center do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha Regional do Azure: N/A
  • Azure Monitor

    • Seleção de SKU da Contoso: N/A
    • Impacto DR
      • Falha do Data Center do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha Regional do Azure: N/A
  • Microsoft Defender para Cloud

    • Seleção de SKU da Contoso: N/A
    • Impacto DR
      • Falha do Data Center do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha Regional do Azure: N/A
  • Cost Management

    • Seleção de SKU da Contoso: N/A
    • Impacto DR
      • Falha do Data Center do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha Regional do Azure: N/A
  • Azure DNS

    • Seleção de SKU da Contoso: N/A
    • Impacto DR
      • Falha do Data Center do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha Regional do Azure: N/A
  • Observador de rede

    • Seleção de SKU da Contoso: N/A
    • Impacto DR
      • Falha do Data Center do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha Regional do Azure: N/A
  • Cofre dos Serviços de Recuperação

    • Seleção de SKU da Contoso: Padrão (GRS)
    • Impacto DR
      • Falha do Data Center do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha Regional do Azure: N/A
    • Observações
      • A restauração entre regiões habilitará exercícios de DR e o failover do cliente para a região secundária
  • Redes Virtuais, incluindo Sub-redes, UDR e NSGs

    • Seleção de SKU da Contoso: N/A
    • Impacto DR
      • Falha do Data Center do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha Regional do Azure: a Contoso precisaria reimplantar as VNets da plataforma Foundation e Data com seus UDRs ou NSGs anexados na região secundária
    • Observações
      • O Gerenciador de Tráfego pode ser usado para rotear geograficamente o tráfego entre regiões que contêm réplicas de estruturas VNet. Se eles tiverem o mesmo espaço de endereço, não poderão ser conectados à rede local, pois isso causaria problemas de roteamento. No momento de um desastre e perda de uma VNet em uma região, você pode conectar a outra VNet na região disponível, com o espaço de endereço correspondente à sua rede local
  • Grupos de Recursos

    • Seleção de SKU da Contoso: N/A
    • Impacto DR
      • Falha do Data Center do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha Regional do Azure: a Contoso precisaria reimplantar os grupos de Recursos da plataforma Foundation e Data na região secundária
    • Observações
      • Esta atividade seria mitigada pela implementação da estratégia "Warm Spare", tendo a topologia de rede e grupo de recursos disponível na região secundária
  • Azure Firewall

    • Seleção de SKU da Contoso: padrão
    • Impacto DR
      • Falha do Data Center do Azure: N/A
      • Falha na zona de disponibilidade: a Contoso precisaria validar a disponibilidade e reimplantá-la, se necessário
      • Falha Regional do Azure: a Contoso precisaria reimplantar os Firewalls do Azure Foundation na região secundária
    • Observações
      • O Firewall do Azure pode ser criado com zonas de disponibilidade para aumentar a disponibilidade
      • Uma estratégia de "Warm Spare" mitigaria esta atividade
  • Azure DDoS

    • Seleção de SKU da Contoso: Proteção de rede
    • Impacto DR
      • Falha do Data Center do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha Regional do Azure: a Contoso precisaria criar um plano de proteção contra DDoS para as VNETs da Fundação na região secundária
  • Rota Expressa – Circuito

    • Seleção de SKU da Contoso: padrão
    • Impacto DR
      • Falha do Data Center do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha Regional do Azure: N/A
    • Observações
      • O circuito físico continuaria a ser da responsabilidade da Microsoft e do parceiro de conectividade para recuperar
  • Gateway de VPN

    • Seleção de SKU da Contoso: VpnGw1
    • Impacto DR
      • Falha do Data Center do Azure: N/A
      • Falha na zona de disponibilidade: a Contoso precisaria validar a disponibilidade e reimplantá-la, se necessário
      • Falha Regional do Azure: a Contoso precisaria reimplantar os Gateways de VPN de Base na região secundária
    • Observações
      • Gateways VPN podem ser criados com zonas de disponibilidade para maior disponibilidade
      • Uma estratégia de "Warm Spare" mitigaria esta atividade
  • Balanceador de Carga

    • Seleção de SKU da Contoso: padrão
    • Impacto DR
      • Falha do Data Center do Azure: N/A
      • Falha na zona de disponibilidade: a Contoso precisaria validar a disponibilidade e reimplantá-la, se necessário
      • Falha Regional do Azure: a Contoso precisaria reimplantar os Balanceadores de Carga de Base na região secundária
    • Observações
  • Azure DevOps

Área: Componentes da plataforma de dados

  • Conta de Armazenamento – Azure Data Lake Gen2

    • Seleção de SKU da Contoso: LRS
    • Impacto DR
      • Falha do Data Center do Azure: N/A
      • Falha na zona de disponibilidade: a Contoso precisaria validar a disponibilidade e reimplantá-la, se necessário
      • Falha Regional do Azure: a Contoso precisaria reimplantar as Contas de Armazenamento da Plataforma de Dados e reidratá-las com dados na região secundária
    • Observações
      • As contas de armazenamento têm uma ampla gama de opções de redundância de dados, desde redundância de região primária até redundância de região secundária
      • Para a região secundária, os dados de redundância são replicados para a região secundária de forma assíncrona. Uma falha que afeta a região primária pode resultar em perda de dados se a região primária não puder ser recuperada. O Armazenamento do Azure normalmente tem um RPO de menos de 15 minutos
      • No caso de uma interrupção regional, as contas de armazenamento que são redundantes geograficamente estariam disponíveis na região secundária como LRS. Configuração adicional precisaria ser aplicada para elevar esses componentes na região secundária para serem redundantes geograficamente
  • Azure Synapse - Pipelines

    • Seleção de SKU da Contoso: Gen2 otimizada computada
    • Impacto DR
      • Falha do Data Center do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha Regional do Azure: a Contoso precisaria implantar e restaurar a Plataforma de Dados Azure Synapse Analytics na região secundária e reimplantar os pipelines
    • Observações
      • Os pontos de restauração automática são excluídos após sete dias
      • Pontos de restauração definidos pelo usuário estão disponíveis. Atualmente, há um limite de 42 pontos de restauração definidos pelo usuário que são excluídos automaticamente após sete dias
      • O Synapse também pode executar uma restauração de banco de dados na região local ou remota e, em seguida, PAUSAR imediatamente a instância. Esse processo incorrerá apenas em custos de armazenamento – e terá custos de computação zero. Isso oferece uma maneira de manter uma cópia de banco de dados "ao vivo" em intervalos específicos
  • Hubs de Eventos do Azure

    • Seleção de SKU da Contoso: padrão
    • Impacto DR
      • Falha do Data Center do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha Regional do Azure: a Contoso precisaria reimplantar a instância dos Hubs de Eventos na região secundária
    • Observações
      • Quando você usa o portal do Azure, a redundância de zona por meio do suporte para zonas de disponibilidade é habilitada automaticamente, isso pode ser desabilitado usando os comandos da CLI do Azure ou do PowerShell
      • Essa resiliência pode ser estendida para cobrir uma interrupção completa da região com a recuperação de desastres geográficos
  • Azure IoT Hubs

    • Seleção de SKU da Contoso: padrão
    • Impacto DR
      • Falha do Data Center do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha Regional do Azure: a Contoso precisaria reimplantar o Hub IoT na região secundária
    • Observações
  • Azure Stream Analytics

    • Seleção de SKU da Contoso: padrão
    • Impacto DR
      • Falha do Data Center do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha Regional do Azure: a Contoso precisaria reimplantar o Hub IoT na região secundária
    • Observações
      • Uma característica fundamental do Stream Analytics é sua capacidade de se recuperar de uma falha de
  • Serviços de IA do Azure (anteriormente Serviços Cognitivos)

    • Seleção de SKU da Contoso: pague conforme o uso
    • Impacto DR
      • Falha do Data Center do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha Regional do Azure: N/A
  • Azure Machine Learning

    • Seleção de SKU da Contoso: Uso Geral – instâncias da Série D
    • Impacto DR
      • Falha do Data Center do Azure: a Contoso precisaria validar a disponibilidade e reimplantá-la, se necessário
      • Falha na zona de disponibilidade: a Contoso precisaria validar a disponibilidade e reimplantá-la, se necessário
      • Falha Regional do Azure: a Contoso precisaria reimplantar o Aprendizado de Máquina na região secundária
    • Observações
  • Azure Synapse – Data Explorer Pools

    • Seleção de SKU da Contoso: Otimizado Computado, Pequeno (4 núcleos)
    • Impacto DR
      • Falha do Data Center do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha Regional do Azure: a Contoso precisaria reimplantar a Sinapse do Azure – Pools e pipelines do Data Explorer na região secundária
  • Azure Synapse – Piscinas de faíscas

    • Seleção de SKU da Contoso: Gen2 otimizada para computação
    • Impacto DR
      • Falha do Data Center do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha Regional do Azure: a Contoso precisaria reimplantar o Azure Synapse – Spark Pools e pipelines na região secundária
    • Observações
      • Se um metastore externo do Hive for usado, isso também precisará de uma estratégia de recuperação em vigor
  • Azure Synapse – Pools SQL dedicados e sem servidor

    • Seleção de SKU da Contoso: Gen2 otimizada para computação
    • Impacto DR
      • Falha do Data Center do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha Regional do Azure: a Contoso precisaria implantar e restaurar a Plataforma de Dados Azure Synapse Analytics na região secundária
    • Observações
      • Os pontos de restauração automática são excluídos após sete dias
      • Pontos de restauração definidos pelo usuário estão disponíveis. Atualmente, há um limite de 42 pontos de restauração definidos pelo usuário que são excluídos automaticamente após sete dias
      • O Synapse também pode executar uma restauração de banco de dados na região local ou remota e, em seguida, PAUSAR imediatamente a instância. Isso só incorrerá em custos de armazenamento – e terá custos de computação zero. Esta solução oferece uma maneira de manter uma cópia de banco de dados "ao vivo" em intervalos específicos
  • Power BI

  • BD do Cosmos para o Azure

    • Seleção de SKU da Contoso: Gravação de região única com backup periódico
    • Impacto DR
      • Falha do Data Center do Azure: N/A
      • Falha na zona de disponibilidade: N/A
      • Falha Regional do Azure: a Contoso deve monitorar, garantindo que haja RUs provisionadas suficientes nas regiões restantes para dar suporte a atividades de leitura e gravação
    • Observações
      • As contas de uma única região podem perder disponibilidade após uma interrupção regional. Para garantir a alta disponibilidade de sua instância do Cosmos DB, configure-a com uma única região de gravação e pelo menos uma segunda região (de leitura) e habilite o failover gerenciado pelo serviço
      • Para evitar a perda de disponibilidade de gravação, recomendou que as cargas de trabalho de produção fossem configuradas com "habilitar failover gerenciado por serviço", permitindo failover automático para regiões disponíveis
  • Azure AI Search (anteriormente Pesquisa Cognitiva)

    • Seleção de SKU da Contoso: Standard S1
    • Impacto DR
      • Falha do Data Center do Azure: a Contoso precisaria validar a disponibilidade e reimplantá-la, se necessário
      • Falha na zona de disponibilidade: a Contoso precisaria validar a disponibilidade e reimplantá-la, se necessário
      • Falha Regional do Azure: a Contoso precisaria reimplantar a Pesquisa de IA na região secundária
    • Observações
      • Não há nenhum mecanismo integrado para recuperação de desastres
      • A implementação de várias réplicas de pesquisa de IA em zonas de disponibilidade resolverá o risco de interrupção do data center
  • Compartilhamento de Dados do Azure

    • Seleção de SKU da Contoso: N/A
    • Impacto DR
      • Falha do Data Center do Azure: a Contoso precisaria validar a disponibilidade e reimplantá-la, se necessário
      • Falha na zona de disponibilidade: a Contoso precisaria validar a disponibilidade e reimplantá-la, se necessário
      • Falha Regional do Azure: a Contoso precisaria reimplantar o Compartilhamento de Dados na região secundária
    • Observações
  • Âmbito

    • Seleção de SKU da Contoso: N/A
    • Impacto DR
      • Falha do Data Center do Azure: N/A
      • Falha na zona de disponibilidade: a Contoso precisaria validar a disponibilidade e reimplantá-la, se necessário
      • Falha Regional do Azure: a Contoso precisaria implantar uma instância do Purview na região secundária
    • Observações
      • Essa atividade seria atenuada pela implementação da estratégia "Warm Spare", tendo uma segunda instância do Azure Purview disponível na região secundária
      • Uma abordagem "Warm Spare" tem os seguintes textos explicativos:
        • As contas primárias e secundárias do Azure Purview não podem ser configuradas para as mesmas contas do Azure Data Factory, Azure Data Share e Synapse Analytics, se aplicável. Como resultado, a linhagem do Azure Data Factory e do Azure Data Share não pode ser vista nas contas secundárias do Azure Purview
        • Os tempos de execução de integração são específicos para uma conta do Azure Purview. Portanto, se as verificações tiverem de ser executadas em contas primárias e secundárias do Azure Purview em paralelo, vários tempos de execução de integração auto-hospedados deverão ser mantidos

Nota

Esta secção destina-se a servir de orientação geral. A documentação do fornecedor sobre recuperação de desastres, redundância e backup deve ser consultada para a abordagem correta para um novo componente/serviço em consideração.

"Falha do Data Center do Azure" abrange a situação em que a região afetada não tem Zonas de Disponibilidade oferecidas.

Se novas configurações ou versões atualizadas ocorrerem no ponto do evento de desastre, elas devem ser verificadas e reimplantadas (se necessário) como parte do trabalho para atualizar a plataforma até a data atual.

Próximos passos

Agora que você aprendeu sobre os detalhes do cenário, você pode aprender sobre as recomendações relacionadas a este cenário