Visão geral da resiliência e continuidade

Como a Microsoft garante a continuidade dos negócios se ocorrer um desastre ou outra ameaça à disponibilidade do serviço?

A equipe de ERCM (Enterprise Resilience and Crisis Management) da Microsoft supervisiona as atividades de gerenciamento de continuidade de negócios e recuperação de desastres em serviços e ofertas de nuvem da Microsoft. Representantes das unidades de negócios da Microsoft coordenam com a equipe do ERCM para desenvolver planos de continuidade de negócios e validar a conformidade com os requisitos de continuidade dos negócios.

O ciclo de vida do BCM (Gerenciamento de Continuidade de Negócios) está no cerne de nossa metodologia BCM. Esse processo de três fases foi projetado para ser adaptável para que possa ser implementado por uma ampla variedade de modelos de negócios em toda a Microsoft. Ele começa com uma fase de Avaliação para identificar processos críticos e objetivos que devem ser incluídos no programa de continuidade de negócios. A fase de Avaliação também requer uma BIA (Análise de Impacto empresarial). A fase de Planejamento se concentra em desenvolver e implementar estratégias de resiliência e recuperação e documentá-las em planos oficiais de continuidade de negócios. Por fim, a Validação de Recursos testa os planos de continuidade dos negócios e suas implementações para verificar a eficácia e identificar possíveis melhorias.

A Microsoft serviços online estratégias de continuidade de negócios usam redundância de hardware, rede e datacenter. A replicação de dados entre datacenters fornece alta disponibilidade e confiabilidade durante um incidente catastrófico. Também aumenta a resiliência a incidentes mundanos, como falha isolada de hardware ou corrupção de dados.

Como a Microsoft testa a continuidade dos negócios e os planos de recuperação de desastres?

A política ERCM (Enterprise Resilience and Crisis Management) da Microsoft estipula que todos os planos de continuidade de negócios e recuperação de desastres da Microsoft devem ser testados, atualizados e revisados anualmente. A Microsoft serviços online testar seus planos de continuidade de negócios pelo menos anualmente por políticas de ERCM. Depois que os relatórios de ação são criados e revisados para validar, testar resultados e informar atualizações de plano em resposta a quaisquer problemas descobertos durante o teste.

Para validar estratégias de resiliência e recuperação em relação a uma ampla gama de incidentes potenciais, o Programa ERCM define várias categorias de cenários de teste que afetam pessoas, locais e tecnologia. O nível de validação necessário para cada serviço baseia-se na importância do serviço, com serviços mais críticos recebendo validação mais rigorosa. Cada equipe de serviço online da Microsoft testa seu plano de continuidade de negócios de acordo com as diretrizes do ERCM para medir a eficácia do plano e a preparação da equipe de serviço para executar o plano.

De acordo com as diretrizes do ERCM, as revisões anuais dos planos de continuidade dos negócios e da validação de capacidade devem ocorrer dentro de 12 meses após a última revisão. A validação de capacidade deve incluir a revisão da documentação de suporte, como a BIA, para garantir que ela permaneça precisa. A Microsoft disponibiliza resultados de validação de recursos para selecionar a Microsoft serviços online disponíveis para nossos clientes por meio de relatórios trimestrais.

Como a Microsoft serviços online garantir que a capacidade do sistema atenda à demanda?

O planejamento de capacidade ajuda as equipes de serviço a alocar os recursos necessários para dar suporte à disponibilidade do serviço online da Microsoft. O planejamento regular de capacidade é necessário como parte do programa ERCM da Microsoft. As equipes de serviço revisam os dados de capacidade durante as revisões trimestrais e durante situações de emergência que garantem mais revisão de capacidade.

Os dados brutos para planejamento de capacidade são mantidos por cada equipe de serviço e incluem métricas como processamento do sistema, memória e capacidade de hardware. As revisões agendadas usam um modelo da capacidade atual do sistema e o testam em relação às necessidades projetivas em situações de emergência. Se o modelo indicar lacunas na capacidade, as alterações propostas na capacidade do sistema serão enviadas à liderança da equipe de serviço para revisão. As alterações aprovadas são incorporadas em um novo modelo antes da implementação pelos engenheiros da equipe de serviço.

Como a Microsoft serviços online manter a disponibilidade de serviço durante falhas rotineiras do sistema?

A Microsoft serviços online obter resiliência de serviço por meio de arquitetura redundante, replicação de dados e verificação de integridade automatizada. A arquitetura redundante envolve a implantação de várias instâncias de um serviço em hardware geograficamente e fisicamente separado, fornecendo maior tolerância a falhas para a Microsoft serviços online. A replicação de dados garante que sempre haja várias cópias de dados do cliente em diferentes zonas de falha, permitindo que dados críticos do cliente sejam recuperados se corrompidos, perdidos ou até mesmo excluídos acidentalmente pelo cliente. A verificação automatizada de integridade aumenta a disponibilidade de dados restaurando automaticamente os dados afetados por muitos tipos de corrupção física ou lógica.

Os serviços online da Microsoft são auditados regularmente para conformidade com regulamentos e certificações externas. Consulte a tabela a seguir para validação de controles relacionados à resiliência e continuidade.

Azure e Dynamics 365

Auditorias externas Section Data do relatório mais recente
ISO 27001/27002

Instrução de Aplicabilidade
Certificado
A.17.1: Continuidade da segurança da informação
A.17.2: Redundâncias
6 de novembro de 2023
ISO 22301

Certificado
Todos os controles 24 de abril de 2023
SOC 1
SOC 2
SOC 3
BC-1: Planos de continuidade de negócios
BC-3: Procedimentos de continuidade de negócios e recuperação de desastres
BC-4: teste BCDR
BC-7: Planos de continuidade de negócios do Datacenter
BC-8: Teste de continuidade de negócios do Datacenter
BC-9: Avaliação de resiliência do Datacenter
DS-5: Componentes de serviço de chave de backup
DS-6: redundância de componentes críticos
DS-7: replicação automática de dados do cliente
DS-8: agendamento de backup
DS-9: procedimentos de restauração de backup
DS-11: backups fora do local
DS-14: restauração automática dos serviços ao cliente
17 de novembro de 2023

Microsoft 365

Auditorias externas Section Data do relatório mais recente
FedRAMP (Office 365) CP-2: plano de contingência
CP-3: treinamento de contingência
CP-4: teste de plano de contingência
CP-6: site de armazenamento alternativo
CP-7: site de processamento alternativo
CP-9: backup do sistema de informações
CP-10: recuperação e reconstituição do sistema de informações
31 de julho de 2023
ISO 27001/27002

Instrução de Aplicabilidade
Certificado
A.17.1: Continuidade da segurança da informação
A.17.2: Redundâncias
março de 2024
ISO 22301
Certificado
Todos os controles março de 2024
SOC 1
SOC 2
CA-49: políticas de backup
CA-50: continuidade dos negócios
CA-51: replicação de dados
23 de janeiro de 2024
SOC 3 CUEC-09: restauração de email exo 23 de janeiro de 2024

Recursos