Compartilhar via


Visão geral da resiliência e continuidade

Como é que a Microsoft garante a continuidade do negócio se ocorrer um desastre ou outra ameaça à disponibilidade do serviço?

A equipa de Resiliência Empresarial e Gestão de Crises (ERCM) da Microsoft supervisiona a gestão da continuidade do negócio e as atividades de recuperação após desastre em serviços Microsoft e ofertas na cloud. Os representantes das unidades empresariais da Microsoft coordenam-se com a equipa do ERCM para desenvolver planos de continuidade de negócio e validar a conformidade com os requisitos de continuidade do negócio.

O ciclo de vida da Gestão de Continuidade de Negócio (BCM) está no centro da nossa metodologia bcm. Este processo trifásico foi concebido para ser adaptável para que possa ser implementado por uma grande variedade de modelos de negócio em toda a Microsoft. Começa com uma fase de Avaliação para identificar processos e objetivos críticos que devem ser incluídos no programa de continuidade de negócio. A fase de Avaliação também requer uma Análise de Impacto Comercial (BIA). A fase de Planeamento centra-se no desenvolvimento e implementação de estratégias de resiliência e recuperação e documenta-as em planos oficiais de continuidade de negócio. Por fim, a Validação de Capacidade testa os planos de continuidade do negócio e as respetivas implementações para verificar a eficácia e identificar potenciais melhorias.

As estratégias de continuidade de negócio dos serviços online da Microsoft utilizam redundância de hardware, rede e datacenter. A replicação de dados entre datacenters fornece elevada disponibilidade e fiabilidade durante um incidente catastrófico. Também aumenta a resiliência a incidentes mundanos, como falhas de hardware isoladas ou danos em dados.

Como é que a Microsoft testa a continuidade do negócio e os planos de recuperação após desastre?

A política de Resiliência Empresarial e Gestão de Crises (ERCM) da Microsoft estipula que todos os planos de continuidade de negócio e recuperação após desastre da Microsoft têm de ser testados, atualizados e revistos anualmente. Os serviços online da Microsoft testam os seus planos de continuidade de negócio, pelo menos anualmente, de acordo com as políticas ERCM. Após os relatórios de Ação serem criados e revistos para validar, teste os resultados e informe as atualizações do plano em resposta a quaisquer problemas detetados durante os testes.

Para validar estratégias de resiliência e recuperação relativamente a uma vasta gama de potenciais incidentes, o Programa ERCM define várias categorias de cenários de teste que afetam pessoas, localizações e tecnologia. O nível de validação necessário para cada serviço baseia-se na importância do serviço, com serviços mais críticos recebendo validação mais rigorosa. Cada equipa de serviço online da Microsoft testa o seu plano de continuidade de negócio de acordo com as diretrizes da ERCM para medir a eficácia do plano e a disponibilidade da equipa de serviço para executar o plano.

De acordo com as diretrizes da ERCM, as revisões anuais dos planos de continuidade do negócio e da validação de capacidade têm de ocorrer no prazo de 12 meses após a última revisão. A validação de capacidade tem de incluir a revisão da documentação de suporte, como o BIA, para garantir que permanece precisa. A Microsoft disponibiliza resultados de validação de capacidade para serviços online da Microsoft selecionados aos nossos clientes através de relatórios trimestrais.

Como é que os serviços online da Microsoft garantem que a capacidade do sistema satisfaz a procura?

O planeamento de capacidade ajuda as equipas de serviços a alocar os recursos necessários para suportar a disponibilidade do serviço online da Microsoft. O planeamento de capacidade regular é necessário como parte do programa ERCM da Microsoft. As equipas de serviços analisam os dados de capacidade durante as revisões trimestrais e durante situações de emergência que garantem uma maior revisão da capacidade.

Os dados não processados para o planeamento de capacidade são mantidos por cada equipa de serviço e incluem métricas como o processamento do sistema, a memória e a capacidade de hardware. As revisões agendadas usam um modelo da capacidade atual do sistema e o testam em relação às necessidades projetivas em situações de emergência. Se o modelo indicar lacunas na capacidade, as alterações propostas na capacidade do sistema serão enviadas à liderança da equipe de serviço para revisão. As alterações aprovadas são incorporadas em um novo modelo antes da implementação pelos engenheiros da equipe de serviço.

Como é que os serviços online da Microsoft mantêm a disponibilidade do serviço durante as falhas de rotina do sistema?

Os serviços online da Microsoft alcançam a resiliência do serviço através de arquitetura redundante, replicação de dados e verificação de integridade automatizada. A arquitetura redundante envolve a implementação de várias instâncias de um serviço em hardware geograficamente e fisicamente separado, proporcionando uma maior tolerância a falhas para os serviços online da Microsoft. A replicação de dados garante que existem sempre várias cópias dos dados do cliente em diferentes zonas de falha, permitindo que os dados críticos do cliente sejam recuperados se estiverem danificados, perdidos ou até eliminados acidentalmente pelo cliente. A verificação de integridade automatizada aumenta a disponibilidade dos dados ao restaurar automaticamente os dados afetados por muitos tipos de danos físicos ou lógicos.

Os serviços online da Microsoft são regularmente auditados relativamente à conformidade com as certificações e regulamentos externos. Veja a tabela seguinte para obter a validação de controlos relacionados com resiliência e continuidade.

Azure e Dynamics 365

Auditorias externas Section Data do relatório mais recente
ISO 27001

Declaração de Aplicabilidade
Certificado
A.17.1: Continuidade da segurança de informações
A.17.2: Redundâncias
8 de abril de 2024
ISO 22301

Certificado
Todos os controlos 8 de abril de 2024
SOC 1
SOC 2
SOC 3
BC-1: Planos de continuidade de negócio
BC-3: Procedimentos de continuidade de negócio e recuperação após desastre
BC-4: teste BCDR
BC-7: Planos de continuidade de negócio do Datacenter
BC-8: Teste de continuidade de negócio do Datacenter
BC-9: Avaliação da resiliência do datacenter
DS-5: Componentes de serviço chave de cópia de segurança
DS-6: Redundância de componentes críticos
DS-7: Replicação automática de dados do cliente
DS-8: Agenda de cópias de segurança
DS-9: Procedimentos de restauro da cópia de segurança
DS-11: Cópias de segurança fora do local
DS-14: Restauro automático dos serviços ao cliente
20 de maio de 2024

Microsoft 365

Auditorias externas Section Data do relatório mais recente
FedRAMP (Office 365) CP-2: Plano de contingência
CP-3: Preparação de contingência
CP-4: Teste do plano de contingência
CP-6: site de armazenamento alternativo
CP-7: Site de processamento alternativo
CP-9: Cópia de segurança do sistema de informações
CP-10: Recuperação e reconstituição do sistema de informações
31 de julho de 2023
ISO 27001

Declaração de Aplicabilidade
Certificado
A.17.1: Continuidade da segurança de informações
A.17.2: Redundâncias
Março de 2024
ISO 22301
Certificado
Todos os controlos Março de 2024
SOC 1
SOC 2
CA-49: Políticas de cópia de segurança
CA-50: Continuidade do negócio
CA-51: Replicação de dados
23 de janeiro de 2024
SOC 3 CUEC-09: Restauro de e-mail EXO 23 de janeiro de 2024

Recursos