Visão geral da resiliência e continuidade
Como a Microsoft garante a continuidade dos negócios se ocorrer um desastre ou outra ameaça à disponibilidade do serviço?
A equipe de ERCM (Enterprise Resilience and Crisis Management) da Microsoft supervisiona as atividades de gerenciamento de continuidade de negócios e recuperação de desastres em serviços e ofertas de nuvem da Microsoft. Representantes das unidades de negócios da Microsoft coordenam com a equipe do ERCM para desenvolver planos de continuidade de negócios e validar a conformidade com os requisitos de continuidade dos negócios.
O ciclo de vida do BCM (Gerenciamento de Continuidade de Negócios) está no cerne de nossa metodologia BCM. Esse processo de três fases foi projetado para ser adaptável para que possa ser implementado por uma ampla variedade de modelos de negócios em toda a Microsoft. Ele começa com uma fase de Avaliação para identificar processos críticos e objetivos que devem ser incluídos no programa de continuidade de negócios. A fase de Avaliação também requer uma BIA (Análise de Impacto empresarial). A fase de Planejamento se concentra em desenvolver e implementar estratégias de resiliência e recuperação e documentá-las em planos oficiais de continuidade de negócios. Por fim, a Validação de Recursos testa os planos de continuidade dos negócios e suas implementações para verificar a eficácia e identificar possíveis melhorias.
A Microsoft serviços online estratégias de continuidade de negócios usam redundância de hardware, rede e datacenter. A replicação de dados entre datacenters fornece alta disponibilidade e confiabilidade durante um incidente catastrófico. Também aumenta a resiliência a incidentes mundanos, como falha isolada de hardware ou corrupção de dados.
Como a Microsoft testa a continuidade dos negócios e os planos de recuperação de desastres?
A política ERCM (Enterprise Resilience and Crisis Management) da Microsoft estipula que todos os planos de continuidade de negócios e recuperação de desastres da Microsoft devem ser testados, atualizados e revisados anualmente. A Microsoft serviços online testar seus planos de continuidade de negócios pelo menos anualmente por políticas de ERCM. Depois que os relatórios de ação são criados e revisados para validar, testar resultados e informar atualizações de plano em resposta a quaisquer problemas descobertos durante o teste.
Para validar estratégias de resiliência e recuperação em relação a uma ampla gama de incidentes potenciais, o Programa ERCM define várias categorias de cenários de teste que afetam pessoas, locais e tecnologia. O nível de validação necessário para cada serviço baseia-se na importância do serviço, com serviços mais críticos recebendo validação mais rigorosa. Cada equipe de serviço online da Microsoft testa seu plano de continuidade de negócios de acordo com as diretrizes do ERCM para medir a eficácia do plano e a preparação da equipe de serviço para executar o plano.
De acordo com as diretrizes do ERCM, as revisões anuais dos planos de continuidade dos negócios e da validação de capacidade devem ocorrer dentro de 12 meses após a última revisão. A validação de capacidade deve incluir a revisão da documentação de suporte, como a BIA, para garantir que ela permaneça precisa. A Microsoft disponibiliza resultados de validação de recursos para selecionar a Microsoft serviços online disponíveis para nossos clientes por meio de relatórios trimestrais.
Como a Microsoft serviços online garantir que a capacidade do sistema atenda à demanda?
O planejamento de capacidade ajuda as equipes de serviço a alocar os recursos necessários para dar suporte à disponibilidade do serviço online da Microsoft. O planejamento regular de capacidade é necessário como parte do programa ERCM da Microsoft. As equipes de serviço revisam os dados de capacidade durante as revisões trimestrais e durante situações de emergência que garantem mais revisão de capacidade.
Os dados brutos para planejamento de capacidade são mantidos por cada equipe de serviço e incluem métricas como processamento do sistema, memória e capacidade de hardware. As revisões agendadas usam um modelo da capacidade atual do sistema e o testam em relação às necessidades projetivas em situações de emergência. Se o modelo indicar lacunas na capacidade, as alterações propostas na capacidade do sistema serão enviadas à liderança da equipe de serviço para revisão. As alterações aprovadas são incorporadas em um novo modelo antes da implementação pelos engenheiros da equipe de serviço.
Como a Microsoft serviços online manter a disponibilidade de serviço durante falhas rotineiras do sistema?
A Microsoft serviços online obter resiliência de serviço por meio de arquitetura redundante, replicação de dados e verificação de integridade automatizada. A arquitetura redundante envolve a implantação de várias instâncias de um serviço em hardware geograficamente e fisicamente separado, fornecendo maior tolerância a falhas para a Microsoft serviços online. A replicação de dados garante que sempre haja várias cópias de dados do cliente em diferentes zonas de falha, permitindo que dados críticos do cliente sejam recuperados se corrompidos, perdidos ou até mesmo excluídos acidentalmente pelo cliente. A verificação automatizada de integridade aumenta a disponibilidade de dados restaurando automaticamente os dados afetados por muitos tipos de corrupção física ou lógica.
Regulamentos externos relacionados & certificações
Os serviços online da Microsoft são auditados regularmente para conformidade com regulamentos e certificações externas. Consulte a tabela a seguir para validação de controles relacionados à resiliência e continuidade.
Azure e Dynamics 365
Auditorias externas | Section | Data do relatório mais recente |
---|---|---|
ISO 27001/27002 Instrução de Aplicabilidade Certificado |
A.17.1: Continuidade da segurança da informação A.17.2: Redundâncias |
6 de novembro de 2023 |
ISO 22301 Certificado |
Todos os controles | 24 de abril de 2023 |
SOC 1 SOC 2 SOC 3 |
BC-1: Planos de continuidade de negócios BC-3: Procedimentos de continuidade de negócios e recuperação de desastres BC-4: teste BCDR BC-7: Planos de continuidade de negócios do Datacenter BC-8: Teste de continuidade de negócios do Datacenter BC-9: Avaliação de resiliência do Datacenter DS-5: Componentes de serviço de chave de backup DS-6: redundância de componentes críticos DS-7: replicação automática de dados do cliente DS-8: agendamento de backup DS-9: procedimentos de restauração de backup DS-11: backups fora do local DS-14: restauração automática dos serviços ao cliente |
17 de novembro de 2023 |
Microsoft 365
Auditorias externas | Section | Data do relatório mais recente |
---|---|---|
FedRAMP (Office 365) | CP-2: plano de contingência CP-3: treinamento de contingência CP-4: teste de plano de contingência CP-6: site de armazenamento alternativo CP-7: site de processamento alternativo CP-9: backup do sistema de informações CP-10: recuperação e reconstituição do sistema de informações |
31 de julho de 2023 |
ISO 27001/27002 Instrução de Aplicabilidade Certificado |
A.17.1: Continuidade da segurança da informação A.17.2: Redundâncias |
março de 2024 |
ISO 22301 Certificado |
Todos os controles | março de 2024 |
SOC 1 SOC 2 |
CA-49: políticas de backup CA-50: continuidade dos negócios CA-51: replicação de dados |
23 de janeiro de 2024 |
SOC 3 | CUEC-09: restauração de email exo | 23 de janeiro de 2024 |
Recursos
- Vídeo: Gerenciamento de continuidade do Microsoft serviços online
- Microsoft Cloud ERCM: Relatório de validação de plano de recuperação de desastre e continuidade de negócios FY24 Q2
- Programa ERCM (Enterprise Resilience and Crisis Management)
Isenção de responsabilidade legal
Comentários
https://aka.ms/ContentUserFeedback.
Em breve: Ao longo de 2024, eliminaremos os problemas do GitHub como o mecanismo de comentários para conteúdo e o substituiremos por um novo sistema de comentários. Para obter mais informações, consulteEnviar e exibir comentários de