Explorar o programa ERCM (Enterprise Resilience and Crisis Management) da Microsoft

Concluído

A resiliência é um componente crítico da disponibilidade do serviço Microsoft, mas até mesmo serviços resilientes podem ser afetados por eventos inesperados. O Programa ERCM (Enterprise Resilience and Crisis Management) da Microsoft ajuda a garantir que nossos serviços online estejam preparados para se recuperar rapidamente de eventos inesperados.

Estrutura da equipe ERCM

O Office do Programa ERCM fornece governança, supervisão e suporte para o BCM (gerenciamento de continuidade de negócios) em toda a Microsoft. O Conselho de Continuidade de Negócios relacionado dos representantes de gerenciamento sênior da Microsoft é criado para impulsionar o patrocínio de continuidade dos negócios, o reconhecimento, a alocação de recursos e a responsabilidade do programa em suas respectivas unidades de negócios. Juntas, essas equipes impulsionam a conformidade com a estrutura bcm (gerenciamento de continuidade de negócios) da Microsoft em toda a empresa.

Cada unidade de negócios da Microsoft é necessária para cumprir os objetivos do programa Microsoft ERCM. Para dar suporte aos objetivos do ERCM, cada unidade de negócios designa um representante ou BCL (Business Continuity Lead), para liderar e coordenar as atividades de implementação do ERCM em sua unidade de negócios. Esse representante serve como o principal ponto de contato para todos os problemas de continuidade e resiliência. A maioria das BCLs depende de uma equipe de indivíduos para ajudar a executar programas de continuidade dentro de sua unidade de negócios. Esses indivíduos geralmente são chamados de Campeões, Especialistas no Assunto (SMEs) ou Gerentes de Programa.

O Office do Programa ERCM mantém um banco de dados de todos os serviços online, incluindo upstream e dependências downstream, que servem como um repositório central para informações de continuidade de negócios em nosso serviços online. Ele também registra todas as documentações, revisões e datas de teste relevantes. As equipes de serviço são notificadas automaticamente quando a documentação ou os processos do ERCM precisam ser atualizados ou testados.

O Office do Programa ERCM e as BCLs de serviço individuais trabalham com o Microsoft Enterprise Governance Risk & Compliance (EGRC) para destacar quaisquer riscos de nível empresarial identificados como parte do teste e revisão de planos anuais. Os riscos realçados dessa maneira recebem uma classificação de risco, um proprietário para conduzir a correção e são rastreados até serem resolvidos. A coordenação do ERCM adota uma abordagem One Microsoft e resulta em uma relação de malha entre as equipes de parceiros. A lista a seguir descreve as equipes envolvidas nas atividades do ERCM relacionadas ao Microsoft 365:

  • EGRC (Risco e Conformidade de Governança Empresarial) – Equipe responsável por relatórios de nível empresarial sobre risco/conformidade e localização de padrões atuais de segurança da informação que se alinham com a Política de Segurança da Microsoft, procedimentos de implementação e padrões reconhecidos do setor. Gerencia o risco geral para a Microsoft, incluindo riscos associados ao ERCM.
  • ERCM Program Office – Equipe responsável por gerenciar o programa Microsoft ERCM, incluindo padrões de resiliência, política, treinamento e métricas.
  • Conselho de Continuidade dos Negócios – Representantes sêniores de cada função de negócios/engenharia, como Microsoft 365, que colaboram em planos entre grupos e na política geral.
  • Clientes potenciais de continuidade de negócios – indivíduos de cada serviço que levam a esforços de continuidade e resiliência dentro de sua unidade de negócios (por exemplo, Azure, Microsoft 365, Dynamics).
  • Campeões de continuidade dos negócios – indivíduos de cada equipe de serviço, como o Exchange Online ou o Microsoft Teams, que lideram os esforços de BCDR (Continuidade dos Negócios e Recuperação de Desastre) para sua equipe de serviço (por exemplo, Armazenamento de Blobs do Azure, Exchange e Power BI).
  • DevOps de carga de trabalho – Engenheiros dentro de equipes de serviço responsáveis pelo desenvolvimento de recursos, operações diárias e suporte a problemas de site ativo, incluindo responsabilidades de BCDR (por exemplo, gerentes de incidentes, engenheiros de chamada, equipes de DevOps).
  • Comunicação e Coordenação de Incidentes do Microsoft 365 – Microsoft 365 que funciona como um hub central para comunicação interna e externa durante um incidente dos Serviços Microsoft 365, responsável pela notificação do cliente de incidentes que afetam o serviço por meio do Painel de Integridade do Serviço do Microsoft 365 e de outras plataformas de comunicação.
  • Atendimento ao Cliente e Suporte – Equipe responsável por lidar com problemas relatados pelo cliente. Serve como um primeiro ponto de contato para clientes em caso de desastre.

Estrutura do BCM

Além de facilitar a cooperação na continuidade dos negócios, o programa ERCM da Microsoft fornece uma estrutura BCM consistente que é implementada por unidades de negócios em toda a empresa. Essa estrutura aborda a recuperação e a continuidade de funções, serviços e dados de negócios críticos necessários para manter um nível aceitável de operações durante um incidente. O uso de uma estrutura comum garante a existência de planos, sistemas e processos eficazes, confiáveis e bem testados que podem ser contados para dar suporte à continuidade dos negócios e minimizar os impactos adversos durante um evento de interrupção.

Diagrama que mostra como o programa ERCM funciona com as Unidades de Negócios da Microsoft. O programa ERCM é responsável pela governança, conformidade e diretrizes. As Unidades de Negócios da Microsoft são responsáveis por seguir a metodologia e a política do ERCM e colaborar com o programa ERCM em diferentes aspectos.

Ciclo de vida do BCM

O ciclo de vida do BCM está no núcleo da nossa metodologia de BCM. Esse processo foi projetado para ser adaptável para que possa ser implementado por uma ampla variedade de modelos de negócios na Microsoft. As fases do ciclo de vida do BCM guiam cada unidade de negócios da Microsoft por meio do desenvolvimento e implementação de planos eficazes de continuidade e resiliência de negócios.

O ciclo de vida do BCM inclui três fases de alto nível. Ele começa com um de Avaliação, que envolve a identificação de processos e objetivos críticos que devem ser incluídos no programa de continuidade dos negócios. A planejamento se concentra no desenvolvimento e na implementação de estratégias de resiliência e recuperação, bem como documentá-las em planos oficiais de continuidade de negócios. Por fim, validação de funcionalidade os planos de continuidade de negócios e suas implementações para verificar a eficácia e identificar melhorias.

Um diagrama do ciclo de vida do BCM - avaliação, planejamento e validação de capacidade.

Saiba mais