Explorer le programme Enterprise Resilience and Crisis Management (ERCM) de Microsoft

Effectué

La résilience est un composant essentiel de la disponibilité des services Microsoft, mais même les services résilients peuvent être affectés par des événements inattendus. Le programme enterprise resilience and crisis management (ERCM) de Microsoft permet de garantir que nos services en ligne sont prêts à récupérer rapidement après des événements inattendus.

Structure de l’équipe ERCM

Le bureau du programme ERCM assure la gouvernance, la supervision et la prise en charge de la gestion de la continuité d’activité (BCM) dans Microsoft. Le Conseil de continuité de l’activité associé des représentants de la direction de Microsoft est chargé d’assurer le parrainage, la sensibilisation, l’allocation des ressources et la responsabilité des programmes au sein de leurs unités d’entreprise respectives. Ensemble, ces équipes veillent à la conformité à l'infrastructure de gestion de la continuité de l’activité (BCM) de Microsoft au sein de l'entreprise.

Chaque unité commerciale Microsoft est tenue de se conformer aux objectifs du programme Microsoft ERCM. Pour soutenir les objectifs ERCM, chaque unité commerciale désigne un représentant ou un responsable de continuité d’activité (BCL) pour diriger et coordonner les activités d’implémentation ERCM au sein de son unité commerciale. Ce représentant sert de point de contact principal pour tous les problèmes de continuité et de résilience. La plupart des responsables de la continuité de l’activité s’appuient sur une équipe d’individus pour faciliter l’exécution des programmes de continuité au sein de leur unité commerciale. Ces individus sont souvent appelés, Champs, Experts techniques (SMEs) ou Responsables de programme.

Le bureau du programme ERCM gère une base de données de tous les services en ligne, y compris les dépendances amont et en aval, qui sert de référentiel central pour les informations de continuité d’activité dans nos services en ligne. Il enregistre également toutes les dates pertinentes (documentation, révision et tests). Les équipes de service sont automatiquement averties lorsque leur documentation ou processus ERCM doit être mis à jour ou testé.

Le bureau du programme ERCM et les listes de licences de service individuelles travaillent avec Microsoft Enterprise Governance Risk & Compliance (EGRC) pour mettre en évidence tous les risques au niveau de l’entreprise identifiés dans le cadre des tests et de l’examen du plan annuel. Les risques mis en évidence de cette manière se voient attribuer une évaluation du risque, un propriétaire pour diriger la correction et sont suivis jusqu’à leur résolution. La coordination ERCM adopte une approche One Microsoft et aboutit à une relation étroite entre les équipes partenaires. La liste suivante décrit les équipes impliquées dans les activités ERCM liées à Microsoft 365 :

  • Enterprise Governance Risk & Compliance (EGRC) : équipe chargée de rendre compte au niveau de l'entreprise des risques/conformités et de trouver les normes de sécurité de l'information actuelles qui s'alignent sur la politique de sécurité de Microsoft, les procédures d'implémentation et les normes industrielles reconnues. Gère les risques globaux pour Microsoft, y compris les risques associés à ERCM.
  • Bureau du programme ERCM : équipe responsable de la gestion du programme Microsoft ERCM, y compris les normes de résilience, la stratégie, la formation et les métriques.
  • Conseil de continuité de l’activité : représentants de chaque fonction d’ingénierie/d’ingénierie, tels que Microsoft 365, qui collaborent au sein de plans intergroupes et d’une stratégie globale.
  • Responsables de la continuité de l’activité : individus de chaque service qui dirige la continuité et les efforts d’adaptabilité dans leur unité d’entreprise (par exemple, Azure, Microsoft 365, Dynamics).
  • Champions de la continuité des activités : individus de chaque équipe de service, tels qu’Exchange Online ou Microsoft Teams, qui mettent en œuvre des efforts de continuité des activités et de reprise après sinistre (BCDR) pour leur équipe de service (par exemple, Stockage Blob Azure, Exchange, Power BI).
  • Opérations de développement de charge de travail : ingénieurs au sein des équipes de service qui sont responsables du développement des fonctionnalités, des opérations quotidiennes et de la prise en charge des problèmes en direct sur le site (par exemple, gestionnaires d'incidents, ingénieurs de garde, équipes DevOps), y compris les responsabilités du BCDR.
  • Coordination et communication de l’incident Microsoft 365 : équipe Microsoft 365 qui fonctionne en tant que hub central pour la communication interne et externe lors d’un incident des services Microsoft 365, responsable de la notification utilisateur des incidents affectant le service via le tableau de bord d’intégrité des services de Microsoft 365 et d’autres plateformes de communications.
  • Support et service clientèle : équipe chargée de gérer les problèmes signalés par les clients. Sert de premier point de contact pour les clients en cas d'incident.

Infrastructure BCM

En plus de faciliter la coopération en matière de continuité d’activité, le programme ERCM de Microsoft fournit un framework BCM cohérent qui est implémenté par les unités commerciales au sein de l’entreprise. Cette infrastructure traite de la récupération et de la continuité des fonctions, des services et des données commerciales critiques nécessaires pour maintenir un niveau acceptable d'opérations pendant un incident. L'utilisation d'une infrastructure commune garantit l'existence de plans, de systèmes et de processus efficaces, fiables et bien testés sur lesquels on peut compter pour soutenir la continuité des activités et réduire au minimum les effets négatifs lors d'un événement perturbateur.

Diagramme montrant comment le programme ERCM fonctionne avec les unités commerciales Microsoft. Le programme ERCM est responsable de la gouvernance, de la conformité et de l’aide. Les unités commerciales Microsoft sont responsables du suivi de la méthodologie et de la stratégie ERCM et collaborent avec le programme ERCM sous différents aspects.

Cycle de vie BCM

Le cycle de vie BCM est au cœur de notre méthodologie BCM. Ce processus est conçu pour être adaptable de sorte qu’il puisse être implémenté par une grande variété de modèles d’entreprise dans Microsoft. Les phases du cycle de vie BCM guident chaque unité commerciale chez Microsoft dans le développement et l’implémentation de plans de continuité et de résilience efficaces.

Le cycle de vie du BCM se compose de trois phases de haut niveau. Il commence par une Évaluation initiale, qui implique d’identifier les processus et objectifs critiques qui doivent être inclus dans le programme de continuité de l’activité. La phase de Planification se concentre sur le développement et l’implémentation de stratégies de résilience et de récupération, ainsi que sur leur documentation dans les plans de continuité de l’activité officiel. Enfin, la Validation des fonctionnalités teste les plans de continuité de l’activité et leurs implémentations pour vérifier l’efficacité et identifier les améliorations.

Diagramme du cycle de vie du BCM : évaluation, planification et validation de la capacité.

En savoir plus