Aperçu sur la résilience et la continuité

Comment Microsoft garantit-il la continuité de l’activité en cas de sinistre ou d’autre menace pour la disponibilité du service ?

L’équipe Enterprise Resilience and Crisis Management (ERCM) de Microsoft supervise les activités de gestion de la continuité d’activité et de récupération d’urgence dans les services Microsoft et les offres cloud. Les représentants des unités commerciales Microsoft se coordonnent avec l’équipe ERCM pour développer des plans de continuité d’activité et valider la conformité aux exigences de continuité d’activité.

Le cycle de vie de la gestion de la continuité d’activité (BCM) est au cœur de notre méthodologie BCM. Ce processus en trois phases est conçu pour être adaptable afin de pouvoir être implémenté par un large éventail de modèles d’entreprise dans Microsoft. Elle commence par une phase d’évaluation pour identifier les processus et les objectifs critiques qui doivent être inclus dans le programme de continuité des activités. La phase d’évaluation nécessite également une analyse de l’impact sur l’entreprise (BIA). La phase de planification se concentre sur le développement et la mise en œuvre de stratégies de résilience et de récupération et leur documentation dans les plans de continuité d’activité officiels. Enfin, la validation des capacités teste les plans de continuité d’activité et leurs implémentations pour vérifier l’efficacité et identifier les améliorations potentielles.

Microsoft services en ligne stratégies de continuité d’activité utilisent la redondance du matériel, du réseau et du centre de données. La réplication des données entre les centres de données offre une haute disponibilité et une fiabilité en cas d’incident catastrophique. Il augmente également la résilience aux incidents banals tels que les défaillances matérielles isolées ou l’altération des données.

Comment Microsoft teste-t-il les plans de continuité d’activité et de reprise d’activité ?

La stratégie enterprise resilience and crisis management (ERCM) de Microsoft stipule que tous les plans de continuité d’activité et de reprise d’activité microsoft doivent être testés, mis à jour et révisés sur une base annuelle. Microsoft services en ligne tester leurs plans de continuité d’activité au moins une fois par an par stratégie ERCM. Une fois les rapports d’action créés et révisés pour valider, testez les résultats et informez les mises à jour du plan en réponse aux problèmes détectés pendant le test.

Pour valider les stratégies de résilience et de récupération contre un large éventail d’incidents potentiels, le programme ERCM définit plusieurs catégories de scénarios de test affectant les personnes, les emplacements et la technologie. Le niveau de validation nécessaire pour chaque service dépend de sa criticité ; les services plus critiques faisant l’objet d’une validation plus rigoureuse. Chaque équipe de service en ligne Microsoft teste son plan de continuité d’activité conformément aux directives ERCM pour mesurer l’efficacité du plan et la préparation de l’équipe de service à l’exécution du plan.

Selon les directives ercm, les examens annuels des plans de continuité d’activité et la validation des capacités doivent avoir lieu dans les 12 mois suivant le dernier examen. La validation des capacités doit inclure un examen de la documentation à l’appui, telle que la BIA, pour s’assurer qu’elle reste exacte. Microsoft met à la disposition de ses clients les résultats de validation des fonctionnalités de certaines services en ligne Microsoft par le biais de rapports trimestriels.

Comment Microsoft services en ligne s’assurer que la capacité du système répond à la demande ?

La planification de la capacité aide les équipes de service à allouer les ressources nécessaires pour prendre en charge la disponibilité du service en ligne Microsoft. Une planification régulière de la capacité est requise dans le cadre du programme ERCM de Microsoft. Les équipes de service examinent les données de capacité pendant les révisions trimestrielles et dans les situations d’urgence qui justifient un examen plus important de la capacité.

Les données brutes pour la planification de la capacité sont conservées par chaque équipe de service et incluent des métriques telles que le traitement du système, la mémoire et la capacité matérielle. Les évaluations planifiées utilisent un modèle de la capacité actuelle du système et testent celles-ci en cas d’urgence. Si le modèle indique des écarts de capacité, les modifications proposées à la capacité du système sont soumises au leadership des équipes de maintenance pour examen. Les modifications approuvées sont incorporées dans un nouveau modèle avant leur implémentation par les ingénieurs d’équipe de service.

Comment Microsoft services en ligne maintenir la disponibilité du service en cas de défaillances système courantes ?

Microsoft services en ligne assurer la résilience du service grâce à une architecture redondante, à la réplication des données et à la vérification automatisée de l’intégrité. L’architecture redondante implique le déploiement de plusieurs instances d’un service sur du matériel géographiquement et physiquement distinct, offrant ainsi une tolérance de panne accrue pour Microsoft services en ligne. La réplication des données garantit qu’il y a toujours plusieurs copies des données client dans différentes zones d’erreur, ce qui permet de récupérer les données client critiques en cas de corruption, de perte ou même de suppression accidentelle par le client. La vérification automatisée de l’intégrité augmente la disponibilité des données en restaurant automatiquement les données affectées par de nombreux types d’altération physique ou logique.

Les services en ligne de Microsoft sont régulièrement auditées pour vérifier la conformité aux réglementations et certifications externes. Reportez-vous au tableau suivant pour la validation des contrôles liés à la résilience et à la continuité.

Azure et Dynamics 365

Audits externes Section Date du dernier rapport
ISO 27001/27002

Déclaration d’applicabilité
Certificat
A.17.1 : Continuité de la sécurité des informations
A.17.2 : Redondances
6 novembre 2023
ISO 22301

Certificat
Tous les contrôles 24 avril 2023
SOC 1
SOC 2
SOC 3
BC-1 : Plans de continuité d’activité
BC-3 : Procédures de continuité d’activité et de récupération d’urgence
BC-4 : test BCDR
BC-7 : Plans de continuité d’activité des centres de données
BC-8 : Test de continuité d’activité des centres de données
BC-9 : Évaluation de la résilience des centres de données
DS-5 : Composants du service de clé de sauvegarde
DS-6 : Redondance des composants critiques
DS-7 : Réplication automatique des données client
DS-8 : Planification de la sauvegarde
DS-9 : Procédures de restauration de sauvegarde
DS-11 : sauvegardes hors site
DS-14 : Restauration automatique des services clients
17 novembre 2023

Microsoft 365

Audits externes Section Date du dernier rapport
FedRAMP (Office 365) CP-2 : Plan d’urgence
CP-3 : Formation d’urgence
CP-4 : Test du plan d’urgence
CP-6 : Site de stockage secondaire
CP-7 : Site de traitement secondaire
CP-9 : Sauvegarde du système d’information
CP-10 : Récupération et reconstitution du système d’information
31 juillet 2023
ISO 27001/27002

Déclaration d’applicabilité
Certificat
A.17.1 : Continuité de la sécurité des informations
A.17.2 : Redondances
Mars 2023
ISO 22301
Certificat
Tous les contrôles Mars 2023
SOC 1
SOC 2
CA-49 : Stratégies de sauvegarde
CA-50 : Continuité d’activité
CA-51 : Réplication des données
23 janvier 2024
SOC 3 CUEC-09 : Restauration des e-mails EXO 23 janvier 2024

Ressources