Notes
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Les centres de données Microsoft sont conçus pour implémenter une stratégie de défense en profondeur, en utilisant plusieurs couches de protection pour protéger de manière fiable notre architecture cloud et l’infrastructure de prise en charge. La redondance est intégrée à tous les systèmes à plusieurs niveaux pour prendre en charge la disponibilité du centre de données.
Microsoft dispose d’installations de centres de données hautement sécurisées réparties dans le monde entier, créant une infrastructure de centre de données distribuée, prenant en charge des milliers de services en ligne. Cette infrastructure distribuée à l’échelle mondiale est conçue pour rapprocher les applications des utilisateurs, préserver la résidence des données et offrir aux clients des options complètes de conformité et de résilience.
Les régions sont des ensembles de centres de données interconnectés via un réseau massif et résilient. Les régions sont organisées en zones géographiques. Les clients disposant d’une résidence et d’une conformité spécifiques ont besoin de garder leurs données et applications proches. La tolérance de panne intégrée permet aux zones géographiques de résister à une défaillance complète de la région par le biais de leur connexion à l’infrastructure réseau dédiée à haute capacité.
Les emplacements physiquement distincts au sein d’une région sont appelés zones de disponibilité, chacun étant constitué d’un ou plusieurs centres de données équipés d’une alimentation, d’un refroidissement et d’un réseau indépendants. Les zones de disponibilité permettent aux applications stratégiques de s’exécuter avec une réplication à haute disponibilité et à faible latence.
La figure suivante montre comment l’infrastructure globale associe les régions et les zones de disponibilité dans la même limite de résidence des données pour la haute disponibilité, la récupération d’urgence et la sauvegarde.
Les centres de données distribués géographiquement permettent à Microsoft de rapprocher les services des clients, de réduire la latence du réseau et d’autoriser la sauvegarde et le basculement géoredondants.
Disponibilité
Les centres de données Microsoft sont conçus pour fournir une disponibilité de 99,999 % pour répondre aux contrats SLA et aux besoins de service des clients. Microsoft investit de manière significative dans les opérations mondiales, la gestion, les réseaux et la durabilité des installations qui fournissent des services 24 h/24, 7 j/7, 365 j/365.
Normes et exigences de conformité
Microsoft a investi plus de 15 milliards de dollars dans la construction de notre infrastructure mondiale et plus de 9 milliards de dollars dans la recherche et le développement pour accroître l’efficacité et stimuler l’innovation. Par conséquent, les centres de données de Microsoft évoluent à un rythme plus rapide que de nombreuses installations du secteur et ne suivent donc pas les exigences normatives définies par les normes traditionnelles des centres de données. En plus de la richesse des insights opérationnels qui accompagne l’exécution de l’un des plus grands portefeuilles de centres de données au monde, Microsoft utilise les données IEEE Gold Book et un logiciel de simulation de fiabilité tiers pour améliorer en permanence les normes de conception de nos centres de données. Les centres de données Microsoft sont largement audités dans le cadre de plusieurs audits réglementaires, comme indiqué dans le portefeuille de conformité. Le niveau de maturité dans les centres de données Microsoft peut être évalué par le biais du portefeuille de conformité et, en particulier, de la certification ISO 22301.
Bien que Microsoft exploite des programmes conformes à l’esprit de l’infrastructure de télécommunications ANSI/TIA-942 des centres de données Standard, certaines parties de cette norme ne sont pas applicables à Microsoft ou sont en conflit avec d’autres exigences réglementaires et/ou spécifiques au pays/à la région. En outre, Microsoft a choisi d’utiliser une approche plus basée sur les performances pour répondre aux besoins des clients.
Redondance des données et du réseau
Les installations de centres de données critiques utilisent plusieurs couches de systèmes redondants pour supporter les défaillances et minimiser les perturbations de service. Stockage redondant localement au niveau du disque protège les données au sein d’une région, avec un stockage géo-redondant fournissant une redondance intra-région. Pour garantir la fiabilité des communications réseau, Microsoft possède et utilise différentes lignes de fibre optique et du matériel redondant pour protéger les composants critiques contre les défaillances ou les interruptions de service.
La géoréplication est utilisée pour fournir une redondance à d’autres emplacements géographiques. La durabilité des données est obtenue en répliquant de manière synchrone des données entre plusieurs bases de données dans différents centres de données. Des tests de restauration sont effectués pour toutes les données de sauvegarde détenues par le cloud. La récupération d’urgence est obtenue par la réplication asynchrone vers un centre de données dans une autre région géographique.
Capacité
Les opérations cloud sont une équipe de capacité dédiée qui prévoit les besoins futurs pour garantir que la capacité nécessaire est structurée et disponible pour un usage client et interne. Les systèmes sont surveillés pour garantir des performances de service, une disponibilité, une utilisation du service, une utilisation du stockage, une latence réseau et une capacité de journal d’audit acceptables. Microsoft protège également les centres de données contre les effets des attaques par déni de service sur la bande passante, la capacité transactionnelle et la capacité de stockage.
Toutes les équipes de service incluent la planification de la capacité comme une fonctionnalité clé de leurs modèles de centre de données et des plans de réplication des données pour s’assurer qu’il existe une capacité nécessaire pour le traitement des informations, les télécommunications et la prise en charge de l’environnement.
Power
Les centres de données de Microsoft disposent d’alimentations sans interruption (UPS) dédiées 24h/24 et 7 j/7 et d’une prise en charge de l’alimentation d’urgence, qui inclut des générateurs sur site qui fournissent une alimentation de secours. Les générateurs et les sources d’alimentation non interruptibles sont soumis à une maintenance et des tests réguliers. Parallèlement à ces mesures, les équipes des opérations ont des accords contractuels avec des fournisseurs locaux pour la livraison de carburant d’urgence. Les centres de données disposent également d’un centre des opérations pour chaque installation afin de surveiller les systèmes électriques, y compris les composants électriques critiques.
Les centres de données Microsoft sont équipés d’espaces de protection et d’un étiquetage approprié pour les câbles. L’équipement d’infrastructure électrique est placé dans des environnements qui ont été conçus pour se protéger des risques environnementaux. Tous les biens des services en ligne portables doivent être verrouillés ou fixés en place afin de fournir une protection contre le vol ou les dommages de mouvement. Les câbles d’alimentation sont exécutés sous les planchers, dans les plateaux de câbles et dans les armoires pour la protection contre les pièces mobiles et les dommages accidentels. Tous les espaces électriques se trouvent derrière carte lecteurs ou des verrous de clé supplémentaires, le cas échéant. Les couloirs d’accès, les entrées extérieures et les cours d’équipement sont tous surveillés par vidéosurveillance. Les systèmes d’alimentation utilisent également la redondance comme forme de protection, avec plusieurs alimentations électriques/utilitaires dans l’installation et les générateurs et les systèmes ONS.
Un autre bloc d’alimentation à long terme est implémenté pour le système d’information qui est capable de maintenir l’alimentation dans une capacité opérationnelle minimalement requise. Lorsque l’alimentation tombe en panne ou tombe à un niveau de tension inacceptable, les systèmes UPS sont instantanément mis en service. Cela fournit suffisamment d’énergie pour exécuter les serveurs jusqu’à ce que les générateurs puissent prendre le relais. Les générateurs d’urgence fournissent une alimentation de secours pour les pannes prolongées, la maintenance planifiée et peuvent faire fonctionner le centre de données avec des réserves de carburant sur site en cas de catastrophe naturelle.
Les centres de données Microsoft (à la fois loués et entièrement gérés) implémentent l’éclairage d’urgence sous la forme d’un éclairage d’urgence sur des circuits dédiés sauvegardés par des ondeurs et des systèmes générateurs. L’éclairage de secours automatique est mis en œuvre conformément au Code de sécurité vie de la National Fire and Protection Association (NFPA) ou au code/loi local applicable. Si l’alimentation électrique est perdue, l’éclairage de secours passe automatiquement à l’alimentation fournie par les systèmes ONS et générateurs. Les systèmes d’éclairage de secours dans les centres de données font l’objet d’une maintenance de routine pour s’assurer qu’ils restent en bon état de fonctionnement.
Maintenance
La stratégie et les procédures de maintenance du système sont en place conformément aux Standard sécurité physique et environnementale des services en ligne de Microsoft. Tous les équipements et systèmes Microsoft sont régulièrement entretenus afin de garantir l’efficacité opérationnelle. L’entretien de tout équipement ou système doit être effectué conformément aux recommandations du fabricant, effectué par le personnel autorisé et enregistré dans un ticket d’entretien.
Il existe deux équipes de ressources qui gèrent différents types de systèmes :
Équipe d’environnement critique (CE) :
- CE est l’équipe qui assure la gestion des installations pour les systèmes électriques, mécaniques et physiques qui composent l’infrastructure d’exploitation de l’installation. L’équipe CE planifie, effectue, documente et examine toutes les activités de maintenance effectuées sur les composants CE. Les centres de données Microsoft s’appuient sur un système informatisé pour gérer les plannings de maintenance et les ordres de travail.
- Datacenter management (DCM) est responsable de toutes les maintenances CE effectuées sur site ou à distance. La maintenance CE est prescrite dans les documents pas à pas obligatoires appelés Méthodes de procédure (MOP). Les moPs sont examinés/approuvés par la gestion du centre de données avant tout début de travail.
Équipe des services de site :
- Les services de site sont l’équipe qui assure la maintenance des ressources de service en ligne Microsoft situées dans le centre de données Microsoft. L’équipe des services de site du contrôleur de domaine fournit un service de réparation de mains/pauses intelligentes pour les ressources appartenant aux propriétés approvisionnant les services à partir du centre de données. Par exemple, les ressources nécessitant une maintenance physique peuvent demander un service mains intelligentes à l’équipe des services de site du contrôleur de domaine. Tous les travaux des services de site sur les ressources Microsoft sont planifiés, exécutés, documentés et examinés dans les tickets de travail dans l’outil de création de tickets de flux de travail, et aucun travail ne peut se produire sans un ticket de travail approuvé.
- Le gestionnaire de programme technique (TPM) et l’équipe DCM sont responsables de tous les travaux des services de site qui se produisent dans le centre de données et qui nécessitent le transfert de la ressource hors site. La maintenance des services de site est effectuée dans des zones du centre de données contrôlées et protégées par des mécanismes de sécurité physiques.
Si des composants CE doivent être retirés de l’installation, la manipulation de l’équipement est approuvée par DCM. Dans la plupart des cas, les composants CE font l’objet d’une maintenance sur site et ne sont pas supprimés de l’installation. Les ressources de propriété (par exemple, les appareils réseau ou les serveurs) nécessitant un transfert hors site doivent avoir l’approbation explicite du propriétaire de la ressource.
Les médias numériques dans le cloud ne peuvent pas être transportés à partir de l’espace de colocalisation, sauf s’ils sont déplacés pour être détruits. Lorsque ces ressources doivent être détruites, elles sont stockées dans des compartiments de stockage verrouillés qui sont sous couverture caméra CCTV. Lorsque les ressources sont prêtes à être détruites, un agent de sécurité physique et un employé à temps plein de Microsoft de Asset Management doivent escorter le compartiment verrouillé de l’espace de colocalisation jusqu’à l’endroit où le déchiquetage sur site doit se produire. Comme le déchiquetage se produit dans le centre de données et sous supervision Microsoft, les ressources Microsoft ne quittent pas les zones contrôlées du centre de données.
Tous les travaux de maintenance doivent être approuvés avant le début du travail, y compris l’accès aux outils de maintenance du système. L’infrastructure Microsoft a implémenté le contrôle des outils de maintenance en créant un niveau d’accès dans l’outil d’accès Datacenter (DCAT). Chaque installation contient un coffre de verrouillage physique restreint ou une salle à accès contrôlé pour le stockage d’outils de maintenance spécialisés. L’accès à la boîte de verrouillage ou à la salle de stockage est contrôlé dans l’outil DCAT pour interdire l’accès non autorisé aux outils de maintenance. Ce programme garantit que seul le personnel disposant d’un accès approuvé peut accéder aux outils. L’équipe des services de site effectue des vérifications d’inventaire de routine pour vérifier la status de tous les outils. Tous les trimestres, l’équipe de gestion du centre de données et les équipes de sécurité physique effectuent des audits de la liste d’accès DCAT pour maintenir la liste d’accès du personnel de maintenance à jour. Les licenciements ou les transferts de personnel sont immédiatement répercutés par une mise à jour manuelle de la liste d’accès. L’accès à la boîte de verrouillage ou à la salle de stockage de maintenance est suivi dans les journaux du lecteur de badge d’accès, qui sont disponibles pour toutes les investigations.
L’équipe des services de site tient à jour un inventaire des outils de maintenance approuvés à utiliser dans le centre de données. Le personnel de maintenance est invité à utiliser les outils de maintenance fournis. L’approbation de Datacenter Management (DCM) est requise pour pouvoir utiliser des outils non fournis par le centre de données. Les outils à main physique sont exempts de ce type de contrôle.
Les centres de données Microsoft gèrent le personnel de maintenance résident pour prendre en charge les systèmes d’infrastructure de centre de données critiques (l’équipe environnement critique) et les opérations du centre de données (l’équipe des services de site). Les équipes Environnement critique et Services de site ont identifié les composants de système de sécurité et de technologie critiques qu’elles gèrent pour les pièces de rechange sur site. Les services de système d’information critiques sont approvisionnés à partir de plusieurs centres de données pour éviter une interruption de service en raison d’un incident dans l’un des centres de données.