Fiabilité dans Elastic SAN

Article
20/01/2025

Cet article décrit la prise en charge de la fiabilité dans Azure Elastic SAN. Il couvre à la fois la résilience régionale avec les zones de disponibilité, la récupération d'urgence et la continuité des activités.

Prise en charge des zones de disponibilité

Les zones de disponibilité sont des groupes de centres de données physiquement séparés au sein de chaque région Azure. Lorsqu'une zone tombe en panne, les services peuvent basculer vers l'une des zones restantes.

Pour plus d’informations sur les zones de disponibilité dans Azure, consultez Que sont les zones de disponibilité ?

Azure Elastic SAN prend en charge le déploiement de zones de disponibilité avec un stockage localement redondant (LRS) et le déploiement régional avec un stockage redondant interzone (ZRS).

Prérequis

LRS et ZRS d’Elastic SAN sont actuellement disponibles uniquement dans un sous-ensemble de régions. Pour obtenir la liste des régions, consultez Cibles de mise à l’échelle pour Elastic SAN.

Créer une ressource à l’aide de zones de disponibilité

Pour créer un Elastic SAN avec une zone de disponibilité activée, consultez Déployer un Elastic SAN.

Expérience en cas de panne de zone

Lors du déploiement d’un SAN élastique, si vous sélectionnez ZRS pour l’option de redondance de votre SAN, le basculement zonal est pris en charge par la plateforme. Si vous utilisez un point de terminaison privé pour vous connecter à votre SAN élastique, ce basculement se produit sans intervention manuelle. Un SAN élastique ZRS utilisant des points de terminaison privés est conçu pour s’auto-réparer et se rééquilibrer afin de tirer parti automatiquement des zones saines. Il peut y avoir une dégradation des performances et de la disponibilité pendant quelques minutes après un basculement jusqu’à ce que le SAN se rééquilibre.

Si vous vous connectez en utilisant des points de terminaison de service de stockage, le basculement zonal est pris en charge, mais risque de nécessiter une intervention manuelle. Un stockage redondant interzone (ZRS) Elastic SAN tirant parti de points de terminaison de service de stockage ne basculent pas vers une zone saine automatiquement. Il est possible que vous deviez redémarrer l’initiateur iSCSI pour initier un basculement vers une autre zone saine.

Si vous avez déployé un SAN élastique LRS, vous devrez peut-être déployer un nouveau SAN à l’aide d’instantanés exportés sur des disques managés.

Conception à faible latence

Le déploiement d’un stockage redondant interzone (ZRS) Elastic SAN offre plus de fiabilité qu’un stockage localement redondant (LRS) Elastic SAN, mais il ajoute davantage de latence d’écriture. Évaluez votre SAN élastique et simulez la charge de travail de votre application pour comparer la latence entre le LRS et le ZRS afin de voir si cela affecte votre charge de travail.

Migration de zones de disponibilité

Pour migrer un SAN élastique sur LRS vers ZRS, créez un instantané des volumes de votre SAN élastique, exportez-les vers des instantanés de disque managé, déployez un SAN élastique sur ZRS, puis créez des volumes sur le SAN sur ZRS à l’aide de ces instantanés de disque. Pour savoir comment utiliser des instantanés (préversion), consultez Instantanés de volumes Azure Elastic SAN (préversion).

Récupération d'urgence et continuité d’activité

La récupération d’urgence (DR) consiste à récupérer après des évènements à fort impact, comme des catastrophes naturelles ou des échecs de déploiements, qui entraînent un temps d’arrêt et une perte de données. Quelle qu’en soit la cause, la meilleure solution en cas de sinistre est d’avoir un plan de DR bien défini et testé, et une conception d’application qui prend activement en charge la DR. Avant de commencer à réfléchir à la création de votre plan de récupération d’urgence, consultez Suggestions pour la conception d’une stratégie de récupération d’urgence.

En ce qui concerne la récupération d’urgence (DR), Microsoft utilise le modèle de responsabilité partagée. Dans un modèle de responsabilité partagée, Microsoft garantit que l’infrastructure de référence et les services de plateforme sont disponibles. En même temps, de nombreux services Azure ne répliquent pas automatiquement les données ou reviennent d’une région défaillante pour effectuer une réplication croisée vers une autre région activée. Pour ces services, vous êtes responsable de la configuration d’un plan de récupération d’urgence qui fonctionne pour votre charge de travail. La plupart des services qui s’exécutent sur des offres PaaS (Platform as a Service) Azure fournissent des fonctionnalités et des conseils pour prendre en charge la récupération d’urgence et vous pouvez utiliser fonctionnalités spécifiques au service pour prendre en charge la récupération rapide pour vous aider à développer votre plan de récupération d’urgence.

Récupération d’urgence à région unique et multirégion

Pour le SAN élastique, vous êtes responsable de l’expérience de récupération d’urgence. Vous pouvez prendre des instantanés de vos volumes et les exporter vers des instantanés de disque managé. Ensuite, vous pouvez copier un instantané incrémentiel dans une nouvelle région pour stocker vos données dans une région autre que la région dans laquelle se trouve votre SAN élastique. Vous devez exporter vers des régions géographiquement éloignées de votre région primaire pour réduire la possibilité que plusieurs régions soient affectées en raison d’un sinistre.

Détection, notification et gestion des pannes

Vous trouverez des déclarations de panne dans Azure Service Health - Microsoft Azure.

Capacité et résilience proactive de la récupération d’urgence

Microsoft et ses clients opèrent selon le modèle de responsabilité partagée. La responsabilité partagée implique que pour la récupération d’urgence activée par le client (services responsables du client), vous devez traiter la récupération d’urgence pour tout service que vous déployez et contrôlez. Prévalidez n’importe quel service que vous déployez avec le SAN élastique. Pour vous assurer que la récupération est proactive, prédéployez des réplicas secondaires pour vous assurer qu’il n’y a aucun problème de capacité si vos environnements sont affectés.

Partager via