Haute disponibilité et récupération d’urgence des grandes instances SAP HANA sur Azure
Important
Cette documentation ne remplace pas la documentation d’administration de SAP HANA ni les notes SAP. Nous supposons que vous maîtrisez les opérations et l’administration SAP HANA, notamment dans les domaines de la sauvegarde, de la restauration, de la haute disponibilité et de la reprise d’activité après sinistre.
Dans cet article, nous allons présenter une vue d’ensemble de la haute disponibilité et de la reprise d’activité après sinistre de SAP HANA sur les grandes instances Azure (également appelées infrastructure BareMetal). Nous allons également détailler certaines des conditions et considérations relatives à la haute disponibilité et à la reprise d’activité après sinistre.
Certains processus décrits dans cette documentation sont simplifiés. Ils ne sont pas conçus comme des procédures détaillées à inclure dans des manuels d’utilisation. Pour créer des manuels d’utilisation pour vos configurations, exécutez et testez vos processus avec vos versions et mises en production HANA spécifiques. Vous pourrez ensuite documenter les processus spécifiques à vos configurations.
Haute disponibilité et reprise d’activité après sinistre
La haute disponibilité et la reprise d’activité après sinistre constituent des aspects fondamentaux de l’exécution de votre système SAP HANA stratégique sur le serveur Azure (grandes instances). Il est important de collaborer avec SAP, votre intégrateur de systèmes, ou Microsoft pour concevoir et implémenter efficacement les stratégies de haute disponibilité et reprise d’activité après sinistre appropriées. Tenez également compte de l’objectif de point de récupération (RPO) et de l’objectif de délai de récupération (RTO), qui sont spécifiques à votre environnement.
Microsoft prend en charge certaines fonctionnalités de haute disponibilité de SAP HANA avec les grandes instances HANA. Ces fonctionnalités sont les suivantes :
- Réplication du stockage : capacité du système de stockage à répliquer toutes les données à un autre tampon de grande instance HANA dans une autre région Azure. SAP HANA opère indépendamment de cette méthode. Cette fonctionnalité est le mécanisme de récupération d’urgence par défaut pour les grandes instances HANA.
- Réplication du système HANA : La réplication de toutes les données de SAP HANA pour un système SAP HANA à part. La réplication des données à intervalles réguliers contribue à minimiser le RTO. SAP HANA prend en charge les modes asynchrone, synchrone en mémoire et synchrone. Le mode synchrone n’est utilisé que pour les systèmes SAP HANA situés dans le même centre de données ou à moins de 100 km de distance. Avec la conception actuelle des horodatages de grande instance HANA, la réplication de système HANA ne peut garantir la haute disponibilité que dans une région. La réplication de système HANA nécessite un composant de routage ou proxy inverse tiers pour les récupérations d’urgence dans une autre région Azure.
- Basculement automatique de l’hôte : solution de récupération après incident locale pour SAP HANA à utiliser comme alternative à la réplication de système HANA. Si le nœud principal n’est plus disponible, configurez un ou plusieurs nœuds SAP HANA de secours en mode scale-out, et SAP HANA bascule automatiquement vers un nœud de secours.
SAP HANA sur Azure (grandes instances) est disponible dans deux régions Azure situées dans quatre zones géopolitiques : États-Unis, Australie, Europe et Japon. Deux régions d’une zone géopolitique qui hébergent des horodatages de grande instance HANA (HLI) sont connectées à des circuits réseau dédiés distincts. Ces grandes instances HANA (HLI) servent à répliquer des captures instantanées de stockage pour fournir des méthodes de reprise d’activité après sinistre. La réplication n’est pas configurée par défaut, mais uniquement pour les clients qui commandent la fonctionnalité de reprise d’activité après sinistre. La réplication de stockage dépend de l’utilisation des captures instantanées de stockage pour les grandes instances HANA. Vous ne pouvez pas choisir comme région de reprise d’activité après sinistre, une région Azure située dans une autre zone géopolitique.
Options actuellement prises en charge
Le tableau suivant indique les combinaisons et méthodes de haute disponibilité et de récupération d’urgence actuellement prises en charge :
Scénario pris en charge dans les grandes instances HANA | Option de haute disponibilité | Option de récupération d’urgence | Commentaires |
---|---|---|---|
Nœud unique | Non disponible. | Configuration de récupération d’urgence dédiée. Configuration de récupération d’urgence polyvalente. |
|
Basculement automatique de l’hôte : scale-out (avec ou sans nœud de secours) y compris 1+1 |
Possible avec nœud de secours en rôle actif. Contrôle par HANA de la permutation des rôles. |
Configuration de récupération d’urgence dédiée. Configuration de récupération d’urgence polyvalente. Synchronisation de la récupération d’urgence à l’aide de la réplication du stockage. |
Des jeux de volumes HANA sont attachés à tous les nœuds. Le site de récupération d’urgence doit avoir le même nombre de nœuds. |
Réplication de système HANA | Possible avec configuration de réplica principal ou secondaire. Le réplica secondaire prend le rôle principal en cas de basculement. Réplication de système HANA et basculement du contrôle du système d’exploitation. |
Configuration de récupération d’urgence dédiée. Configuration de récupération d’urgence polyvalente. Synchronisation de la récupération d’urgence à l’aide de la réplication du stockage. La reprise d’activité après sinistre à l’aide de la réplication du système HANA n’est pas encore possible sans composants tiers. |
Des jeux distincts de volumes de disque sont attachés à chaque nœud. Seuls les volumes de disque de réplica secondaire sur le site de production sont répliqués à l’emplacement de la récupération d’urgence. Un jeu de volumes est requis sur le site de récupération d’urgence. |
L’expression « configuration de reprise d’activité après sinistre dédiée » désigne une configuration où l’unité de grande instance HANA sur le site de reprise d’activité après sinistre n’est pas utilisée pour exécuter d’autres charges de travail ou systèmes de non-production. L’unité est passive et est déployée uniquement si un basculement d’urgence est exécuté. Cette configuration n’est pas la meilleure option pour la plupart des clients.
Pour découvrir la disposition de stockage et les détails Ethernet de votre architecture, consultez Scénarios HLI pris en charge.
Notes
Avant HANA 2.0 SPS4, il n’était pas possible de prendre des captures instantanées de base de données de conteneurs de bases de données mutualisée (plusieurs locataires). Avec SPS4 et ultérieurs, SAP prend entièrement en charge cette fonctionnalité de capture instantanée.
L’expression « configuration de récupération d’urgence polyvalente » désigne une configuration où l’unité de grande instance HANA sur le site de récupération d’urgence exécute une charge de travail de non-production. En cas de sinistre, arrêtez le système de non-production, montez les jeux de volumes répliqués par le stockage (supplémentaires), puis démarrez l’instance HANA de production. La plupart des clients qui utilisent la fonctionnalité de récupération d’urgence des grandes instances HANA utilisent cette configuration.
Vous trouverez plus d’informations sur la haute disponibilité de SAP HANA dans les articles SAP suivants :
- SAP HANA High Availability Whitepaper (Livre blanc sur la haute disponibilité de SAP HANA)
- SAP HANA Administration Guide (Guide d’administration de SAP HANA)
- SAP Academy Video on SAP HANA System Replication (Vidéo SAP Academy sur la réplication du système SAP HANA)
- SAP Support Note #1999880 – FAQ on SAP HANA System Replication (Note de support SAP n°1999880 – FAQ sur la réplication du système SAP HANA)
- SAP Support Note #2165547 – SAP HANA Back up and Restore within SAP HANA System Replication Environment (Note de support SAP n°2165547 – Sauvegarde et restauration SAP HANA dans l’environnement de réplication du système SAP HANA)
- SAP Support Note #1984882 – Using SAP HANA System Replication for Hardware Exchange with Minimum/Zero Downtime (Note de support SAP n°1984882 – Utilisation de la réplication du système SAP HANA pour l’échange de matériel avec un temps d’arrêt minime ou nul)
Considérations sur le réseau pour la récupération d’urgence avec de grandes instances HANA
Pour tirer parti de la fonctionnalité de récupération d’urgence des grandes instances HANA, vous devez concevoir la connectivité réseau des deux régions Azure. Vous avez besoin d’un circuit Azure ExpressRoute assurant la connexion depuis l’emplacement local dans votre région Azure principale, et d’un autre circuit pour la connexion entre l’emplacement local et votre région de récupération d’urgence. Cette mesure s’applique lorsqu’une région Azure, incluant l’emplacement MSEE (Microsoft Enterprise Edge Router), connaît un problème.
Vous pouvez également connecter tous les réseaux virtuels Azure reliés à SAP HANA sur Azure (grandes instances) dans une région, au circuit ExpressRoute relié aux grandes instances HANA dans l’autre région. Avec cette connexion croisée, les services en cours d’exécution sur un réseau virtuel Azure de la région 1 peuvent se connecter aux unités de grande instance HANA dans la région 2, et inversement. Cette mesure s’applique lorsqu’un seul des emplacements MSEE qui connecte votre emplacement local à Azure se déconnecte.
Le graphique suivant illustre une configuration résistante aux cas de récupération d’urgence :
Autres exigences pour la réplication de stockage avec de grandes instances HANA dans le cadre d’une récupération d’urgence
- Commander des références SKU SAP HANA sur Azure (grandes instances) de la même taille que vos références SKU de production et les déployer dans la région de récupération d’urgence. Dans les déploiements actuels des clients, ces instances sont utilisées pour exécuter les instances HANA de non-production. Ces configurations sont appelées configurations de récupération d’urgence multi-usage.
- Commander du stockage supplémentaire sur le site de reprise d’activité après sinistre pour chacune de vos références SKU SAP HANA sur Azure (grandes instances) que vous souhaitez récupérer sur le site de reprise d’activité après sinistre. L’achat de stockage supplémentaire vous permet d’allouer les volumes de stockage. Vous pouvez allouer les volumes de stockage qui constituent la cible de la réplication de stockage entre votre région Azure de production et la région Azure de récupération d’urgence.
- Vous pouvez avoir la réplication du système SAP HANA configurée sur le nœud principal et la réplication basée sur le stockage sur le site de reprise d’activité après sinistre. Ensuite, vous devez acheter plus de stockage sur le site de reprise d’activité après sinistre, afin que les données des nœuds principal et secondaire soient répliquées sur le site de reprise d’activité après sinistre.
Étapes suivantes
Découvrez la sauvegarde et la restauration de SAP HANA sur de grandes instances HANA.