Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Azure NAT Gateway est un service NAT (Network Address Translation) entièrement managé qui fournit une connectivité Internet sortante pour les ressources connectées à votre réseau virtuel privé. Le service fournit à la fois la traduction d’adresses réseau source (SNAT) pour les connexions sortantes et la traduction d’adresses réseau de destination (DNAT) pour les paquets de réponse aux connexions sortantes uniquement. Étant donné qu’Azure NAT Gateway gère le trafic pour les ressources de réseau virtuel critiques, elle est conçue pour fournir une haute résilience.
Lorsque vous utilisez Azure, la fiabilité est une responsabilité partagée. Microsoft fournit une gamme de fonctionnalités pour prendre en charge la résilience et la récupération. Vous êtes responsable de comprendre le fonctionnement de ces fonctionnalités dans tous les services que vous utilisez et de sélectionner les fonctionnalités dont vous avez besoin pour atteindre vos objectifs métier et vos objectifs de temps d’activité.
Cet article explique comment rendre la passerelle NAT Azure résiliente à diverses pannes et problèmes potentiels, notamment les pannes temporaires et les pannes de zone de disponibilité. Il met également en évidence des informations clés sur le contrat de niveau de service de passerelle NAT Azure (SLA).
Important
Lorsque vous envisagez la fiabilité d’une passerelle NAT, tenez également compte de la fiabilité de vos machines virtuelles, des disques, d’autres infrastructures réseau et des applications qui s’exécutent sur des machines virtuelles. L’amélioration de la résilience de la passerelle NAT peut avoir un impact limité si les autres composants ne sont pas également résilients. Selon vos exigences de résilience, vous pouvez apporter des modifications de configuration à plusieurs composants.
Recommandations de déploiement de production pour la fiabilité
Pour les charges de travail de production, nous vous recommandons les pratiques suivantes :
Utilisez la référence SKU StandardV2 pour obtenir la redondance automatique des zones dans les régions prises en charge.
Note
Avant le déploiement, passez en revue les principales limitations de la passerelle AZURE NAT StandardV2 pour vous assurer qu’elle prend en charge votre configuration.
Allouez suffisamment d’adresses IP publiques pour vos exigences de connexion maximales. Les adresses IP insuffisantes peuvent entraîner des problèmes d’épuisement et de disponibilité des ports SNAT.
Utilisez des adresses IP publiques SKU StandardV2 avec la passerelle NAT StandardV2. Le StandardV2 Azure NAT Gateway ne prend pas en charge les adresses IP publiques SKU standard.
Vue d’ensemble de l’architecture de fiabilité
Cette section décrit certains des aspects importants du fonctionnement du service qui sont les plus pertinents du point de vue de la fiabilité. La section présente l’architecture logique, qui inclut certaines des ressources et fonctionnalités que vous déployez et utilisez. Il traite également de l’architecture physique, qui fournit des détails sur le fonctionnement du service sous les couvertures.
Architecture logique
Une passerelle NAT est une ressource que vous déployez. Pour utiliser la passerelle NAT comme itinéraire par défaut pour le trafic Internet sortant, attachez-la à un ou plusieurs sous-réseaux de votre réseau virtuel. Vous n’avez pas besoin de configurer d’itinéraires personnalisés ou d’autres routages.
Architecture physique
En interne, une passerelle NAT se compose d’une ou de plusieurs instances, qui représentent l’infrastructure sous-jacente requise pour exploiter le service.
Azure NAT Gateway implémente une architecture distribuée à l’aide de la mise en réseau définie par logiciel (SDN) pour fournir une fiabilité et une scalabilité élevées. Le service fonctionne sur plusieurs domaines d’erreur afin qu’il puisse résister à plusieurs défaillances de composants d’infrastructure sans impact sur le service. Azure gère les opérations de service sous-jacentes, notamment la distribution entre les domaines d’erreur et la redondance de l’infrastructure.
Pour plus d’informations sur l’architecture et la redondance de la passerelle NAT Azure, consultez les ressources de passerelle NAT Azure.
Résilience aux erreurs temporaires
Les erreurs temporaires sont des défaillances courtes et intermittentes dans les composants. Elles se produisent fréquemment dans un environnement distribué comme le cloud, et font partie intégrante des opérations ordinaires. Les erreurs temporaires se corrigent après une courte période de temps. Il est important que vos applications puissent gérer les erreurs temporaires, généralement en réessayant les requêtes affectées.
Toutes les applications hébergées dans le cloud doivent suivre les instructions de gestion des erreurs temporaires Azure lorsqu’elles communiquent avec toutes les API, bases de données et autres composants hébergés dans le cloud. Pour plus d’informations, consultez Recommandations pour la gestion des erreurs temporaires.
L’épuisement des ports SNAT se produit lorsque les applications effectuent plusieurs connexions indépendantes à la même adresse IP et au même port, ce qui épuise les ports SNAT disponibles pour l’adresse IP sortante. L’épuisement des ports SNAT peut apparaître comme une erreur temporaire dans votre application. Pour réduire la probabilité d’erreurs temporaires liées à NAT, effectuez les tâches suivantes :
Réduisez la probabilité d’épuisement des ports SNAT. Configurez vos applications pour gérer correctement SNAT en implémentant le regroupement de connexions et la gestion appropriée du cycle de vie des connexions.
Déployez suffisamment d’adresses IP publiques. Une passerelle NAT unique prend en charge plusieurs adresses IP publiques, et chaque adresse IP publique fournit un ensemble distinct de ports SNAT.
Surveillez la métrique de disponibilité du chemin de données de la passerelle NAT. Utilisez Azure Monitor pour détecter les problèmes de connectivité potentiels au début. Configurez des alertes pour les échecs de connexion et l’épuisement des ports SNAT pour identifier et résoudre de manière proactive les conditions d’erreur temporaires avant d’affecter la connectivité sortante de vos applications. Pour plus d’informations, consultez les métriques et alertes de passerelle NAT Azure.
Évitez de définir des valeurs de délai d’inactivité élevées. Lorsque vous définissez des valeurs de délai d’inactivité beaucoup plus élevées que les 4 minutes par défaut pour les connexions de passerelle NAT, l’épuisement des ports SNAT peut se produire pendant des volumes de connexion élevés.
Pour plus d’informations sur la gestion des connexions et la résolution des problèmes dans Azure NAT Gateway, consultez Résoudre les problèmes de connectivité de passerelle NAT Azure.
Résilience aux échecs de zone de disponibilité
Les zones de disponibilité sont des groupes physiquement distincts de centres de données au sein d’une région Azure. Lorsqu'une zone tombe en panne, les services peuvent basculer vers l'une des zones restantes.
Azure NAT Gateway prend en charge les zones de disponibilité dans les configurations redondantes interzone et zonales :
Redondant interzone : La référence SKU StandardV2 pour la passerelle NAT Azure assure une redondance interzone automatique. La redondance de zone répartit les instances de passerelle NAT dans toutes les zones de disponibilité d’une région. Une configuration redondante interzone améliore la résilience et la fiabilité des charges de travail de production.
Le diagramme montre Internet en haut. En dessous d’Internet est une ressource de passerelle NAT qui réside dans un réseau virtuel et couvre trois zones de disponibilité. Un sous-réseau du réseau virtuel contient trois machines virtuelles. Chaque machine virtuelle est positionnée dans une zone de disponibilité différente. La première machine virtuelle se trouve dans la zone de disponibilité 1, la deuxième machine virtuelle est dans la zone de disponibilité 2 et la troisième machine virtuelle se trouve dans la zone de disponibilité 3. Trois flèches distinctes dans chaque zone de disponibilité indiquent le flux de trafic sortant de la passerelle NAT vers Internet.
Zonale: Lorsque vous utilisez la référence SKU Standard (v1), vous pouvez éventuellement créer une configuration zonale. Vous déployez une passerelle NAT zonale dans une zone de disponibilité que vous sélectionnez. Lorsque vous déployez une passerelle NAT dans une zone spécifique, elle fournit une connectivité sortante à Internet explicitement à partir de cette zone. Les adresses IP publiques zonales d’une autre zone de disponibilité ne sont pas autorisées. Tout le trafic provenant de sous-réseaux connectés achemine via la passerelle NAT, même si les ressources de sous-réseau résident dans une autre zone de disponibilité.
Le diagramme montre Internet en haut. En dessous d’Internet est une ressource de passerelle NAT déployée dans la zone de disponibilité 1 uniquement. La passerelle NAT se connecte à un sous-réseau qui contient une seule machine virtuelle. Un réseau virtuel contient le sous-réseau, qui se trouve dans la zone de disponibilité 1. La zone de disponibilité 2 et la zone de disponibilité 3 sont vides. Une flèche indique le flux du trafic sortant de la passerelle NAT vers Internet.
Si une passerelle NAT au sein d’une zone de disponibilité rencontre une panne, toutes les machines virtuelles des sous-réseaux connectés ne parviennent pas à se connecter à Internet, même si ces machines virtuelles résident dans des zones de disponibilité saines.
Important
L’épinglage à une seule zone de disponibilité est recommandé uniquement lorsque la latence interzone est trop élevée pour vos besoins et après avoir vérifié que la latence ne répond pas à vos besoins. Par elle-même, une ressource zonale ne fournit pas de résilience à une panne d'une zone de disponibilité. Pour améliorer la résilience d’une ressource zonale, vous devez déployer explicitement des ressources distinctes dans plusieurs zones de disponibilité et configurer le routage et le basculement du trafic. Pour plus d’informations, consultez ressources zonales et résilience de zone.
Si vous déployez des machines virtuelles dans plusieurs zones de disponibilité et que vous devez utiliser des passerelles NAT zonales, vous pouvez créer des piles zonales dans chaque zone de disponibilité. Pour créer des piles zonales, déployez les ressources suivantes :
Plusieurs sous-réseaux : Créez un sous-réseau distinct pour chaque zone de disponibilité plutôt que d’utiliser un sous-réseau qui s’étend sur des zones.
Passerelles NAT zonales : Déployez une passerelle NAT dans la même zone de disponibilité que son sous-réseau attaché.
Affectation manuelle de machine virtuelle : Placez chaque machine virtuelle dans la zone de disponibilité correcte et le sous-réseau correspondant de la zone de disponibilité.
Le diagramme montre Internet en haut et trois zones de disponibilité sous Internet. Chaque zone de disponibilité contient sa propre instance de passerelle NAT zonale dédiée, son sous-réseau et sa machine virtuelle. Toutes ces ressources résident dans un réseau virtuel partagé. Les flèches affichent un flux de trafic sortant de l’instance de passerelle NAT de chaque zone de disponibilité vers Internet.
Si vous déployez une passerelle NAT Standard (v1) et que vous ne spécifiez pas de zone de disponibilité, la passerelle NAT n’est paszonale, ce qui signifie qu’Azure sélectionne la zone de disponibilité. Si une zone de disponibilité de la région a une panne, elle peut affecter votre passerelle NAT. Nous déconseillons une configuration nonzonale, car elle ne fournit pas de protection contre les pannes de zone de disponibilité.
Spécifications
Prise en charge de la région : Vous pouvez déployer des passerelles NAT redondantes interzone et zonales dans n’importe quelle région qui prend en charge les zones de disponibilité.
SKU: Pour déployer une passerelle NAT redondante interzone, utilisez la référence SKU StandardV2. Pour déployer une passerelle NAT zonale, utilisez la référence SKU Standard. Nous vous recommandons la référence SKU StandardV2.
Adresses IP publiques : Les exigences relatives aux adresses IP publiques attachées à une passerelle NAT dépendent de la référence SKU et de la configuration du déploiement.
Référence SKU de passerelle NAT Azure Type de prise en charge des zones de disponibilité Exigences relatives à l’adresse IP publique StandardV2 Redondance interzone Adresse IP publique StandardV2 Norme Zonal Adresse IP publique standard redondante entre zones ou dans la même zone que la passerelle NAT Norme Nonzonal Adresse IP publique standard redondante par zone ou dans toute zone
Coûts
La prise en charge des zones de disponibilité pour la passerelle NAT Azure n’a aucun coût supplémentaire. Pour plus d’informations, consultez la tarification de la passerelle NAT Azure.
Configurez la prise en charge des zones de disponibilité
Nouvelles ressources : Les étapes de déploiement dépendent de la configuration de votre zone de disponibilité :
Redondant entre zones : Pour déployer une nouvelle passerelle NAT redondante entre zones à l’aide du SKU StandardV2, consultez Créer une passerelle NAT Azure StandardV2.
Zonale: Pour déployer une nouvelle passerelle NAT zonale à l’aide de la référence SKU Standard, consultez Créer une passerelle NAT. Lorsque vous créez la passerelle NAT, sélectionnez sa zone de disponibilité au lieu de sélectionner Aucune zone.
Activez la prise en charge des zones de disponibilité : Vous ne pouvez pas modifier la configuration de la zone de disponibilité pour la passerelle NAT Azure après le déploiement. Pour modifier la configuration de la zone de disponibilité, vous devez déployer une nouvelle passerelle NAT avec les paramètres de zone souhaités.
Pour effectuer une mise à niveau d’une passerelle NAT Standard vers StandardV2, vous devez créer une adresse IP publique qui utilise la référence SKU StandardV2.
Comportement lorsque toutes les zones sont saines
Cette section décrit ce qu’il faut attendre lorsque les passerelles NAT sont configurées pour la prise en charge des zones de disponibilité et que toutes les zones de disponibilité sont opérationnelles.
Routage du trafic entre les zones : La façon dont le trafic de votre machine virtuelle est acheminé via votre passerelle NAT dépend de la configuration de la zone de disponibilité utilisée par votre passerelle NAT.
Redondant interzone : Le trafic peut être acheminé via une passerelle NAT dans toute zone de disponibilité.
Zonale: Chaque instance de passerelle NAT fonctionne indépendamment dans sa zone de disponibilité affectée. Le trafic sortant des ressources du sous-réseau est acheminé via la zone de la passerelle NAT, même si la VM réside dans une autre zone.
Réplication des données entre les zones : La passerelle NAT Azure ne réplique pas les données entre les zones, car il s’agit d’un service sans état pour la connectivité sortante. Chaque instance de passerelle NAT fonctionne indépendamment dans sa zone de disponibilité et ne nécessite pas de synchronisation avec des instances dans d’autres zones.
Comportement lors d’une défaillance de zone
Cette section décrit ce qu’il faut attendre lorsqu’une passerelle NAT est configurée pour la prise en charge de la zone de disponibilité et qu’il existe une panne de zone de disponibilité.
Détection et réponse : La responsabilité de la détection et de la réponse dépend de la configuration de la zone de disponibilité utilisée par votre passerelle NAT.
Redondance par zone : La passerelle NAT Azure détecte et réagit aux défaillances d'une zone de disponibilité. Vous n’avez rien à faire pour lancer un basculement de zone de disponibilité.
Zonale : Vous êtes responsable de l'implémentation du basculement automatique des applications vers d'autres méthodes de connectivité ou des passerelles NAT dans d'autres zones.
Notification: Microsoft ne vous avertit pas automatiquement lorsqu’une zone est en panne. Toutefois, vous pouvez utiliser Azure Resource Health pour surveiller l’intégrité d’une ressource individuelle, et vous pouvez configurer des alertes Resource Health pour vous avertir des problèmes. Vous pouvez également utiliser Azure Service Health pour comprendre l’intégrité globale du service, y compris les défaillances de zone, et vous pouvez configurer des alertes Service Health pour vous avertir des problèmes.
Vous pouvez également utiliser la métrique de disponibilité du chemin de données de la passerelle NAT pour surveiller l’intégrité de votre passerelle NAT. Configurez des alertes sur la métrique de disponibilité datapath pour détecter les problèmes de connectivité.
Demandes actives : Le comportement des requêtes actives dépend de la configuration de la zone de disponibilité utilisée par votre passerelle NAT.
Redondant interzone : Les instances de la zone défectueuse suppriment les connexions sortantes actives. Les clients doivent réessayer leurs demandes de connexion, et les tentatives suivantes sont acheminées via une instance de passerelle NAT dans une autre zone de disponibilité.
Zonale: Une passerelle NAT zonale ayant échoué supprime les connexions sortantes actives. Vous devez décider si et comment rétablir la connectivité via d’autres chemins de connectivité. Les applications doivent implémenter une logique de nouvelle tentative pour gérer les échecs de connexion.
Si vous réacheminez le trafic, l’adresse IP publique sortante change, de sorte que toutes les sessions TCP (Transmission Control Protocol) doivent être rétablies.
Perte de données attendue : Aucune perte de données ne se produit, car la passerelle NAT Azure est un service sans état pour la connectivité sortante. L’état de connexion est recréé lorsque les connexions sont rétablies.
Temps d’arrêt attendu : Le temps d’arrêt attendu dépend de la configuration de la zone de disponibilité utilisée par votre passerelle NAT.
Redondance zonale : Les connexions existantes de la zone défaillante risquent d'être déconnectées. Les clients peuvent réessayer immédiatement les connexions et demander l’itinéraire vers une instance d’une autre zone. Toutes les connexions restantes des zones saines persistent.
Zonale: La connectivité sortante reste indisponible jusqu’à ce que la zone récupère ou jusqu’à ce que vous réacheminiez le trafic via d’autres méthodes de connectivité ou passerelles NAT dans d’autres zones.
Réacheminement du trafic : Le comportement de réacheminement du trafic dépend de la configuration de la zone de disponibilité utilisée par votre passerelle NAT.
Redondance interzone : Les nouvelles demandes de connexion sont acheminées via une instance de passerelle NAT dans une zone de disponibilité opérationnelle.
Lors d’une défaillance de zone, les machines virtuelles de cette zone arrêtent généralement le fonctionnement. Toutefois, si une défaillance partielle de zone affecte uniquement la passerelle NAT alors que les machines virtuelles continuent d’s’exécuter, les connexions sortantes de ces machines virtuelles routent via une instance de passerelle NAT dans une autre zone.
Zonale: Vous devez mettre en œuvre des mécanismes de basculement au niveau de l’application, tels que l’utilisation de méthodes de connectivité alternatives ou la redirection du trafic vers des passerelles NAT dans d’autres zones.
Récupération de la zone
Azure NAT Gateway est un service sans état. Par conséquent, les opérations de restauration automatique ne nécessitent pas d’intervention manuelle.
Lorsqu’une zone de disponibilité récupère, les instances de passerelle NAT de cette zone deviennent automatiquement disponibles pour les nouvelles connexions sortantes. Les connexions établies via des instances de passerelle NAT dans d’autres zones pendant la panne continuent d’utiliser leurs chemins de connectivité existants jusqu’à ce que ces connexions se ferment.
Tester les pannes de zone
Les options de test des défaillances de zone dépendent de la configuration de la zone de disponibilité utilisée par votre instance.
Redondant par zone : La plateforme de passerelle NAT Azure gère le routage du trafic, le basculement et le retour automatique pour les passerelles NAT redondantes par zone. Ces fonctionnalités managées ne vous obligent pas à lancer des actions manuelles ou à valider les processus d’échec de zone de disponibilité.
Zonal: Vous êtes responsable de la préparation et du test des plans de reprise après sinistre pour gérer un échec potentiel de zone.
Résilience aux défaillances à l’échelle de la région
Azure NAT Gateway est un service à région unique qui fonctionne dans les limites d’une région Azure spécifique. Le service ne fournit pas de fonctionnalités multirégions natives ni de basculement automatique entre les régions. Si une région devient indisponible, les passerelles NAT de cette région sont également indisponibles.
Si vous concevez une approche réseau qui s’étend sur plusieurs régions, déployez des passerelles NAT indépendantes dans chaque région.
Contrat de niveau de service
Le contrat de niveau de service (SLA) pour les services Azure décrit la disponibilité attendue de chaque service et les conditions que votre solution doit respecter pour atteindre cette attente de disponibilité. Pour plus d’informations, consultez les contrats SLA pour les services en ligne.
Le contrat SLA NAT de réseau virtuel Azure couvre la passerelle NAT Azure. Le contrat SLA de disponibilité s’applique uniquement lorsque vous avez deux machines virtuelles saines ou plus. Il exclut également l’épuisement des ports SNAT des calculs de temps d’arrêt.