Architecture de réseau virtuel Azure HDInsight
Cet article décrit les ressources présentes lorsque vous déployez un cluster HDInsight dans un réseau virtuel Azure personnalisé. Ces informations vous aident à connecter des ressources locales à votre cluster HDInsight dans Azure. Pour plus d’informations sur les réseaux virtuels Azure, consultez Présentation du réseau virtuel Azure.
Types de ressources dans un cluster Azure HDInsight
Les clusters Azure HDInsight présentent différents types de machines virtuelles ou nœuds. Chaque type de nœud joue un rôle dans le fonctionnement du système. Le tableau suivant récapitule les types de nœuds et leurs rôles dans le cluster.
Type | Description |
---|---|
Nœud Zookeeper | Zookeeper coordonne les tâches entre les nœuds qui assurent le traitement des données. Il désigne également le nœud principal et suit le nœud principal qui exécute un service maître spécifique. Le nombre de nœuds ZooKeeper est fixé à trois. |
Nœud Worker | Représente les nœuds qui prennent en charge des fonctionnalités de traitement des données. Les nœuds Worker peuvent être ajoutés ou supprimés du cluster pour mettre à l'échelle les capacités de calcul et gérer les coûts. |
Nœud de région | Pour le type de cluster HBase, le nœud de région (également appelé nœud de données) s’exécute le serveur de région. Les serveurs de région gèrent une partie des données gérées par HBase. Les nœuds région peuvent être ajoutés ou supprimés du cluster pour mettre à l'échelle les capacités de calcul et gérer les coûts. |
Conventions de nommage des ressources
Utilisez des noms de domaine complets (FQDN) lors de l'adressage des nœuds de votre cluster. Vous pouvez obtenir les noms de domaine complets de différents types de nœuds dans votre cluster à l’aide de l’API Ambari.
Ces noms de domaine complets sont au format <node-type-prefix><instance-number>-<abbreviated-clustername>.<unique-identifier>.cx.internal.cloudapp.net
.
<node-type-prefix>
a la valeur hn
pour les nœuds principaux, wn
pour les nœuds Worker et zn
pour les nœuds ZooKeeper.
Si vous n’avez besoin que du nom d’hôte, utilisez uniquement la première partie du nom de domaine complet : <node-type-prefix><instance-number>-<abbreviated-clustername>
Ressources de base du réseau virtuel
Le diagramme suivant illustre le placement des nœuds HDInsight et des ressources réseau dans Azure.
Les ressources par défaut d'un réseau virtuel Azure incluent les types de nœuds de cluster mentionnés dans le tableau précédent. Et les périphériques réseau qui prennent en charge la communication entre le réseau virtuel et les réseaux extérieurs.
Le tableau suivant récapitule les neufs nœuds de cluster créés lors du déploiement de HDInsight dans un réseau virtuel Azure personnalisé.
Type de ressource | Nombre présent | Détails |
---|---|---|
Nœud principal | two | |
Nœud zookeeper | three | |
Nœud Worker | two | Ce nombre peut varier en fonction de la configuration et de la mise à l'échelle du cluster. Un minimum de trois nœuds Worker est nécessaire pour Apache Kafka. |
Nœud de passerelle | two | Les nœuds de passerelle sont des machines virtuelles créées dans Azure, mais ne sont pas visibles dans votre abonnement. Contactez le support technique si vous devez redémarrer ces nœuds. |
Les ressources réseau suivantes sont automatiquement créées à l’intérieur du réseau virtuel utilisé avec HDInsight :
Ressource de mise en réseau | Nombre présent | Détails |
---|---|---|
Équilibrage de charge | Deux | L’équilibreur de charge fournit un accès réseau entrant pour les nœuds. Les deux équilibreurs de charge sont destinés aux deux nœuds principaux et aux deux nœuds de passerelle. Les équilibreurs de charge sont des références SKU Standard. |
Interfaces réseau | neuf | Cette valeur est basée sur un cluster normal, où chaque nœud dispose de sa propre interface réseau. Les neuf interfaces sont destinées aux deux nœuds principaux, aux trois nœuds Zookeeper, aux deux nœuds Worker et aux deux nœuds de passerelle mentionnés dans le tableau précédent. |
Adresses IP publiques | two | Deux adresses IP publiques sont liées aux équilibreurs de charge. |
Vous pouvez utiliser plusieurs méthodes de connectivité sortante avec le réseau virtuel personnalisé. Celles-ci sont illustrées dans SNAT (Source Network Address Translation) pour les connexions sortantes – Azure Load Balancer.
Remarque
La méthode recommandée consiste à associer le sous-réseau à une passerelle NAT. Elle nécessite une passerelle NAT et un groupe de sécurité réseau créé dans le sous-réseau avant la création du cluster HDInsight. Vous pouvez lier une IP publique ou un préfixe d’IP publique à la passerelle NAT. Pour les règles de groupe de sécurité réseau à créer, consultez Contrôler le trafic réseau dans Azure HDInsight.
Points de terminaison pour la connexion à HDInsight
Vous pouvez accéder à votre cluster HDInsight de trois façons :
- Point de terminaison HTTPS à l'extérieur du réseau virtuel au niveau de
CLUSTERNAME.azurehdinsight.net
. - Point de terminaison SSH pour se connecter directement au nœud principal à
CLUSTERNAME-ssh.azurehdinsight.net
. - Point de terminaison HTTPS au sein du réseau virtuel
CLUSTERNAME-int.azurehdinsight.net
. Notez la présence de le «-int
» dans cette URL. Ce point de terminaison est résolu en une adresse IP privée dans ce réseau virtuel et n’est pas accessible depuis l’Internet public.
Ces trois points de terminaison se voient attribuer chacun un équilibreur de charge.
Des adresses IP publiques sont également fournies aux deux points de terminaison permettant la connexion depuis l'extérieur du réseau virtuel.
- Une adresse IP publique est attribuée à l'équilibreur de charge pour le nom de domaine complet (FQDN) à utiliser pour vous connecter au cluster depuis Internet
CLUSTERNAME.azurehdinsight.net
. - La deuxième adresse IP publique est utilisée pour le nom de domaine SSH
CLUSTERNAME-ssh.azurehdinsight.net
.