Ports utilisés par les services Apache Hadoop sur HDInsight

Ce document fournit la liste des ports utilisés par les services Apache Hadoop exécutés sur des clusters HDInsight. Il fournit également des informations sur les ports utilisés pour se connecter au cluster à l’aide de SSH.

Ports publics et ports non publics

Les clusters HDInsight sous Linux exposent uniquement trois ports publiquement sur Internet : 22, 23 et 443. Ces ports sécurisent l’accès au cluster à l’aide de SSH et les services exposés sur le protocole HTTPS sécurisé.

HDInsight est implémenté par plusieurs Machines virtuelles Microsoft Azure (nœuds de cluster) exécutées sur Réseau virtuel Microsoft Azure. Depuis le réseau virtuel, vous pouvez accéder aux ports non exposés sur Internet. Si vous vous connectez via SSH au nœud principal, vous pouvez accéder directement aux services qui s’exécutent sur les nœuds de cluster.

Important

Si vous ne spécifiez pas de réseau virtuel Azure comme une option de configuration pour HDInsight, un réseau virtuel Azure sera créé automatiquement. Toutefois, vous ne pouvez pas associer d’autres ordinateurs (comme les autres machines virtuelles Azure ou votre ordinateur de développement client) à ce réseau virtuel.

Pour joindre des ordinateurs supplémentaires au réseau virtuel, vous devez d’abord créer le réseau virtuel, puis le spécifier lors de la création de votre cluster HDInsight. Pour plus d’informations, consultez Planifier un réseau virtuel pour HDInsight.

Ports publics

Tous les nœuds d’un cluster HDInsight se trouvent dans une instance Réseau virtuel Microsoft Azure. Ils ne sont pas directement accessibles à partir d’Internet. Une passerelle publique fournit l’accès à Internet pour les ports suivants, qui sont communs à tous les types de cluster HDInsight.

Service Port Protocol Description
sshd 22 SSH Connecte les clients à sshd sur le nœud principal primaire. Pour en savoir plus, voir Utilisation de SSH avec Hadoop Linux sur HDInsight depuis Linux, Unix ou OS X.
sshd 22 SSH Connecte les clients à sshd sur le nœud de périmètre. Pour en savoir plus, voir Utilisation de SSH avec Hadoop Linux sur HDInsight depuis Linux, Unix ou OS X.
sshd 23 SSH Connecte les clients à sshd sur le nœud principal secondaire. Pour en savoir plus, voir Utilisation de SSH avec Hadoop Linux sur HDInsight depuis Linux, Unix ou OS X.
Ambari 443 HTTPS Interface utilisateur web d’Ambari. Consultez Gérer des clusters HDInsight à l’aide de l’interface utilisateur web Apache Ambari
Ambari 443 HTTPS API Ambari REST. Consultez Gérer des clusters HDInsight à l’aide de l’interface utilisateur Apache Ambari REST
WebHCat, 443 HTTPS API REST HCatalog. Voir Utiliser MapReduce avec Curl
HiveServer2 443 ODBC Se connecte à Hive à l’aide de ODBC. Consultez la page Connexion d’Excel à HDInsight à l’aide du pilote ODBC Microsoft.
HiveServer2 443 JDBC Se connecte à Apache Hive à l’aide de JDBC. Consultez la page Se connecter à Apache Hive sur HDInsight à l’aide du pilote JDBC Hive

Les éléments suivants sont disponibles pour les types de clusters spécifiques :

Service Port Protocol Type de cluster Description
Stargate 443 HTTPS hbase API REST HBase. Voir Bien démarrer avec Apache HBase
Livy 443 HTTPS Spark API REST Spark. Voir Envoi de tâches Apache Spark à distance avec Apache Livy
Serveur Spark Thrift 443 HTTPS Spark Le serveur Spark Thrift utilisé pour envoyer des requêtes Hive. Voir Utiliser Beeline avec Apache Hive sur HDInsight
Proxy REST Kafka 443 HTTPS Kafka API REST Kafka. Voir Interagir avec des clusters Apache Kafka dans Azure HDInsight à l’aide d’un proxy REST.

Authentification

Tous les services exposés publiquement sur Internet doivent être authentifiés :

Port Informations d'identification
22 ou 23 Les informations d’identification utilisateur SSH spécifiées lors de la création du cluster
443 Le nom de connexion (par défaut : admin) et le mot de passe qui ont été définis lors de la création du cluster

Ports non publics

Notes

Certains services sont disponibles uniquement sur certains types de clusters. Par exemple, HBase est disponible uniquement sur les clusters de type HBase.

Important

Certains services s’exécutent uniquement sur un nœud principal à la fois. Si vous tentez de vous connecter au service sur le nœud principal et que vous rencontrez une erreur, recommencez à l’aide du nœud secondaire.

Ambari

Service Nœuds Port Chemin d'accès de l'URL Protocol
Interface utilisateur Web d'Ambari Nœuds principaux 8080 / HTTP
API Ambari REST Nœuds principaux 8080 /api/v1 HTTP

Exemples :

  • API Ambari REST : curl -u admin "http://10.0.0.11:8080/api/v1/clusters"

Ports HDFS

Service Nœuds Port Protocol Description
Interface utilisateur web de NameNode Nœuds principaux 30070 HTTPS Interface utilisateur web pour afficher l’état
Service de métadonnées NameNode Nœuds principaux 8020 IPC Métadonnées du système de fichiers
DataNode Tous les nœuds de travail 30075 HTTPS Interface utilisateur web pour afficher l’état, les journaux, etc.
DataNode Tous les nœuds de travail 30010   Transfert de données
DataNode Tous les nœuds de travail 30020 IPC Opérations sur les métadonnées
NameNode secondaire Nœuds principaux 50090 HTTP Point de contrôle pour les métadonnées NameNode

Ports YARN

Service Nœuds Port Protocol Description
Interface utilisateur web de Resource Manager Nœuds principaux 8088 HTTP Interface utilisateur web pour Resource Manager
Interface utilisateur web de Resource Manager Nœuds principaux 8090 HTTPS Interface utilisateur web pour Resource Manager
Interface d’administration de Resource Manager Nœuds principaux 8141 IPC Pour les envois d’application (Hive, serveur Hive, Pig, etc.)
Scheduler Resource Manager Nœuds principaux 8030 HTTP Interface d’administration
Interface d’application Resource Manager Nœuds principaux 8050 HTTP Adresse de l’interface du gestionnaire d’applications
NodeManager Tous les nœuds de travail 30050   L’adresse du gestionnaire de conteneurs
Interface utilisateur web de NodeManager Tous les nœuds de travail 30060 HTTP Interface de Resource Manager
Adresse de Timeline Nœuds principaux 10200 RPC Le service RPC du service de Timeline.
Interface utilisateur web de Timeline Nœuds principaux 8188 HTTP L’interface utilisateur web du service Timeline

Ports Hive

Service Nœuds Port Protocol Description
HiveServer2 Nœuds principaux 10001 Thrift Service pour se connecter à Hive (Thrift/JDBC)
Metastore Hive Nœuds principaux 9083 Thrift Service pour se connecter aux métadonnées Hive (Thrift/JDBC)

Ports WebHCat

Service Nœuds Port Protocol Description
Serveur WebHCat Nœuds principaux 30111 HTTP API web sur HCatalog et d’autres services Hadoop

Ports MapReduce

Service Nœuds Port Protocol Description
JobHistory Nœuds principaux 19888 HTTP Interface utilisateur web de MapReduce JobHistory
JobHistory Nœuds principaux 10020   Serveur MapReduce JobHistory
ShuffleHandler   13562   Transfère les sorties Map intermédiaires aux raccords de réduction qui le demandent

Oozie

Service Nœuds Port Protocol Description
Serveur Oozie Nœuds principaux 11000 HTTP URL du service Oozie
Serveur Oozie Nœuds principaux 11001 HTTP Port pour l’administration Oozie

Mesures d’Ambari

Service Nœuds Port Protocol Description
TimeLine (historique d’application) Nœuds principaux 6188 HTTP L’interface utilisateur web du service Timeline
TimeLine (historique d’application) Nœuds principaux 30200 RPC L’interface utilisateur web du service Timeline

Ports HBase

Service Nœuds Port Protocol Description
HMaster Nœuds principaux 16000    
Interface utilisateur web d’informations sur HMaster Nœuds principaux 16010 HTTP Le port de l’interface utilisateur web principale de HBase Master
Serveur de la région Tous les nœuds de travail 16020  
Interface utilisateur web des informations sur le serveur de région  Tous les nœuds de travail 16030 HTTP Port de l’interface utilisateur web du serveur de région HBase
2181 Le port que les clients utilisent pour se connecter à ZooKeeper

Ports Kafka

Service Nœuds Port Protocol Description
Service Broker Nœuds de travail 9092 Protocole de transmission Kafka Utilisé pour la communication client
  Nœuds Zookeeper 2181   Le port que les clients utilisent pour se connecter à ZooKeeper
Proxy REST Nœuds de gestion Kafka 9400 HTTPS Spécification REST Kafka

Ports Spark

Service Nœuds Port Protocol Chemin d'accès de l'URL Description
Serveurs Thrift Spark Nœuds principaux 10002 Thrift   Service de connexion à Spark SQL (Thrift/JDBC)
Serveur Livy Nœuds principaux 8998 HTTP   Service d’exécution des instructions, des travaux et des applications
Jupyter Notebook Nœuds principaux 8001 HTTP   Site web Jupyter Notebook

Exemples :

  • Livy : curl -u admin -G "http://10.0.0.11:8998/". Dans cet exemple, 10.0.0.11 est l’adresse IP du nœud principal qui héberge le service Livy.