Portas utilizadas pelos serviços do Apache Hadoop no HDInsight

Este documento fornece uma lista das portas utilizadas pelos serviços do Apache Hadoop em execução em clusters do HDInsight. Também fornece informações sobre as portas utilizadas para ligar ao cluster através de SSH.

Portas públicas vs. portas não públicas

Os clusters do HDInsight baseados em Linux expõem apenas três portas publicamente na Internet: 22, 23 e 443. Estas portas protegem o acesso ao cluster através do SSH e dos serviços expostos através do protocolo HTTPS seguro.

O HDInsight é implementado por vários Máquinas Virtuais do Azure (nós de cluster) em execução num Rede Virtual do Azure. A partir da rede virtual, pode aceder a portas não expostas através da Internet. Se ligar através de SSH ao nó principal, pode aceder diretamente aos serviços em execução nos nós de cluster.

Importante

Se não especificar uma Rede Virtual do Azure como uma opção de configuração para o HDInsight, uma é criada automaticamente. No entanto, não pode associar outras máquinas (como outras Máquinas Virtuais do Azure ou a sua máquina de desenvolvimento de cliente) a esta rede virtual.

Para associar máquinas adicionais à rede virtual, primeiro tem de criar a rede virtual e, em seguida, especifique-a ao criar o cluster do HDInsight. Para obter mais informações, veja Planear uma rede virtual para o HDInsight.

Portas públicas

Todos os nós num cluster do HDInsight estão localizados num Rede Virtual do Azure. Os nós não podem ser acedidos diretamente a partir da Internet. Um gateway público fornece acesso à Internet às seguintes portas, que são comuns em todos os tipos de cluster do HDInsight.

Serviço Porta Protocolo Description
sshd 22 SSH Liga clientes ao sshd no nó principal principal principal. Para obter mais informações, veja Utilizar o SSH com o HDInsight.
sshd 22 SSH Liga clientes ao sshd no nó de extremidade. Para obter mais informações, veja Utilizar o SSH com o HDInsight.
sshd 23 SSH Liga clientes ao sshd no nó principal secundário. Para obter mais informações, veja Utilizar o SSH com o HDInsight.
Ambari 443 HTTPS IU da Web do Ambari. Veja Gerir o HDInsight com a IU da Web do Apache Ambari
Ambari 443 HTTPS API REST do Ambari. Veja Gerir o HDInsight com a API REST do Apache Ambari
WebHCat 443 HTTPS HCatalog API REST. Veja Utilizar o MapReduce com Curl
HiveServer2 443 ODBC Liga ao Hive com o ODBC. Consulte Ligar o Excel ao HDInsight com o controlador Microsoft ODBC.
HiveServer2 443 JDBC Liga-se ao ApacheHive com jDBC. Veja Ligar ao Apache Hive no HDInsight com o controlador JDBC do Hive

Os seguintes estão disponíveis para tipos de cluster específicos:

Serviço Porta Protocolo Tipo de cluster Description
Stargate 443 HTTPS HBase API REST do HBase. Veja Introdução à utilização do Apache HBase
Livy 443 HTTPS Spark API REST do Spark. Veja Submeter tarefas do Apache Spark remotamente com o Apache Livy
Servidor Spark Thrift 443 HTTPS Spark Servidor Spark Thrift utilizado para submeter consultas do Hive. Veja Utilizar o Beeline com o Apache Hive no HDInsight
Proxy REST do Kafka 443 HTTPS Kafka API REST do Kafka. Veja Interagir com clusters do Apache Kafka no Azure HDInsight com um proxy REST

Autenticação

Todos os serviços expostos publicamente na Internet têm de ser autenticados:

Porta Credenciais
22 ou 23 As credenciais de utilizador SSH especificadas durante a criação do cluster
443 O nome de início de sessão (predefinição: administrador) e a palavra-passe que foram definidos durante a criação do cluster

Portas não públicas

Nota

Alguns serviços só estão disponíveis em tipos de cluster específicos. Por exemplo, o HBase só está disponível em tipos de cluster HBase.

Importante

Alguns serviços só são executados num nó principal de cada vez. Se tentar ligar ao serviço no nó principal primário e receber um erro, tente novamente com o nó principal secundário.

Ambari

Serviço Nós Porta Caminho do URL Protocolo
IU da Web do Ambari Nós principais 8080 / HTTP
Ambari REST API Nós principais 8080 /api/v1 HTTP

Exemplos:

  • API REST do Ambari: curl -u admin "http://10.0.0.11:8080/api/v1/clusters"

Portas HDFS

Serviço Nós Porta Protocolo Description
IU Web do NameNode Nós principais 30070 HTTPS IU da Web para ver o estado
Serviço de metadados NameNode nós principais 8020 IPC Metadados do sistema de ficheiros
DataNode Todos os nós de trabalho 30075 HTTPS IU da Web para ver o estado, os registos, etc.
DataNode Todos os nós de trabalho 30010   Transferência de dados
DataNode Todos os nós de trabalho 30020 IPC Operações de metadados
NameNode Secundário Nós principais 50090 HTTP Ponto de verificação para metadados do NameNode

Portas YARN

Serviço Nós Porta Protocolo Description
IU da Web do Resource Manager Nós principais 8088 HTTP IU da Web para Resource Manager
IU da Web do Resource Manager Nós principais 8090 HTTPS IU da Web para Resource Manager
interface de administrador do Resource Manager nós principais 8141 IPC Para submissões de aplicações (Hive, Servidor do Hive, Pig, etc.)
Resource Manager scheduler nós principais 8030 HTTP Interface administrativa
Resource Manager interface de aplicação nós principais 8050 HTTP Endereço da interface do gestor de aplicações
NodeManager Todos os nós de trabalho 30050   O endereço do gestor de contentores
IU web do NodeManager Todos os nós de trabalho 30060 HTTP interface de Resource Manager
Endereço da linha cronológica Nós principais 10200 RPC O serviço RPC do serviço Linha Cronológica.
IU da Web da Linha Cronológica Nós principais 8188 HTTP IU da Web do serviço de Linha Cronológica

Portas do Hive

Serviço Nós Porta Protocolo Description
HiveServer2 Nós principais 10001 Thrift Serviço para ligar ao Hive (Thrift/JDBC)
Metastore do Hive Nós principais 9083 Thrift Serviço para ligar a metadados do Hive (Thrift/JDBC)

Portas WebHCat

Serviço Nós Porta Protocolo Description
Servidor WebHCat Nós principais 30111 HTTP API Web sobre HCatalog e outros serviços do Hadoop

Portas MapReduce

Serviço Nós Porta Protocolo Description
JobHistory Nós principais 19888 HTTP IU web do MapReduce JobHistory
JobHistory Nós principais 10020   Servidor MapReduce JobHistory
ShuffleHandler   13562   Transfere saídas intermédias do Mapa para pedir Redutores

Oozie

Serviço Nós Porta Protocolo Description
Servidor Oozie Nós principais 11000 HTTP URL para o serviço Oozie
Servidor Oozie Nós principais 11001 HTTP Porta para administrador do Oozie

Métricas do Ambari

Serviço Nós Porta Protocolo Description
TimeLine (Histórico de aplicações) Nós principais 6188 HTTP IU Da Web do serviço TimeLine
TimeLine (Histórico de aplicações) Nós principais 30200 RPC IU Da Web do serviço TimeLine

Portas HBase

Serviço Nós Porta Protocolo Description
HMaster Nós principais 16000    
IU da Web de informações do HMaster Nós principais 16010 HTTP A porta para a IU Da Web principal do HBase
Servidor de região Todos os nós de trabalho 16020  
IU da Web de informações do servidor de região  Todos os nós de trabalho 16030 HTTP A porta para a IU Web do servidor da Região do HBase
2181 A porta que os clientes utilizam para ligar ao ZooKeeper

Portas do Kafka

Serviço Nós Porta Protocolo Description
Mediador Nós de trabalho 9092 Protocolo Kafka Wire Utilizado para comunicação de cliente
  Nós do Zookeeper 2181   A porta que os clientes utilizam para ligar ao Zookeeper
Proxy REST Nós de gestão do Kafka 9400 HTTPS Especificação REST do Kafka

Portas do Spark

Serviço Nós Porta Protocolo Caminho do URL Description
Servidores Spark Thrift Nós principais 10002 Thrift   Serviço para ligar ao Spark SQL (Thrift/JDBC)
Servidor Livy Nós principais 8998 HTTP   Serviço para executar instruções, tarefas e aplicações
Jupyter Notebook Nós principais 8001 HTTP   site do Jupyter Notebook

Exemplos:

  • Livy: curl -u admin -G "http://10.0.0.11:8998/". Neste exemplo, 10.0.0.11 é o endereço IP do nó principal que aloja o serviço Livy.