Portas usadas pelos serviços do Apache Hadoop em execução no HDInsight
Este documento fornece uma lista das portas usadas pelos serviços do Apache Hadoop em execução nos clusters HDInsight. Ele também fornece informações sobre portas usadas para se conectar ao cluster usando SSH.
Portas públicas versus portas não públicas
Os clusters HDInsight baseados em Linux expõem apenas três portas publicamente na Internet: 22, 23 e 443. Essas portas protegem o acesso ao cluster usando SSH e serviços expostos pelo protocolo HTTPS seguro.
O HDInsight é implementado por várias Máquinas Virtuais do Azure (os nós de cluster) em execução em uma Rede Virtual do Azure. Dentro da rede virtual, você pode acessar portas não expostas pela Internet. Se você se conectar via SSH ao nó principal, poderá acessar diretamente os serviços em execução nos nós de cluster.
Importante
Se você não especificar uma Rede Virtual do Azure como uma opção de configuração para o HDInsight, uma será criada automaticamente. No entanto, não é possível ingressar outras máquinas (como outras Máquinas Virtuais do Azure ou o computador de desenvolvimento cliente) nessa rede virtual.
Para ingressar mais computadores na rede virtual, primeiramente é preciso criar a rede virtual e depois especificá-la na criação do cluster HDInsight. Para obter mais informações, confira Planejar uma rede virtual para HDInsight.
Portas públicas
Todos os nós em um cluster HDInsight ficam localizados em uma Rede Virtual do Azure. Os nós não podem ser acessados diretamente pela Internet. Um gateway público fornece acesso à internet para as portas a seguir, que são comuns a todos os tipos de cluster HDInsight.
Serviço | Porta | Protocolo | Descrição |
---|---|---|---|
sshd | 22 | SSH | Conecta os clientes a sshd no nó de cabeçalho primário. Para obter mais informações, confira Usar SSH com HDInsight. |
sshd | 22 | SSH | Conecta clientes ao sshd no nó de borda. Para obter mais informações, confira Usar SSH com HDInsight. |
sshd | 23 | SSH | Conecta os clientes a sshd no nó de cabeçalho secundário. Para obter mais informações, confira Usar SSH com HDInsight. |
Ambari | 443 | HTTPS | Interface de usuário da Web do Ambari. Veja Gerenciar HDInsight usando a interface do usuário da Web do Apache Ambari |
Ambari | 443 | HTTPS | API REST do Ambari. Veja Gerenciar HDInsight usando a API REST do Apache Ambari |
WebHCat | 443 | HTTPS |
HCatalog API REST. Consulte Usar MapReduce com Ondulação |
HiveServer2 | 443 | ODBC | Conecta-se ao Hive usando ODBC. Confira Connect Excel to HDInsight with the Microsoft ODBC driver (Conectar o Excel ao HDInsight com o driver ODBC da Microsoft). |
HiveServer2 | 443 | JDBC | Conecta-se ao ApacheHive usando JDBC. Veja Conectar-se ao Apache Hive no Azure HDInsight usando o driver JDBC do Hive |
Veja a seguir os tipos de cluster específicos que estão disponíveis:
Serviço | Porta | Protocolo | Tipo de cluster | Descrição |
---|---|---|---|---|
Stargate |
443 | HTTPS | HBase | API REST do HBase. Veja Começar a usar o Apache HBase |
Livy | 443 | HTTPS | Spark | API REST do Spark. Veja Enviar Apache trabalhos em Spark remotamente usando Livy Apache |
Servidor do Spark Thrift | 443 | HTTPS | Spark | Servidor do Spark Thrift usado para enviar consultas do Hive. Veja Usar o Beeline com o Apache Hive no HDInsight |
Proxy REST do Kafka | 443 | HTTPS | Kafka | REST API do Kafka. Veja Interagir com clusters do Apache Kafka no Azure HDInsight por meio de um proxy REST |
Autenticação
Todos os serviços publicamente expostos na Internet devem ser autenticados:
Porta | Credenciais |
---|---|
22 ou 23 | As credenciais de usuário SSH especificadas durante a criação do cluster |
443 | O nome de logon (padrão: admin) e a senha que foram definidos durante a criação do cluster |
Portas não públicas
Observação
Alguns serviços só estão disponíveis em tipos de cluster específicos. Por exemplo, HBase só está disponível em tipos de cluster HBase.
Importante
Alguns serviços são executados somente em um nó de cabeçalho por vez. Se você tentar se conectar ao serviço em um nó de cabeçalho primário e receber um erro, tente novamente usando o nó de cabeçalho secundário.
Ambari
Serviço | Nós | Porta | Caminho da URL | Protocolo |
---|---|---|---|---|
Interface do usuário da Web do Ambari | Nós de cabeçalho | 8080 | / | HTTP |
API REST do Ambari | Nós de cabeçalho | 8080 | /api/v1 | HTTP |
Exemplos:
- API REST do Ambari:
curl -u admin "http://10.0.0.11:8080/api/v1/clusters"
Portas HDFS
Serviço | Nós | Porta | Protocolo | Descrição |
---|---|---|---|---|
Interface de usuário do NameNode na Web | Nós de cabeçalho | 30070 | HTTPS | Interface do usuário na Web para exibir status |
Serviço de metadados NameNode | Nós de cabeçalho | 8020 | IPC | Metadados do sistema de arquivos |
DataNode | Todos os nós de trabalho | 30075 | HTTPS | IU da Web para exibir status, logs e mais. |
DataNode | Todos os nós de trabalho | 30010 | Transferência de dados | |
DataNode | Todos os nós de trabalho | 30020 | IPC | Operações de metadados |
NameNode secundário | Nós de cabeçalho | 50090 | HTTP | Ponto de verificação para metadados do NameNode |
Portas YARN
Serviço | Nós | Porta | Protocolo | Descrição |
---|---|---|---|---|
Interface de usuário na Web do Resource Manager | Nós de cabeçalho | 8088 | HTTP | Interface de usuário na Web do Resource Manager |
Interface de usuário na Web do Resource Manager | Nós de cabeçalho | 8090 | HTTPS | Interface de usuário na Web do Resource Manager |
Interface administrativa do Resource Manager | Nós de cabeçalho | 8141 | IPC | Para envios de aplicativo (Hive, servidor Hive, Pig e mais.) |
Agendador do Resource Manager | Nós de cabeçalho | 8030 | HTTP | Interface administrativa |
Interface de aplicativo do Resource Manager | Nós de cabeçalho | 8050 | HTTP | Endereço da interface do gerenciador de aplicativos |
NodeManager | Todos os nós de trabalho | 30050 | O endereço do gerenciador de contêineres | |
Interface de usuário na Web do NodeManager | Todos os nós de trabalho | 30060 | HTTP | Interface do Resource Manager |
Endereço do Timeline | Nós de cabeçalho | 10200 | RPC | O serviço RPC do serviço do Timeline. |
Interface de usuário na Web do Timeline | Nós de cabeçalho | 8188 | HTTP | Interface de usuário na Web do Timeline |
Portas Hive
Serviço | Nós | Porta | Protocolo | Descrição |
---|---|---|---|---|
HiveServer2 | Nós de cabeçalho | 10001 | Thrift | Serviço para conexão ao Hive (Thrift/JDBC) |
Metastore do Hive | Nós de cabeçalho | 9083 | Thrift | Serviço para conexão a metadados do Hive (Thrift/JDBC) |
Portas WebHCat
Serviço | Nós | Porta | Protocolo | Descrição |
---|---|---|---|---|
Servidor WebHCat | Nós de cabeçalho | 30111 | HTTP | API Web sobre o HCatalog e outros serviços do Hadoop |
Portas MapReduce
Serviço | Nós | Porta | Protocolo | Descrição |
---|---|---|---|---|
JobHistory | Nós de cabeçalho | 19888 | HTTP | Interface de usuário na Web JobHistory do MapReduce |
JobHistory | Nós de cabeçalho | 10020 | Servidor JobHistory do MapReduce | |
ShuffleHandler | 13562 | Transfere saídas intermediárias Map para redutores de solicitação |
Oozie
Serviço | Nós | Porta | Protocolo | Descrição |
---|---|---|---|---|
Servidor Oozie | Nós de cabeçalho | 11000 | HTTP | URL para o serviço do Oozie |
Servidor Oozie | Nós de cabeçalho | 11001 | HTTP | Porta para administração do Oozie |
Métricas do Ambari
Serviço | Nós | Porta | Protocolo | Descrição |
---|---|---|---|---|
TimeLine (histórico do aplicativo) | Nós de cabeçalho | 6188 | HTTP | Interface de usuário na Web do Timeline |
TimeLine (histórico do aplicativo) | Nós de cabeçalho | 30200 | RPC | Interface de usuário na Web do Timeline |
Portas HBase
Serviço | Nós | Porta | Protocolo | Descrição |
---|---|---|---|---|
HMaster | Nós de cabeçalho | 16000 | ||
Interface de usuário na Web para informações do HMaster | Nós de cabeçalho | 16010 | HTTP | A porta para a interface de usuário na Web Mestre do HBase |
Servidor de região | Todos os nós de trabalho | 16020 | ||
Interface do usuário da Web de informações do servidor de região | Todos os nós de trabalho | 16030 | HTTP | A porta para a interface do usuário da Web do servidor da Região do HBase |
2181 | A porta que os clientes usam para se conectar ao ZooKeeper |
Portas Kafka
Serviço | Nós | Porta | Protocolo | Descrição |
---|---|---|---|---|
Agente | Nós de trabalho | 9092 | Protocolo Kafka Wire | Usado para comunicação do cliente |
Nós do Zookeeper | 2181 | A porta que os clientes usam para se conectar ao ZooKeeper | ||
Proxy REST | Nós de gerenciamento do Kafka | 9400 | HTTPS | Especificação da REST do Kafka |
Portas do Spark
Serviço | Nós | Porta | Protocolo | Caminho da URL | Descrição |
---|---|---|---|---|---|
Servidores Thrift Spark | Nós de cabeçalho | 10002 | Thrift | Serviço para conexão ao Spark SQL (Thrift/JDBC) | |
Servidor Livy | Nós de cabeçalho | 8998 | HTTP | Serviço para executar instruções, trabalhos e aplicativos | |
Jupyter Notebook | Nós de cabeçalho | 8001 | HTTP | Site do Jupyter Notebook |
Exemplos:
- Livy:
curl -u admin -G "http://10.0.0.11:8998/"
. Nesse exemplo,10.0.0.11
é o endereço IP do nó de cabeçalho que hospeda o serviço Livy.