分享方式:


HDInsight 上 Apache Hadoop 服務所使用的連接埠

此文件提供在 HDInsight 叢集上執行之 Apache Hadoop 服務所使用的連接埠清單。 此外,也提供用來連線到使用 SSH 之叢集的連接埠相關資訊。

公用連接埠與非公用連接埠

以 Linux 為基礎的 HDInsight 叢集只會在網際網路上公開三個連接埠:22、23 與 443。 這些連接埠使用 SSH 以及透過安全 HTTPS 通訊協定公開的服務保護叢集存取。

HDInsight 由數個在 Azure 虛擬網路上執行的 Azure 虛擬機器 (叢集節點) 所實作。 您可以從虛擬網路存取不是透過網際網路公開的連接埠。 若您透過 SSH 連線至前端節點,則可以直接存取在叢集節點上執行的服務。

重要

如果您沒有將 Azure 虛擬網路指定為 HDInsight 的設定選項,則會自動建立一個。 然而,您無法將其他電腦 (例如:其他 Azure 虛擬機器或用戶端開發電腦) 加入此虛擬網路。

若要將其他電腦加入至虛擬網路,您必須先建立虛擬網路,然後在建立 HDInsight 叢集時進行指定。 如需詳細資訊,請參閱規劃 HDInsight 的虛擬網路

公用連接埠

HDInsight 叢集中的所有節點都位於 Azure 虛擬網路中。 這些節點無法直接從網際網路存取。 公用閘道提供下列連接埠 (常見於所有的 HDInsight 叢集類型) 的網際網路存取。

服務 連接埠 通訊協定 描述
sshd 22 SSH 將用戶端連接到主要前端節點上的 sshd。 如需詳細資訊,請參閱搭配 HDInsight 使用 SSH
sshd 22 SSH 將用戶端連接至邊緣節點上的 sshd。 如需詳細資訊,請參閱搭配 HDInsight 使用 SSH
sshd 23 SSH 將用戶端連接到次要前端節點上的 sshd。 如需詳細資訊,請參閱搭配 HDInsight 使用 SSH
Ambari 443 HTTPS Ambari Web UI。 請參閱 使用 Apache Ambari Web UI 來管理 HDInsight
Ambari 443 HTTPS Ambari REST API。 請參閱使用 Apache Ambari REST API 來管理 HDInsight
WebHCat 443 HTTPS HCatalogREST API。 請參閱搭配 Curl 一起使用 MapReduce
HiveServer2 443 ODBC 使用 ODBC 連接至 Hive。 請參閱 使用 Microsoft ODBC 驅動程式將 Excel 連接到 HDInsight
HiveServer2 443 JDBC 使用 JDBC 來連線至 Hive。 請參閱使用 Hive JDBC 驅動程式來連線至 HDInsight 上的 Apache Hive

下列各項適用於特定叢集類型︰

服務 連接埠 通訊協定 叢集類型 描述
Stargate 443 HTTPS hbase HBase REST API。 請參閱開始使用 Apache HBase
Livy 443 HTTPS Spark Spark REST API。 請參閱使用 Apache Livy 從遠端提交 Apache Spark 作業
Spark Thrift 伺服器 443 HTTPS Spark 用來提交 Hive 查詢的 Spark Thrift 伺服器。 請參閱使用 Beeline 搭配 HDInsight 上的 Apache Hive
Kafka REST Proxy 443 HTTPS Kafka Kafka REST API。 請參閱使用 REST Proxy 與 Azure HDInsight 中的 Apache Kafka 叢集互動

驗證

在網際網路上公開的所有服務都必須經過驗證︰

連接埠 認證
22 或 23 在叢集建立期間指定的 SSH 使用者認證
443 在叢集建立期間設定的登入名稱 (預設值:admin) 和密碼

非公用連接埠

注意

部分服務只能在特定叢集類型上使用。 例如,HBase 只能在 HBase 叢集類型上使用。

重要

某些服務一次只能在一個前端節點上執行。 如果您嘗試連接到主要前端節點上的服務並收到錯誤,請使用次要前端節點重試。

Ambari

服務 節點 連接埠 URL 路徑 通訊協定
Ambari Web UI 前端節點 8080 / HTTP
Ambari REST API 前端節點 8080 /api/v1 HTTP

範例:

  • Ambari REST API:curl -u admin "http://10.0.0.11:8080/api/v1/clusters"

HDFS 連接埠

服務 節點 連接埠 通訊協定 描述
NameNode Web UI 前端節點 30070 HTTPS 用以檢視狀態的 Web UI
NameNode 中繼資料服務 前端節點 8020 IPC 檔案系統中繼資料
DataNode 所有背景工作節點 30075 HTTPS 用以檢視狀態、記錄等的 Web UI。
DataNode 所有背景工作節點 30010   資料轉移
DataNode 所有背景工作節點 30020 IPC 中繼資料作業
次要 NameNode 前端節點 50090 HTTP NameNode 中繼資料的檢查點

YARN 連接埠

服務 節點 連接埠 通訊協定 描述
Resource Manager 前端節點 8088 HTTP 適用於 Resource Manager 的 Web UI
Resource Manager 前端節點 8090 HTTPS 適用於 Resource Manager 的 Web UI
Resource Manager 系統管理介面 前端節點 8141 IPC 適用於應用程式提交 (Hive、Hive 伺服器、Pig 等)。
Resource Manager 排程器 前端節點 8030 HTTP 系統管理介面
Resource Manager 應用程式介面 前端節點 8050 HTTP 應用程式管理員介面的位址
NodeManager 所有背景工作節點 30050   容器管理員的位址
NodeManager Web UI 所有背景工作節點 30060 HTTP Resource Manager 介面
Timeline 位址 前端節點 10200 RPC Timeline 服務 RPC 服務。
Timeline Web UI 前端節點 8188 HTTP Timeline 服務 Web UI

Hive 連接埠

服務 節點 連接埠 通訊協定 描述
HiveServer2 前端節點 10001 Thrift 要連接到 Hive 的服務 (Thrift/JDBC)
Hive 中繼存放區 前端節點 9083 Thrift 要連接到 Hive 中繼資料的服務 (Thrift/JDBC)

WebHCat 連接埠

服務 節點 連接埠 通訊協定 描述
WebHCat 伺服器 前端節點 30111 HTTP HCatalog 和其他 Hadoop 服務為基礎的 Web API

MapReduce 連接埠

服務 節點 連接埠 通訊協定 描述
JobHistory 前端節點 19888 HTTP MapReduce JobHistory Web UI
JobHistory 前端節點 10020   MapReduce JobHistory 伺服器
ShuffleHandler   13562   將中繼對應輸出傳輸至要求的歸納器

Oozie

服務 節點 連接埠 通訊協定 描述
Oozie 伺服器 前端節點 11000 HTTP Oozie 服務的 URL
Oozie 伺服器 前端節點 11001 HTTP Oozie 系統管理的連接埠

Ambari 計量

服務 節點 連接埠 通訊協定 描述
TimeLine (應用程式歷程記錄) 前端節點 6188 HTTP Timeline 服務 Web UI
TimeLine (應用程式歷程記錄) 前端節點 30200 RPC Timeline 服務 Web UI

HBase 連接埠

服務 節點 連接埠 通訊協定 描述
HMaster 前端節點 16000    
HMaster 資訊 Web UI 前端節點 16010 HTTP HBase 主要 Web UI 的連接埠
區域伺服器 所有背景工作節點 16020  
區域伺服器資訊 Web UI  所有背景工作節點 16030 HTTP HBase 區域伺服器 Web UI 的連接埠
2181 用戶端用於連接至 ZooKeeper 的連接埠

Kafka 連接埠

服務 節點 連接埠 通訊協定 描述
Broker 背景工作節點 9092 Kafka 有線通訊協定 用於用戶端通訊
  Zookeeper 節點 2181   用戶端用於連接至 ZooKeeper 的連接埠
REST Proxy Kafka 管理節點 9400 HTTPS Kafka REST 規格

Spark 連接埠

服務 節點 連接埠 通訊協定 URL 路徑 描述
Spark Thrift 伺服器 前端節點 10002 Thrift   要連接到 Spark SQL 的服務 (Thrift/JDBC)
Livy 伺服器 前端節點 8998 HTTP   要執行陳述式、作業和應用程式的服務
Jupyter Notebook 前端節點 8001 HTTP   Jupyter Notebook 網站

範例:

  • Livy:curl -u admin -G "http://10.0.0.11:8998/"。 在此範例中,10.0.0.11 是託管 Livy 服務之前端節點的 IP 位址。