HDInsight 上の Apache Hadoop サービスで使用されるポート

このドキュメントでは、HDInsight クラスター上で実行されている Apache Hadoop サービスによって使用されるポートの一覧を示します。 また、SSH を使用したクラスターへの接続に使用されるポートの情報も提供します。

パブリック ポートと非パブリック ポート

Linux ベースの HDInsight クラスターでは、3 つのポートだけがインターネット上で公開されます。22、23、443 です。 これらのポートでは、SSH のほか、セキュリティで保護された HTTPS プロトコルを介して公開されるサービスを使い、クラスターへのアクセスを確保します。

HDInsight は Azure Virtual Network 上で実行される複数の Azure Virtual Machines (クラスター ノード) によって実装されます。 仮想ネットワーク内から、インターネット経由で公開されていないポートにアクセスできます。 SSH 経由でヘッド ノードに接続する場合は、クラスター ノードで実行されているサービスに直接アクセスできます。

重要

HDInsight の構成オプションとして Azure Virtual Network を指定しないと、Azure Virtual Network が自動的に作成されます。 ただし、この仮想ネットワークに他のコンピューター (他の Azure Virtual Machines やクライアント開発用コンピューターなど) を参加させることはできません。

仮想ネットワークに他のマシンを参加させるには、まず仮想ネットワークを作成し、HDInsight クラスターの作成時にその仮想ネットワークを指定する必要があります。 詳細については、「Plan a virtual network for HDInsight」 (HDInsight 用の仮想ネットワークの計画) を参照してください。

パブリック ポート

HDInsight クラスターのすべてのノードは、Azure Virtual Network 内にあります。 インターネットからノードに直接アクセスすることはできません。 パブリック ゲートウェイにより、すべての HDInsight クラスターの種類に共通する次のポートへのインターネット アクセスが提供されます。

サービス Port Protocol 説明
sshd 22 SSH プライマリ ヘッドノードの sshd にクライアントを接続します。 詳細については、HDInsight での SSH の使用に関するページを参照してください。
sshd 22 SSH エッジ ノードの sshd にクライアントを接続します。 詳細については、HDInsight での SSH の使用に関するページを参照してください。
sshd 23 SSH セカンダリ ヘッドノードの sshd にクライアントを接続します。 詳細については、HDInsight での SSH の使用に関するページを参照してください。
Ambari 443 HTTPS Ambari Web UI。 Apache Ambari Web UI を使用した HDInsight の管理に関するページをご覧ください
Ambari 443 HTTPS Ambari REST API。 「Apache Ambari REST API を使用した HDInsight の管理」をご覧ください
WebHCat 443 HTTPS HCatalog REST API。 MapReduce と Curl の使用に関する記事を参照してください
HiveServer2 443 ODBC ODBC を使用して Hive に接続します。 Microsoft ODBC ドライバーを使用した Excel から HDInsight への接続に関する記事をご覧ください。
HiveServer2 443 JDBC JDBC を使用して Apache Hive に接続します。 Hive JDBC ドライバーを使用した HDInsight の Apache Hive への接続に関するページをご覧ください

次のポートは、特定のクラスターの種類で使用できます。

サービス Port Protocol クラスターの種類 説明
Stargate 443 HTTPS hbase HBase REST API。 Apache HBase の使用開始に関するページをご覧ください
Livy 443 HTTPS Spark Spark REST API。 Apache Livy を使用したリモートからの Apache Spark ジョブの送信に関するページをご覧ください
Spark Thrift サーバー 443 HTTPS Spark Hive クエリを送信するために使用される Spark Thrift サーバー。 HDInsight での Beeline と Apache Hive の使用に関する記事をご覧ください
Kafka REST プロキシ 443 HTTPS Kafka Kafka REST API。 「REST プロキシを使用して Azure HDInsight で Apache Kafka クラスターを操作する」をご覧ください。

認証

インターネット上で公開されるすべてのサービスを認証する必要があります。

Port 資格情報
22 または 23 クラスターの作成時に指定した SSH ユーザー資格情報
443 ログイン名 (既定値: admin) と、クラスターの作成時に設定したパスワード

非パブリック ポート

注意

一部のサービスは、特定のクラスターの種類でのみ利用できます。 たとえば、HBase を利用できるのは、クラスターの種類が HBase の場合のみです。

重要

一部のサービスは、一度に 1 つのヘッド ノード上でしか実行されません。 プライマリのヘッド ノード上のサービスに接続しようとしてエラーが発生した場合は、セカンダリのヘッド ノードを使用して再試行してください。

Ambari

サービス Nodes Port URL パス Protocol
Ambari Web UI ヘッド ノード 8080 / HTTP
Ambari REST API ヘッド ノード 8080 /api/v1 HTTP

例 :

  • Ambari REST API: curl -u admin "http://10.0.0.11:8080/api/v1/clusters"

HDFS ポート

サービス Nodes Port Protocol 説明
NameNode Web UI ヘッド ノード 30070 HTTPS 状態を表示する Web UI
NameNode メタデータ サービス ヘッド ノード 8020 IPC ファイル システム メタデータ
DataNode すべての worker ノード 30075 HTTPS 状態、ログなどを表示する Web UI
DataNode すべての worker ノード 30010   データ転送
DataNode すべての worker ノード 30020 IPC メタデータ操作
セカンダリ NameNode ヘッド ノード 50090 HTTP NameNode メタデータのチェックポイント

YARN ポート

サービス Nodes Port Protocol 説明
Resource Manager Web UI ヘッド ノード 8088 HTTP Resource Manager の Web UI
Resource Manager Web UI ヘッド ノード 8090 HTTPS Resource Manager の Web UI
Resource Manager 管理インターフェイス ヘッド ノード 8141 IPC アプリケーション送信用 (Hive、Hive サーバー、Pig など)
Resource Manager スケジューラ ヘッド ノード 8030 HTTP 管理インターフェイス
Resource Manager アプリケーション インターフェイス ヘッド ノード 8050 HTTP アプリケーション マネージャー インターフェイスのアドレス
NodeManager すべての worker ノード 30050   コンテナー マネージャーのアドレス
NodeManager Web UI すべての worker ノード 30060 HTTP Resource Manager インターフェイス
Timeline アドレス ヘッド ノード 10200 RPC Timeline サービスの RPC サービス
Timeline Web UI ヘッド ノード 8188 HTTP Timeline サービス Web UI

Hive ポート

サービス Nodes Port Protocol 説明
HiveServer2 ヘッド ノード 10001 Thrift Hive に接続するためのサービス (Thrift/JDBC)
Hive メタストア ヘッド ノード 9083 Thrift Hive メタデータに接続するためのサービス (Thrift/JDBC)

WebHCat ポート

サービス Nodes Port Protocol 説明
WebHCat サーバー ヘッド ノード 30111 HTTP HCatalog および他の Hadoop サービス上の Web API

MapReduce ポート

サービス Nodes Port Protocol 説明
JobHistory ヘッド ノード 19888 HTTP MapReduce JobHistory Web UI
JobHistory ヘッド ノード 10020   MapReduce JobHistory サーバー
ShuffleHandler   13562   中間 Map 出力を要求元 Reducer に転送

Oozie

サービス Nodes Port Protocol 説明
Oozie サーバー ヘッド ノード 11000 HTTP Oozie サービスの URL
Oozie サーバー ヘッド ノード 11001 HTTP Oozie 管理用ポート

Ambari メトリック

サービス Nodes Port Protocol 説明
TimeLine (アプリケーション履歴) ヘッド ノード 6188 HTTP Timeline サービス Web UI
TimeLine (アプリケーション履歴) ヘッド ノード 30200 RPC Timeline サービス Web UI

HBase ポート

サービス Nodes Port Protocol 説明
HMaster ヘッド ノード 16000    
HMaster 情報 Web UI ヘッド ノード 16010 HTTP HBase Master Web UI のポート
リージョン サーバー すべての worker ノード 16020  
リージョン サーバー情報 Web UI  すべての worker ノード 16030 HTTP HBase リージョン サーバー Web UI のポート
2181 クライアントが ZooKeeper への接続に使用するポート

Kafka ポート

サービス Nodes Port Protocol 説明
ブローカー ワーカー ノード 9092 Kafka Wire Protocol クライアント通信に使用
  Zookeeper ノード 2181   クライアントが ZooKeeper への接続に使用するポート
REST プロキシ Kafka 管理ノード 9400 HTTPS Kafka REST 仕様

Spark ポート

サービス Nodes Port Protocol URL パス 説明
Spark Thrift サーバー ヘッド ノード 10002 Thrift   Spark SQL に接続するためのサービス (Thrift/JDBC)
Livy サーバー ヘッド ノード 8998 HTTP   ステートメント、ジョブ、およびアプリケーションを実行するためのサービス
Jupyter Notebook ヘッド ノード 8001 HTTP   Jupyter Notebook Web サイト

例 :

  • Livy: curl -u admin -G "http://10.0.0.11:8998/". この例の 10.0.0.11 は、Livy サービスをホストするヘッド ノードの IP アドレスです。