Beeline を使用して HiveServer2 に接続するか、Beeline をローカルにインストールしてローカルから接続してください

2024-06-14

Apache Beeline は、HDInsight クラスターのヘッドノードに含まれている Hive クライアントです。この記事では、さまざまな種類の接続で HDInsight クラスターにインストールされている Beeline クライアントを使用して HiveServer2 に接続する方法について説明します。ローカルに Beeline クライアントをインストールする方法についても説明しています。

接続の種類

SSH セッションから

SSH セッションからクラスターのヘッドノードに接続するときは、ポート 10001 上の headnodehost のアドレスに接続することができます。

beeline -u 'jdbc:hive2://headnodehost:10001/;transportMode=http'

Azure 仮想ネットワーク経由

Azure 仮想ネットワーク経由でクライアントから HDInsight に接続するときは、クラスターのヘッドノードの完全修飾ドメイン名 (FQDN) を指定する必要があります。この接続はクラスターノードに直接行われるため、接続にはポート 10001 が使用されます。

beeline -u 'jdbc:hive2://<headnode-FQDN>:10001/;transportMode=http'

<headnode-FQDN> をクラスターヘッドノードの完全修飾ドメイン名に置き換えます。ヘッドノードの完全修飾ドメイン名を検索するには、Apache Ambari REST API を使用した HDInsight の管理に関するドキュメントの情報を使用してください。

Kerberos を使用して HDInsight Enterprise セキュリティパッケージ (ESP) クラスターへ

同じクラスター領域にあるコンピューターで、Microsoft Entra Domain Services に参加している Enterprise セキュリティパッケージ (ESP) クラスターにクライアントから接続するとき、ドメイン名 <AAD-Domain> と、クラスター <username> へのアクセス許可を付与されているドメインユーザーアカウントの名前も指定する必要があります。

kinit <username>
beeline -u 'jdbc:hive2://<headnode-FQDN>:10001/default;principal=hive/_HOST@<AAD-Domain>;auth-kerberos;transportMode=http' -n <username>

<username> を、クラスターへのアクセス許可を付与されているドメイン上のアカウントの名前で置き換えます。 <AAD-DOMAIN> をクラスターが参加している Microsoft Entra ID の名前に置き換えます。 <AAD-DOMAIN> 値には大文字の文字列を使用します。そうしないと、資格情報が見つかりません。必要に応じて /etc/krb5.conf で領域名を確認します。

Ambari から JDBC URL を確認するには:

Web ブラウザーから、https://CLUSTERNAME.azurehdinsight.net/#/main/services/HIVE/summary に移動します。ここで、CLUSTERNAME はクラスターの名前です。 HiveServer2 が実行されていることを確認します。
クリップボードを使用して、HiveServer2 JDBC URL をコピーします。

パブリックエンドポイントまたはプライベートエンドポイント経由

パブリックエンドポイントまたはプライベートエンドポイントを使用してクラスターに接続する場合は、クラスターログインアカウント名 (既定値 admin) とパスワードを指定する必要があります。たとえば、Beeline を使用してクライアントシステムから clustername.azurehdinsight.net のアドレスに接続する場合です。この接続は、ポート 443 を経由し、TLS/SSL を使用して暗号化されます。

clustername を、使用する HDInsight クラスターの名前に置き換えます。 admin をクラスターのクラスターログインアカウントに置き換えます。 ESP クラスターには、完全な UPN (例: user@domain.com) を使用します。 password をクラスターログインアカウントのパスワードに置き換えます。

beeline -u 'jdbc:hive2://clustername.azurehdinsight.net:443/;ssl=true;transportMode=http;httpPath=/hive2' -n admin -p 'password'

プライベートエンドポイントの場合:

beeline -u 'jdbc:hive2://clustername-int.azurehdinsight.net:443/;ssl=true;transportMode=http;httpPath=/hive2' -n admin -p 'password'

プライベートエンドポイントは、同じリージョンでピアリングされた VNET からのみアクセスできる基本のロードバランサーを指します。詳細については、グローバル VNet ピアリングとロードバランサーの制約に関する記事を参照してください。 -v オプションを指定して curl コマンドを使用すると、パブリックエンドポイントまたはプライベートエンドポイントに関する接続の問題をトラブルシューティングしてから、Beeline を使用できます。

Apache Spark での Beeline の使用

Apache Spark は独自の HiveServer2 実装を提供します。これは Spark Thrift サーバーとも呼ばれます。このサービスは、Hive ではなく、Spark SQL を使用してクエリを解決します。クエリによっては、パフォーマンスが向上する可能性があります。

パブリックエンドポイントまたはプライベートエンドポイント経由

使用される接続文字列は少し異なります。 httpPath=/hive2 が含まるのではなく、httpPath/sparkhive2を使用します。 clustername を、使用する HDInsight クラスターの名前に置き換えます。 admin をクラスターのクラスターログインアカウントに置き換えます。 password をクラスターログインアカウントのパスワードに置き換えます。

注意

ESP クラスターの場合、admin を完全な UPN (たとえば、user@domain.com) に置き換えます。

beeline -u 'jdbc:hive2://clustername.azurehdinsight.net:443/;ssl=true;transportMode=http;httpPath=/sparkhive2' -n admin -p 'password'

プライベートエンドポイントの場合:

beeline -u 'jdbc:hive2://clustername-int.azurehdinsight.net:443/;ssl=true;transportMode=http;httpPath=/sparkhive2' -n admin -p 'password'

Azure Spark でのクラスターヘッドノードから、または Azure Virtual Network 内

クラスターのヘッドノード、または HDInsight クラスターと同じ Azure Virtual Network 内のリソースから直接接続する場合は、10001 の代わりに、Spark Thrift サーバー用のポート 10002 を使用する必要があります。次の例は、ヘッドノードに直接接続する方法を示しています。

/usr/hdp/current/spark2-client/bin/beeline -u 'jdbc:hive2://headnodehost:10002/;transportMode=http'

Beeline クライアントをインストールする

Beeline はヘッドノードに含まれていますが、ローカルにインストールしたい場合があります。ローカルコンピューターにインストールするための手順は、Linux 用 Windows サブシステムに基づいています。

パッケージリストを更新します。ご利用の Bash シェルで次のコマンドを入力します。
```
sudo apt-get update
```
Java がインストールされていない場合はインストールします。確認するには、which java コマンドを使用します。
1. Java パッケージがインストールされていない場合は、次のコマンドを入力します。
```
sudo apt install openjdk-11-jre-headless
```
2. bashrc ファイルを開きます (通常は ~/.bashrc にあります): nano ~/.bashrc。
3. bashrc ファイルを修正します。ファイルの末尾に次の行を追加します。
```
export JAVA_HOME=/usr/lib/jvm/java-1.11.0-openjdk-amd64
```
  次に、Ctrl + X キー、Y キー、Enter キーの順に押します。

Hadoop と Beeline のアーカイブをダウンロードし、次のコマンドを入力します。

wget https://archive.apache.org/dist/hadoop/core/hadoop-2.7.3/hadoop-2.7.3.tar.gz
wget https://archive.apache.org/dist/hive/hive-1.2.1/apache-hive-1.2.1-bin.tar.gz

アーカイブをアンパックし、次のコマンドを入力します。
```
tar -xvzf hadoop-2.7.3.tar.gz
tar -xvzf apache-hive-1.2.1-bin.tar.gz
```
bashrc ファイルをさらに修正します。アーカイブがアンパックされた場所へのパスを識別する必要があります。 Linux 用 Windows サブシステムを使用し、手順に正確に従った場合、パスは /mnt/c/Users/user/ になります。ここで、user はユーザー名です。
1. ファイルを開きます: nano ~/.bashrc
2. 次のコマンドを適切なパスで変更して、bashrc ファイルの末尾にそれらを入力します。
```
export HADOOP_HOME=/path_where_the_archives_were_unpacked/hadoop-2.7.3
export HIVE_HOME=/path_where_the_archives_were_unpacked/apache-hive-1.2.1-bin
PATH=$PATH:$HIVE_HOME/bin
```
3. 次に、Ctrl + X キー、Y キー、Enter キーの順に押します。
ご利用の Bash セッションを閉じてから再度開きます。
接続をテストします。上記の「パブリックエンドポイントまたはプライベートエンドポイント経由」での接続形式を使用します。

次のステップ

Apache Hive での Beeline クライアントの使用例については、「Apache Hive で Apache Beeline を使用する」をご覧ください
HDInsight での Hive について詳しくは、HDInsight 上の Apache Hadoop での Apache Hive の使用に関するページをご覧ください。

次の方法で共有

Beeline を使用して HiveServer2 に接続するか、Beeline をローカルにインストールしてローカルから接続してください

接続の種類

SSH セッションから

Azure 仮想ネットワーク経由

Kerberos を使用して HDInsight Enterprise セキュリティ パッケージ (ESP) クラスターへ

パブリック エンドポイントまたはプライベート エンドポイント経由

Apache Spark での Beeline の使用

パブリック エンドポイントまたはプライベート エンドポイント経由

Azure Spark でのクラスター ヘッド ノードから、または Azure Virtual Network 内

Beeline クライアントをインストールする

次のステップ

フィードバック

その他のリソース

Kerberos を使用して HDInsight Enterprise セキュリティパッケージ (ESP) クラスターへ

パブリックエンドポイントまたはプライベートエンドポイント経由

パブリックエンドポイントまたはプライベートエンドポイント経由

Azure Spark でのクラスターヘッドノードから、または Azure Virtual Network 内