AKS 上の HDInsight で Spark クラスターを作成する (プレビュー)

2024-09-20

大事な

AKS 上の Azure HDInsight は、2025 年 1 月 31 日に廃止されました。この発表でについて詳しく知ることができます。

ワークロードの突然の終了を回避するには、ワークロードを Microsoft Fabric または同等の Azure 製品に移行する必要があります。

大事な

この機能は現在プレビュー段階です。 Microsoft Azure プレビューの追加使用条件には、ベータ版、プレビュー版、または一般公開されていない Azure 機能に適用される、より多くの法的条件が含まれています。この特定のプレビューの詳細については、AKS プレビュー情報 Azure HDInsightを参照してください。ご質問や機能の提案を行う際は、AskHDInsight に詳細を記載してリクエストを送信してください。また、最新情報を得るために Azure HDInsight Communityをフォローしてください。

サブスクリプションの前提条件とリソースの前提条件手順が完了し、クラスタープールがデプロイされたら、引き続き Azure portal を使用して Spark クラスターを作成します。 Azure portal を使用して、クラスタープールに Apache Spark クラスターを作成できます。その後、Jupyter Notebook を作成し、それを使用して Apache Hive テーブルに対して Spark SQL クエリを実行できます。

Azure portal でクラスタープールを入力し、クラスタープールを選択してクラスタープールページに移動します。 [クラスタープール] ページで、新しい Spark クラスターを追加できるクラスタープールを選択します。

特定のクラスタープールページで、[+ 新しいクラスター] をクリックします。

この手順では、クラスターの作成ページが開きます。

財産	説明
予約	前提条件セクションで AKS 上の HDInsight 用に登録された Azure サブスクリプションが事前に設定されます。
リソースグループ	クラスタープールと同じリソースグループが事前に設定されます
地域	クラスタープールと仮想と同じリージョンが事前に設定されます
クラスタープール	クラスタープールの名前が事前に設定されます
HDInsight プールのバージョン	クラスタープールのバージョンは、プール作成時の選択から事前に設定されます。
AKS バージョンの HDInsight	AKS バージョンで HDI を指定する
クラスターの種類	ドロップダウンリストから [Spark] を選択します。
クラスターのバージョン	使用するイメージバージョンのバージョンを選択する
クラスター名	新しいクラスターの名前を入力します
ユーザー割り当ての管理された ID	ストレージとの接続文字列として機能するユーザー割り当てマネージド ID を選択します
ストレージアカウント	クラスターのプライマリストレージとして使用する事前に作成されたストレージアカウントを選択します
コンテナー名	事前に作成または新しいコンテナーを作成する場合は、コンテナー名 (一意) を選択します
Hive カタログ (省略可能)	事前に作成された Hive メタストア (Azure SQL DB) を選択する
Hive用SQLデータベース	ドロップダウンリストから、hive-metastore テーブルを追加する SQL Database を選択します。
SQL 管理者ユーザー名	SQL 管理者のユーザー名を入力します
キーボールト	ドロップダウンリストから、SQL 管理者ユーザー名のパスワードを含むシークレットを含む Key Vault を選択します
SQL パスワードシークレット名	SQL DB パスワードが格納されている Key Vault のシークレット名を入力します

手記

現在、HDInsight では MS SQL Server データベースのみがサポートされています。
Hive の制限により、メタストアデータベース名の "-" (ハイフン) 文字はサポートされていません。

[次へ: 構成と価格] 選択して続行します。

財産	説明
ノードサイズ	Spark ノードに使用するノードサイズを選択する
ワーカーノードの数	Spark クラスターのノード数を選択します。そのうち、3 つのノードはコーディネーターおよびシステムサービス用に予約されており、残りのノードは Spark ワーカー専用で、ノードごとに 1 つのワーカーです。たとえば、5 ノードクラスターには 2 つのワーカーがあります。
自動スケーリング	トグルボタンをクリックして自動スケールを有効にする
自動スケールの種類	負荷ベースまたはスケジュールベースの自動スケーリングから選択する
スムーズな終了タイムアウト	優雅に停止するためのタイムアウトを指定する
既定のワーカーノードの数	自動スケーリングのノード数を選択する
時間帯	タイムゾーンを選択する
自動スケーリングルール	日、開始時刻、終了時刻、ワーカーノードの数を選択します。
SSH を有効にする	有効になっている場合は、プレフィックスと SSH ノードの数を定義できます

[次へ: 統合] をクリックして、ログ記録のために Log Analytics を有効化し、選択します。

監視とメトリックのための Azure Prometheus は、クラスターの作成後に有効にすることができます。
[次へ: タグ] をクリックして、次のページに進みます。

[タグ] タブを示す

[タグページで、リソースに追加したいタグを入力してください。

財産	説明
名前	随意。 AKS プライベートプレビューで HDInsight などの名前を入力すると、リソースに関連付けられているすべてのリソースを簡単に識別できます。
価値	空白のままにします
資源	選択したすべてのリソースを選択する

「次へ」、「確認および作成」をクリックします。
[確認と作成] ページで、ページの上部にある [検証に成功しました] メッセージを探し、[の作成]クリックします。
デプロイが進行中、クラスターが作成されたページが表示されます。クラスターの作成には 5 ~ 10 分かかります。クラスターが作成されると、デプロイが完了 メッセージが表示されます。ページから移動した場合は、通知の状態を確認できます。
クラスターの概要ページに移動すると、エンドポイントリンクが表示されます。

次の方法で共有

AKS 上の HDInsight で Spark クラスターを作成する (プレビュー)

その他のリソース