Azure portal を使用した Azure Data Lake Analytics の管理

[アーティクル]
12/20/2023

重要

新しい Azure Data Lake Analytics アカウントは、サブスクリプションが有効になっていない場合は作成できなくなります。サブスクリプションを有効にする必要がある場合は、サポートに連絡し、ビジネスシナリオを提供してください。

Azure Data Lake Analytics を既に使用している場合は、2024 年 2 月 29 日までに組織で Azure Synapse Analytics への移行計画を作成する必要があります。

このアーティクルでは、Azure portal を使用して、Azure Data Lake Analytics アカウント、データソース、ユーザー、およびジョブを管理する方法について説明します。

Data Lake Analytics アカウントの管理

アカウントを作成する

Azure portal にサインインします。
[リソースの作成] を選び、[Data Lake Analytics] を検索します。
次の項目の値を選択します。
1. Name:Data Lake Analytics アカウントの名前。
2. サブスクリプション:アカウントに使用する Azure サブスクリプション。
3. リソースグループ:アカウントの作成先の Azure リソースグループ。
4. [場所] :Data Lake Analytics アカウントの Azure データセンター。
5. [Data Lake Store] :Data Lake Analytics アカウントのために使用される既定のストア。 Azure Data Lake Store アカウントと Data Lake Analytics アカウントは、同じ場所にある必要があります。
［作成］ を選択します

Data Lake Analytics アカウントの削除

Data Lake Analytics アカウントを削除する前に、その既定の Data Lake Store アカウントを削除します。

Azure Portal で Data Lake Analytics アカウントに移動します。
[削除] を選択します。
アカウント名を入力します。
[削除] を選択します。

データソースを管理する

Data Lake Analytics では、次のデータソースがサポートされています。

Data Lake Store
Azure Storage

データエクスプローラーを使用して、データソースを参照し、基本的なファイル管理操作を実行することができます。

データソースの追加

Azure Portal で Data Lake Analytics アカウントに移動します。
[データエクスプローラー] を選びます。
[Add Data Source](データソースの追加) を選択します。
- Data Lake Store アカウントを追加するには、アカウント名と、クエリを実行できるようにするためのアカウントへのアクセスが必要です。
- Azure Blob Storage を追加するには、ストレージアカウントとアカウントキーが必要です。それらを見つけるには、ポータルでストレージアカウントに移動し、[アクセスキー] を選びます。

ファイアウォール規則の設定

Data Lake Analytics を使用すると、ネットワークレベルで Data Lake Analytics アカウントへのアクセスをさらにロックダウンできます。ファイアウォールを有効にして、IP アドレスを指定するか、信頼されているクライアントの IP アドレス範囲を定義することができます。こうした方法を有効にすると、定義された範囲内の IP アドレスを使用しているクライアントだけがストアに接続できます。

Azure Data Factory や VM など、他の Azure サービスが Data Lake Analytics アカウントに接続する場合は、 [Allow Azure Services](Azure サービスを許可する) が [オン] になっていることを確認してください。

ファイアウォール規則の設定

Azure Portal で Data Lake Analytics アカウントに移動します。
左側のメニューで [ファイアウォール] を選びます。

新しいユーザーの追加

ユーザーの追加ウィザードを使用すると、新しい Data Lake ユーザーを簡単に作成できます。

Azure Portal で Data Lake Analytics アカウントに移動します。
左側の [作業の開始] で、[ユーザー追加ウィザード] を選びます。
ユーザーを選んでから、[選択] を選びます。
ロールを選んでから、[選択] を選びます。 Azure Data Lake を使用する新しい開発者を設定するには、Data Lake Analytics の開発者ロールを選択します。
U-SQL データベースのアクセス制御リスト (ACL) を選択します。正しく選択できたら、[選択] を選びます。
ファイルの ACL を選択します。既定のストアの場合は、ルートフォルダー "/" と /system フォルダーの ACL を変更しないでください。 [選択] を選びます。
選択したすべての変更を確認し、[実行] を選びます。
ウィザードが終了したら、[完了] を選びます。

Azure ロールベースのアクセス制御の管理

他の Azure サービスと同様に、Azure ロールベースのアクセス制御 (RBAC) を使用して、ユーザーがサービスと対話する方法を制御できます。

標準の Azure ロールには、次のような機能があります。

所有者:ジョブの送信、ジョブの監視、任意のユーザーのジョブの取り消し、アカウントの構成を行えます。
共同作成者:ジョブの送信、ジョブの監視、任意のユーザーのジョブの取り消し、アカウントの構成を行えます。
閲覧者:ジョブを監視できます。

U-SQL 開発者が Data Lake Analytics サービスを使用できるようにするには、Data Lake Analytics の開発者ロールを使用します。 Data Lake Analytics の開発者ロールを使用すると、次の操作を行えます。

ジョブを送信する。
ジョブの状態と、任意のユーザーによって送信されたジョブの進行状況を監視する。
任意のユーザーによって送信されたジョブの U-SQL スクリプトを確認する。
自分のジョブだけを取り消す。

Data Lake Analytics アカウントへのユーザーまたはセキュリティグループの追加

Azure Portal で Data Lake Analytics アカウントに移動します。
[アクセス制御 (IAM)] を選択します。
[追加][ロールの割り当ての追加] の順に選択して、[ロールの割り当ての追加] ページを開きます。
ユーザーにロールを割り当てます。詳細な手順については、「Azure portal を使用して Azure ロールを割り当てる」を参照してください。

注意

ユーザーまたはセキュリティグループがジョブを送信する必要がある場合は、ストアアカウントに対するアクセス許可も必要です。詳細については、Data Lake Store に格納されているデータのセキュリティ保護に関する記事を参照してください。

ジョブの管理

ジョブの送信

Azure Portal で Data Lake Analytics アカウントに移動します。
[新しいジョブ] を選びます。各ジョブで、以下の項目を構成します。
1. [ジョブ名] :ジョブの名前。
2. [優先度]: [その他のオプション] の下に表示されます。数値が小さいほど優先度が高くなります。 2 つのジョブがキューに登録されている場合は、優先度の値が小さい方のジョブが先に実行されます。
3. [AU]: このジョブのために予約する分析ユニット (コンピューティングプロセス) の最大数。
4. [ランタイム]: これも [その他のオプション] の下に表示されます。カスタムランタイムを受け取っていない場合は、[既定のランタイム] を選びます。
実際のスクリプトを追加します。
[ジョブの送信] を選びます。

ジョブの監視

Azure Portal で Data Lake Analytics アカウントに移動します。
ページの上部にある [すべてのジョブの表示] を選びます。アカウントのすべてのアクティブなジョブと最近終了したジョブの一覧が表示されます。
必要に応じて [フィルター] を選ぶと、[時間範囲]、[状態]、[ジョブ名]、[ジョブ ID]、[パイプライン名] または [パイプライン ID]、[定期的なアイテムの名前] または [定期的なアイテムの ID]、[作成者] の値でジョブを検索できます。

パイプラインジョブの監視

パイプラインの一部であるジョブは、特定のシナリオを実現するために、通常は順次実行されます。たとえば、Customer Insights 用に利用状況をクリーンアップ、抽出、変換、集約するパイプラインがあります。パイプラインジョブは、ジョブの送信時に "Pipeline" プロパティを使用して識別されます。 ADF V2 を使用してスケジュールされたジョブには、このプロパティが自動的に設定されます。

パイプラインの一部である U-SQL ジョブの一覧を表示するには、次の手順を実行します。

Azure Portal で Data Lake Analytics アカウントに移動します。
[ジョブ分析情報] を選びます。既定では [すべてのジョブ] タブに移動し、実行中のジョブ、キューに登録済みのジョブ、終了したジョブの一覧が表示されます。
[パイプラインジョブ] タブを選びます。パイプラインジョブの一覧が、各パイプラインの集計された統計と共に表示されます。

定期的なジョブの監視

定期的なジョブとは、ビジネスロジックは同一で、入力データが実行するたびに異なるジョブです。定期的なジョブは、常に成功し、実行時間も比較的安定していることが理想的です。定期的なジョブの動作を監視することは、ジョブの正常性を保つのに役立ちます。定期的なジョブは、"Recurrence" プロパティを使用して識別されます。 ADF V2 を使用してスケジュールされたジョブには、このプロパティが自動的に設定されます。

定期的に実行される U-SQL ジョブの一覧を表示するには、次の手順を実行します。

Azure Portal で Data Lake Analytics アカウントに移動します。
[ジョブ分析情報] を選びます。既定では [すべてのジョブ] タブに移動し、実行中のジョブ、キューに登録済みのジョブ、終了したジョブの一覧が表示されます。
[定期的なジョブ] タブを選びます。定期的なジョブの一覧が、定期的な各ジョブの集計された統計と共に表示されます。

次の方法で共有

Azure portal を使用した Azure Data Lake Analytics の管理

Data Lake Analytics アカウントの管理

アカウントを作成する

Data Lake Analytics アカウントの削除

データソースを管理する

データソースの追加

ファイアウォール規則の設定

ファイアウォール規則の設定

新しいユーザーの追加

Azure ロールベースのアクセス制御の管理

Data Lake Analytics アカウントへのユーザーまたはセキュリティグループの追加

ジョブの管理

ジョブの送信

ジョブの監視

パイプラインジョブの監視

定期的なジョブの監視

次のステップ

その他のリソース

次の方法で共有

Azure portal を使用した Azure Data Lake Analytics の管理

Data Lake Analytics アカウントの管理

アカウントを作成する

Data Lake Analytics アカウントの削除

データ ソースを管理する

データ ソースの追加

ファイアウォール規則の設定

ファイアウォール規則の設定

新しいユーザーの追加

Azure ロールベースのアクセス制御の管理

Data Lake Analytics アカウントへのユーザーまたはセキュリティ グループの追加

ジョブの管理

ジョブの送信

ジョブの監視

パイプライン ジョブの監視

定期的なジョブの監視

次のステップ

その他のリソース

データソースを管理する

データソースの追加

Data Lake Analytics アカウントへのユーザーまたはセキュリティグループの追加

パイプラインジョブの監視