このページでは、クリーン ルームでノートブックを実行する方法について説明します。 ノートブックは、コラボレーターが共同でデータ分析を実行するために使用するインターフェイスです。
クリーン ルームにノートブックを追加する方法については、「クリーン ルームを作成する」を参照してください。
開始する前に
クリーン ルームでノートブックを管理および実行するには、次の手順を実行する必要があります。
課題 | 要件 | 必要な特権 | 説明 |
---|---|---|---|
ノートブックの管理 | 固有の要件なし |
ノートブックのアップローダーの場合:
|
クリーン ルームでのノートブックの一般的な管理タスク。 |
ノートブックの実行 | アップローダーを除くすべてのコラボレーターは、ノートブックを承認する必要があります。 指定されたランナーがノートブックを実行します。 | EXECUTE CLEAN ROOM TASK |
ノートブックのランナーがノートブックをアップロードしなかった場合は、実行する前にノートブックを承認する必要があります。 この明示的な承認は、既定の自動承認規則を使用して自動化できます。 自動承認ルールを参照してください。 |
ノートブックの承認または拒否 | 無し | MODIFY CLEAN ROOM |
ノートブックを実行する前に承認または拒否できます。 |
自動承認ルールの管理 | 自動承認は、ランナー以外のコラボレーターによって作成されたノートブックにのみ適用できます。 | 清潔な部屋の所有者または MANAGE 特権。 |
ノートブックの自動承認を制御します。 |
コラボレーターの能力 | クリーン ルームには、最大 10 人のコラボレーターを含めることができます。 | 無し | これには、作成者と最大 9 人の他のコラボレーターが含まれます。 |
作成者は、Databricks アカウントのクリーン ルームの所有者として自動的に割り当てられます。 コラボレーター組織のメタストア管理者には、Databricks アカウントのクリーン ルームの所有権が自動的に割り当てられます。 所有権は譲渡することができます。 「Unity Catalog オブジェクトの所有権を管理する」を参照してください。
ノートブックのアップロードとランナーの指定
コラボレーターがノートブックをクリーン ルームに追加する場合:
彼らはクリーンルームでそのノートブックをアップロードした者と見做されます。
ノートブックを追加する場合、アップローダーは、ノートブックの指定されたランナーであるコラボレーターを指定する必要があります。 指定されたランナーは、ノートブックの実行を許可されます。
指定されたランナーは 1 つだけです。
自分をノートブックの指定されたランナーとして割り当てることができます。
手順 3 を参照してください。データ資産とノートブックをクリーン ルームに追加する
クリーン ルームでノートブックを承認する
すべてのノートブックを実行する前に、アップローダーを除くすべてのコラボレーターからの承認が必要です。
ノートブックのレビュー状態を確認するには:
Azure Databricks ワークスペースで、[
カタログ。
[クイック アクセス] ページで、[Clean Rooms] > ボタンをクリックします。
一覧からクリーン ルームを選択します。
実行するノートブックを選択します。
右側の [ ユーザー ] アイコンをクリックして、ノートブックの詳細ページのコラボレーター セクションを展開します。
[ レビュー ] セクションでは、どのコラボレーターがノートブックを承認、却下、またはまだレビューしていないかを明確に説明します。
差分ビューは、ノートブックが以前のバージョンから変更された場合に使用できます。
ノートブックのバージョンを実行する場合、次のことが当てはまります。
- 最新バージョンのノートブックのみを実行できます。
- 承認または拒否できるのは、最新バージョンのノートブックのみです。
- 新しいコンテンツを追加するか、ランナーの指定を変更してノートブックを変更すると、新しいバージョンが作成され、すべてのコラボレーターのレビュー状態がリセットされます。
ノートブックの差分ビューにアクセスするには:
右側の 時計アイコン をクリックして、ノートブックの詳細ページのバージョン履歴を展開します。
ノートブックを承認または拒否するには:
右上にある「確認」ボタンをクリックします。
[承認] または [却下] を選択します。
各ノートブックのバージョンごとのコラボレーターは、レビューを最大で9回まで更新し、合計10回までレビューできます。 ただし、レビューの制限に達した場合でも、ノートブックはいつでも拒否できます。
自動承認ルール
コラボレーターは、自分のクリーン ルームの自動承認ルールを設定できます。 自動承認では、次のようになります。
- 自動承認ルールは、自分のユーザーではなく、他のユーザーによってアップロードされたノートブックに対してのみ作成できます。 自分が指定されたランナーである場合、自己作成ノートブックは独自の承認を必要としません。
- 2 人用のクリーン ルームでは、他のコラボレーターによって作成されたノートブックを自動承認できます。
- 2 人以上のコラボレーターがあるクリーン ルームでは、 すべての ユーザーまたは特定のコラボレーターによって作成されたノートブックを自動承認できます。
- 各自動承認ルールは、承認されたノートブックの 1 つのランナーを指定します。
- アップロードされたノートブックに関して、他のコラボレーターによる場合、あなたが指定のランナーである時、デフォルト設定は自動承認です。
- 自動承認は、指定されたランナーが別のコラボレーターであるクリーン ルームでは省略可能です。
- 自動承認はいつでも追加、更新、または削除できます。
自動承認を管理するには:
Azure Databricks ワークスペースで、[
カタログ。
[クイック アクセス] ページで、[Clean Rooms] > ボタンをクリックします。
[ クリーン ルーム ] ページで、歯車アイコンをクリックします。
[ 自動承認の構成] を選択します。
一致するアクセス許可ルールに基づいて、ノートブックの自動承認を構成します。
クリーン ルームでノートブックを実行する
ノートブックを実行するには、必要なすべての承認が取得され、自分が指定された実行担当者であることを確認してください。 その後、以下を実行します。
- [ノートブック] でノートブックをクリックしてプレビュー モードで開きます。
-
[実行] ボタンをクリックします。
- 実行できるのは、自分が指定された実行者であり、承認を受けたノートブックのみです。
- 自分で作成したノートブックを手動で承認して実行する必要はありません。
- 作成したノートブックは拒否できます。 実行する前に、再承認する必要があります。
- 各ノートブックの自動承認を管理できます。 自動承認ルールを参照してください。
- (省略可能) パラメーター付きのノートブックの実行 ダイアログで、 + 追加 をクリックして、ノートブック ジョブ タスクにパラメーター値を渡します。
- ノートブックを確認します。
- [実行] をクリックします。
- [詳細を表示する] をクリックして、実行の進行状況を表示します。 または、このページの [ 実行 ] に移動するか、ワークスペースのサイドバーで [ジョブ] と [パイプライン ] をクリックし、[ジョブの実行] タブに移動して 、実行 の進行状況を表示することもできます。
- ノートブックの実行結果を表示します。 実行が完了すると、ノートブックの結果が表示されます。 過去の実行を表示するには、[実行] に移動し、[開始時刻] 列のリンクをクリックします。
すべてのコラボレーターがノートブックを承認した場合でも、ランナーとしてアップローダーによって指定されたコラボレーターのみがノートブックを実行できます。
注
cr_creator_input_catalog
パラメーターと cr_collaborator_input_catalog
パラメーターは、実行時にクリーン ルーム ノートブックに自動的に渡されます。 これらのパラメーターは、サンプル テーブルを含むローカル テストに使用できます。 ジョブ タスクのパラメーターの詳細については、「ジョブのパラメーター化」を参照してください。
出力テーブルを使用してノートブックの出力を共有する
出力テーブルは、ノートブック実行によって生成され、ノートブック ランナーのメタストアと共有される一時的な読み取り専用テーブルです。 ノートブックが出力テーブルを作成する場合、ノートブック ランナーは 出力カタログでアクセスし ワークスペース内の他のユーザーと共有できます。 Databricks Clean Rooms での出力テーブルの作成と操作を参照してください。
Lakeflow ジョブを使用してクリーン ルーム ノートブックを実行する
Lakeflow ジョブを使用すると、ノートブックを実行したり、出力テーブルでタスクを実行したりできるため、クリーン ルームアセットを含む複雑なワークフローを作成できます。 タスクは、自分が実行でき、完全に承認されたクリーン ルーム ノートブックでのみ作成できます。 特にこれらの機能により、このようなワークフローが可能になります。
- Clean Room ノートブック タスクの種類では、ワークフロー タスクとしてクリーン ルーム ノートブックを選択して実行できます。 「クリーン ルームでノートブックを実行する」を参照してください。
- ワークフローによって開始されるノートブックの実行では、他のワークフロー タスクから参照できる出力テーブルを生成できます。 Databricks Clean Rooms での出力テーブルの作成と操作を参照してください。 -Lakeflow ジョブでは、ジョブ パラメーター値を渡す Task 値 を使用して、クリーンルームノートブックを使用したり、クリーンルームノートブックの出力をキャプチャしたり、その出力を他のワークフロー タスクに渡したりすることができます。 「タスク値を使用してタスク間で情報を渡す」を参照してください。
- クリーン ルームの出力スキーマ名は、自動的に生成されます。 パラメーターに
{{tasks.<your_task_name>.output.schema_name}}
と{{tasks.<your_task_name>.output.catalog_name}}
を含める場合は、ダウンストリーム ノートブック タスクで実行されるときに、それらの値をクリーン ルームから参照できます。 ノートブック タスクに移動して、[パラメーター] で値を選択します。
たとえば、次の手順を実行して、動的に生成された出力スキーマ名をタスク間で伝達するワークフローを作成できます。
次のタスク値の設定を含むノートブックを実行するタスク Clean Rooms ノートブック タスクの種類のタスクを作成します。
dbutils.jobs.taskValues.set(key="output_schema", value=dbutils.widgets.get("cr_output_schema"))
出力を処理するために、
output_schema
値を参照する後続のタスクを作成します。