この記事では、Azure Databricks でワークスペース、クラシック コンピューティング、ダッシュボード、ディレクトリ、モデル、ノートブック、ジョブの識別子と URL を取得する方法について説明します。
ワークスペースのインスタンス名、URL、および ID
一意の "インスタンス名"("ワークスペースごとの URL" とも呼ばれます) は、それぞれの Azure Databricks デプロイに割り当てられています。 これは、Azure Databricks デプロイにログインして API 要求を行うために使用される完全修飾ドメイン名です。
Azure Databricks "ワークスペース" は、Azure Databricks プラットフォームが実行される場所で、そこで Spark クラスターを作成してワークロードをスケジュールできます。 ワークスペースには、一意の数値のワークスペース ID があります。
ワークスペース単位のURL
ワークスペースごとの URL の形式は、adb-<workspace-id>.<random-number>.azuredatabricks.net です。 ワークスペース ID は adb- の直後に置かれ、"ドット" (.) が続きます。 ワークスペースごとの URL https://adb-5555555555555555.19.azuredatabricks.net/ の場合:
-
ワークスペースの URL は次の値です。
https://adb-5555555555555555.19.azuredatabricks.net/ -
インスタンス名が
adb-5555555555555555.19.azuredatabricks.net。 -
ワークスペース ID が
5555555555555555。
ワークスペースごとの URL を確認する
ワークスペースごとの URL は次のように確認できます。
ログインしているときにブラウザーで:
Azure portal でリソースを選択し、[URL] フィールドの値を書き留めます。
Azure API を使用します。 「Azure API を使用してワークスペースごとの URL を取得する」を参照してください。
レガシのリージョン URL
重要
従来のリージョン URL は避けてください。 彼ら:
- 新しいワークスペースでは動作しない場合があります。
- 信頼性が低く、ワークスペースごとの URL よりも低速です。
- ワークスペース ID を必要とする機能を中断する可能性があります。
レガシのリージョン URL は、Azure Databricks ワークスペースがデプロイされているリージョンと、ドメイン azuredatabricks.net (例: https://westus.azuredatabricks.net/) で構成されています。
-
https://westus.azuredatabricks.net/などのレガシのリージョン URL にログインした場合のインスタンス名は、westus.azuredatabricks.netです。 - ワークスペース ID が URL 内に現れるのは、レガシのリージョン URL を使用してログインした後だけです。 これは
o=の後に現れます。 URLhttps://<databricks-instance>/?o=6280049833385130の中で、ワークスペース ID は6280049833385130です。
コンピューティング リソースの URL と ID
Azure Databricks コンピューティング リソース は、運用 ETL パイプラインの実行、ストリーミング分析、アドホック分析、機械学習など、さまざまなユース ケース向けの統合プラットフォームを提供します。 各クラシック コンピューティング リソースには、クラスター ID と呼ばれる一意の ID があります。 これは、万能クラスターとジョブ クラスターの両方に適用されますが、サーバーレス コンピューティングには適用されません。 REST API を使用してクラスターの詳細を取得するには、クラスター ID が必要です。
クラスター ID を取得するには、サイドバーの
[コンピューティング] をクリックし、クラスター名を選択します。 クラスター ID は、このページの URL の /clusters/ コンポーネントの後の番号です。
https://<databricks-instance>/compute/clusters/<cluster-id>
次のスクリーンショットでは、クラスター ID は 0130-201722-abcdefgh です。
ダッシュボードの URL と ID
AI/BI dashboard は、データの視覚化と解説のプレゼンテーションです。 各ダッシュボードには一意の ID があります。 この ID を使用して、事前設定されたフィルターとパラメーター値を含む直接リンクを作成したり、REST API を使用してダッシュボードにアクセスしたりできます。
ダッシュボード URL の例:
https://adb-62800498333851.30.azuredatabricks.net/sql/dashboardsv3/01ef9214fcc7112984a50575bf2b460f
- ダッシュボード ID の例:
01ef9214fcc7112984a50575bf2b460f
ノートブック URL と ID
"ノートブック" は、実行可能なコード、視覚化、説明テキストを含むドキュメントへの Web ベースのインターフェイスです。 ノートブックは、Azure Databricks を操作するための 1 つのインターフェイスです。 各ノートブックには一意の ID があります。 ノートブック URL にはノートブック ID が含まれるため、ノートブック URL はノートブックに固有のものです。 これは、ノートブックを表示して編集するアクセス許可を持っている、Azure Databricks プラットフォーム上のすべてのユーザーと共有できます。 また、各ノートブック コマンド (セル) の URL は異なっています。
ノートブックの URL または ID を見つけるには、ノートブックを開きます。 セルの URL を見つけるには、コマンドの内容をクリックします。
ノートブック URL の例:
https://adb-62800498333851.30.azuredatabricks.net/?o=6280049833385130#notebook/1940481404050342`ノートブック ID の例:
1940481404050342.コマンド (セル) URL の例:
https://adb-62800498333851.30.azuredatabricks.net/?o=6280049833385130#notebook/1940481404050342/command/2432220274659491
フォルダー ID
フォルダーは、Azure Databricks ワークスペースで使用できるファイルを格納するために使用されるディレクトリです。 これらのファイルには、ノートブック、ライブラリ、またはサブフォルダーを指定できます。 各フォルダーと個々のサブフォルダーに関連付けられた特定の ID があります。 Permissions API は、この ID を directory_id として参照し、フォルダーのアクセス許可の設定と更新に使用されます。
directory_id を取得するには、Workspace API を使用します。
curl -n -X GET -H 'Content-Type: application/json' -d '{"path": "/Users/me@example.com/MyFolder"}' \
https://<databricks-instance>/api/2.0/workspace/get-status
API 呼び出し応答の例を次に示します。
{
"object_type": "DIRECTORY",
"path": "/Users/me@example.com/MyFolder",
"object_id": 123456789012345
}
モデル ID
モデルとは、MLflow 登録済みモデルを指します。これを使用すると、ステージ遷移とバージョン管理を通じて、運用環境で Mlflow モデルを管理できます。 Permissions API を介してモデルに対するアクセス許可をプログラムから変更するためには、登録済みモデルの ID が必要です。
登録済みのモデルの ID を取得するために、Workspace API エンドポイントの mlflow/databricks/registered-models/get を利用できます。 たとえば次のコードでは、ID を含むプロパティと一緒に、登録済みモデルのオブジェクトが返されます。
curl -n -X GET -H 'Content-Type: application/json' -d '{"name": "model_name"}' \
https://<databricks-instance>/api/2.0/mlflow/databricks/registered-models/get
返される値の形式は次のようになっています。
{
"registered_model_databricks": {
"name": "model_name",
"id": "ceb0477eba94418e973f170e626f4471"
}
}
ジョブ URL と ID
"ジョブ" は、即座に、またはスケジュールに基づいて、ノートブックまたは JAR を実行する方法です。
ジョブの URL を取得するには、サイドバーの
ジョブ] & [パイプライン ] をクリックし、ジョブ名をクリックします。 ジョブ ID は、URL の /jobs/ 後に表示されます。 ジョブ URL を使用して、ジョブとその実行履歴に移動します。 サポート チケットで共有するなど、特定の実行に直接リンクするには、代わりに実行 URL を使用します。
ジョブ実行 URL と ID を参照してください。
次のスクリーンショットでは、ジョブの URL は次のようになっています。
https://adb-westus.18.azuredatabricks.net/jobs/5?o=1248852073749208
この例では、ジョブ ID は 5 です。
ジョブ実行 URL と ID
1 つの ジョブ で多数の実行を実行できます。 各実行には、ジョブ ID とジョブ URL とは異なる独自の一意の 実行 ID と独自の URL があります。 サポート チケットなど、特定の実行へのリンクを共有する場合は、受信者が正しい実行を開くために、ジョブの URL ではなく実行 URL を使用します。
実行 URL の形式は次のとおりです。
https://<databricks-instance>/jobs/<job-id>/runs/<run-id>
ワークスペース UI で実行 ID または URL を検索するには:
- ジョブの [ 実行 ] タブで、[ 開始時刻 ] 列のリンクをクリックして、[ ジョブの実行の詳細 ] ページを開きます。 実行 ID は、
/runs/後にブラウザーのアドレス バーに表示されます。 実行を共有するアドレスをコピーします。 - [ ジョブ実行の詳細 ] ページのアドレス バーの URL には、ジョブ ID と実行 ID の両方が
/jobs/<job-id>/runs/<run-id>フォームに含まれています。
プログラムで実行 ID または URL を取得するには:
-
ジョブ API: 単一のジョブ実行エンドポイントを取得する を呼び出します。 応答には、
run_idとrun_page_urlが含まれます。これは、実行への直接 UI リンクです。 -
システム テーブル:
system.lakeflow.job_run_timelineテーブルには、job_id列とrun_id列の両方が含まれます。 「ジョブ システム テーブル リファレンス」を参照してください。
注
[ジョブの実行] タスクの種類を使用するタスクなど、別のジョブによってトリガーされる 実行 の場合、 parent_run_id フィールドは親実行を識別します。 「ジョブについての通知を追加する」をご覧ください。