Ottenere gli identificatori per gli oggetti dell'area di lavoro

Articolo
10/31/2024

Questo articolo illustra come ottenere l'area di lavoro, il cluster, il dashboard, la directory, il modello, il notebook e gli URL e gli URL di processo in Azure Databricks.

URL, ID e nomi di istanza dell'area di lavoro

Un nome di istanza univoco, noto anche come URL per area di lavoro, viene assegnato a ogni distribuzione di Azure Databricks. Si tratta del nome di dominio completo usato per accedere alla distribuzione di Azure Databricks ed effettuare richieste API.

Un area di lavoro di Azure Databricks è la posizione in cui viene eseguita la piattaforma Azure Databricks e in cui è possibile creare cluster Spark e pianificare i carichi di lavoro. Un'area di lavoro ha un ID univoco dell'area di lavoro numerica.

URL per area di lavoro

Questo URL di singole aree di lavoro ha il formato seguente adb-<workspace-id>.<random-number>.azuredatabricks.net. L'ID dell'area di lavoro viene visualizzato immediatamente dopo adb- e prima del “punto” (.). Per l'URL per area di lavoro https://adb-5555555555555555.19.azuredatabricks.net/:

Il nome dell'istanza è adb-5555555555555555.19.azuredatabricks.net.
L’ID dell’area di lavoro è 5555555555555555.

Determinare l'URL per area di lavoro

È possibile determinare l'URL per area di lavoro:

Nel browser al momento dell'accesso:
Nel portale di Azure, selezionando la risorsa e notando il valore nel campo URL:
Uso dell'API di Azure. Vedere Ottenere un URL per area di lavoro usando l'API di Azure.

URL di area legacy

Importante

Evitare di usare URL regionali legacy. Potrebbe non funzionare per le nuove aree di lavoro, sarà meno affidabile e offrirà prestazioni ridotte rispetto agli URL per area di lavoro.

L'URL di area legacy è costituito dall'area in cui viene distribuita l'area di lavoro di Azure Databricks più il dominio azuredatabricks.net, ad esempio https://westus.azuredatabricks.net/.

Se si accede a un URL di area legacy come https://westus.azuredatabricks.net/, il nome dell'istanza è westus.azuredatabricks.net.
L'ID dell'area di lavoro viene visualizzato nell'URL solo dopo aver eseguito l'accesso usando un URL di area legacy. Viene visualizzato dopo o=. Nell'URL https://<databricks-instance>/?o=6280049833385130, l'ID dell'area di lavoro è 6280049833385130.

ID e URL del cluster

Un cluster di Azure Databricks offre una piattaforma unificata per diversi casi d'uso, ad esempio l'esecuzione di pipeline ETL di produzione, analisi di streaming, analisi ad hoc e Machine Learning. Ogni cluster ha un ID univoco denominato ID cluster. Questo vale sia per i cluster di tutti gli scopi che per i cluster di processi. Per ottenere i dettagli di un cluster usando l'API REST, l'ID cluster è essenziale.

Per ottenere l'ID cluster, fare clic sulla scheda Cluster nella barra laterale e quindi selezionare un nome del cluster. L'ID cluster è il numero dopo il /clusters/ componente nell'URL di questa pagina

https://<databricks-instance>/#/setting/clusters/<cluster-id>

Nello screenshot seguente l'ID cluster è 0831-211914-clean632.

URL cluster

URL e ID del dashboard

Un dashboard di intelligenza artificiale/BI è una presentazione di visualizzazioni e commenti dei dati. Ogni dashboard ha un ID univoco. È possibile usare questo ID per costruire collegamenti diretti che includono i valori di filtro e parametro preimpostati oppure accedere al dashboard usando l'API REST.

URL del dashboard di esempio:

https://adb-62800498333851.30.azuredatabricks.net/sql/dashboardsv3/01ef9214fcc7112984a50575bf2b460f

ID dashboard di esempio: 01ef9214fcc7112984a50575bf2b460f

ID e URL del notebook

Un notebook è un'interfaccia basata sul web per un documento che contiene codice eseguibile, visualizzazioni e testo descrittivo. I notebook sono un'interfaccia per interagire con Azure Databricks. Ogni notebook ha un ID univoco. L'URL del notebook ha l'ID del notebook, quindi l'URL del notebook è univoco per un notebook. Può essere condiviso con chiunque nella piattaforma Azure Databricks con l'autorizzazione per visualizzare e modificare il notebook. Inoltre, ogni comando notebook (cella) ha un URL diverso.

Per trovare un URL o un ID del notebook, aprire un notebook. Per trovare un URL di cella, fare clic sul contenuto del comando.

URL di notebook di esempio:

https://adb-62800498333851.30.azuredatabricks.net/?o=6280049833385130#notebook/1940481404050342`

ID di notebook di esempio: 1940481404050342.

URL del comando di esempio (cella):

https://adb-62800498333851.30.azuredatabricks.net/?o=6280049833385130#notebook/1940481404050342/command/2432220274659491

ID cartella

Una cartella è una directory usata per archiviare i file che possono essere usati nell'area di lavoro di Azure Databricks. Questi file possono essere notebook, librerie o sottocartelle. È presente un ID specifico associato a ogni cartella e a ogni singola sottocartella. L'API Autorizzazioni fa riferimento a questo ID come directory_id e viene usato per impostare e aggiornare le autorizzazioni per una cartella.

Per recuperare il directory_id , usare l'API dell'area di lavoro:

curl -n -X GET -H 'Content-Type: application/json' -d '{"path": "/Users/me@example.com/MyFolder"}' \
https://<databricks-instance>/api/2.0/workspace/get-status

Di seguito è riportato un esempio della risposta di chiamata API:

{
  "object_type": "DIRECTORY",
  "path": "/Users/me@example.com/MyFolder",
  "object_id": 123456789012345
}

Model ID

Un modello fa riferimento a un modello registrato MLflow, che consente di gestire i modelli MLflow nell'ambiente di produzione tramite transizioni di fase e controllo delle versioni. L'ID modello registrato è necessario per modificare le autorizzazioni per il modello a livello di codice tramite l’API Autorizzazioni.

Per ottenere l'ID di un modello registrato, è possibile usare l'endpoint mlflow/databricks/registered-models/getdell'API dell'area di lavoro . Ad esempio, il codice seguente restituisce l'oggetto modello registrato con le relative proprietà, incluso il relativo ID:

curl -n -X GET -H 'Content-Type: application/json' -d '{"name": "model_name"}' \
https://<databricks-instance>/api/2.0/mlflow/databricks/registered-models/get

Il valore restituito ha il formato:

{
  "registered_model_databricks": {
    "name":"model_name",
    "id":"ceb0477eba94418e973f170e626f4471"
  }
}

ID e URL del processo

Un processo è un modo per eseguire un notebook o un file JAR immediatamente o in base a una pianificazione.

Per ottenere un URL di processo, fare clic su Flussi di lavoro nella barra laterale e fare clic su un nome di processo. L'ID processo è dopo il testo #job/ nell'URL. L'URL del processo è necessario per risolvere la causa radice delle esecuzioni del processo non riuscite.

Nello screenshot seguente l'URL è:

https://westus.azuredatabricks.net/?o=6280049833385130#job/1

In questo esempio, l'ID è 1.

URL del processo

Condividi tramite