Ottenere gli identificatori per gli oggetti dell'area di lavoro

Questo articolo illustra come ottenere l'area di lavoro, il cluster, la directory, il modello, il notebook e gli URL e gli URL di processo in Azure Databricks.

Nomi, URL e ID dell'istanza dell'area di lavoro

Un nome di istanza univoco, noto anche come URL per area di lavoro, viene assegnato a ogni distribuzione di Azure Databricks. Si tratta del nome di dominio completo usato per accedere alla distribuzione di Azure Databricks ed effettuare richieste API.

Un'area di lavoro di Azure Databricks è la posizione in cui viene eseguita la piattaforma Azure Databricks e in cui è possibile creare cluster Spark e pianificare i carichi di lavoro. Un'area di lavoro ha un ID univoco dell'area di lavoro numerica.

URL per area di lavoro

L'URL univoco per area di lavoro ha il formato adb-<workspace-id>.<random-number>.azuredatabricks.net. L'ID dell'area di lavoro viene visualizzato immediatamente dopo adb- e prima del punto (.). Per l'URL https://adb-5555555555555555.19.azuredatabricks.net/per area di lavoro:

  • Il nome dell'istanza è adb-5555555555555555.19.azuredatabricks.net.
  • L'ID dell'area di lavoro è 5555555555555555.

Determinare l'URL per area di lavoro

È possibile determinare l'URL per area di lavoro per l'area di lavoro:

URL di area legacy

Importante

Evitare di usare URL regionali legacy. Potrebbero non funzionare per le nuove aree di lavoro, sono meno affidabili e presentano prestazioni inferiori rispetto agli URL per area di lavoro.

L'URL di area legacy è costituito dall'area in cui viene distribuita l'area di lavoro di Azure Databricks più il dominio azuredatabricks.net, ad esempio https://westus.azuredatabricks.net/.

  • Se si accede a un URL di area legacy come https://westus.azuredatabricks.net/, il nome dell'istanza è westus.azuredatabricks.net.
  • L'ID dell'area di lavoro viene visualizzato nell'URL solo dopo aver eseguito l'accesso usando un URL di area legacy. Viene visualizzato dopo .o= Nell'URL https://<databricks-instance>/?o=6280049833385130l'ID dell'area di lavoro è 6280049833385130.

ID e URL del cluster

Un cluster di Azure Databricks offre una piattaforma unificata per diversi casi d'uso, ad esempio l'esecuzione di pipeline ETL di produzione, analisi di streaming, analisi ad hoc e Machine Learning. Ogni cluster ha un ID univoco denominato ID cluster. Questo vale sia per i cluster di tutti gli scopi che per i cluster di processi. Per ottenere i dettagli di un cluster usando l'API REST, l'ID cluster è essenziale.

Per ottenere l'ID cluster, fare clic sulla scheda Cluster nella barra laterale e quindi selezionare un nome del cluster. L'ID cluster è il numero dopo il /clusters/ componente nell'URL di questa pagina

https://<databricks-instance>/#/setting/clusters/<cluster-id>

Nello screenshot seguente l'ID cluster è 0831-211914-clean632.

Cluster URL

URL e ID del notebook

Un notebook è un'interfaccia basata sul Web per un documento che contiene codice eseguibile, visualizzazioni e testo narrativo. I notebook sono un'interfaccia per interagire con Azure Databricks. Ogni notebook ha un ID univoco. L'URL del notebook ha l'ID del notebook, quindi l'URL del notebook è univoco per un notebook. Può essere condiviso con chiunque nella piattaforma Azure Databricks con l'autorizzazione per visualizzare e modificare il notebook. Inoltre, ogni comando notebook (cella) ha un URL diverso.

Per trovare un URL o un ID del notebook, aprire un notebook. Per trovare un URL di cella, fare clic sul contenuto del comando.

  • URL del notebook di esempio:

    https://adb-62800498333851.30.azuredatabricks.net/?o=6280049833385130#notebook/1940481404050342`
    
  • ID notebook di esempio: 1940481404050342.

  • URL del comando di esempio (cella):

    https://adb-62800498333851.30.azuredatabricks.net/?o=6280049833385130#notebook/1940481404050342/command/2432220274659491
    

ID cartella

Una cartella è una directory usata per archiviare i file che possono essere usati nell'area di lavoro di Azure Databricks. Questi file possono essere notebook, librerie o sottocartelle. È presente un ID specifico associato a ogni cartella e a ogni singola sottocartella. L'API Autorizzazioni fa riferimento a questo ID come directory_id e viene usato per impostare e aggiornare le autorizzazioni per una cartella.

Per recuperare il directory_id , usare l'API dell'area di lavoro:

curl -n -X GET -H 'Content-Type: application/json' -d '{"path": "/Users/me@example.com/MyFolder"}' \
https://<databricks-instance>/api/2.0/workspace/get-status

Di seguito è riportato un esempio della risposta di chiamata API:

{
  "object_type": "DIRECTORY",
  "path": "/Users/me@example.com/MyFolder",
  "object_id": 123456789012345
}

Model ID

Un modello fa riferimento a un modello registrato MLflow, che consente di gestire i modelli MLflow nell'ambiente di produzione tramite transizioni di fase e controllo delle versioni. L'ID modello registrato è necessario per modificare le autorizzazioni per il modello a livello di codice tramite l'API Autorizzazioni.

Per ottenere l'ID di un modello registrato, è possibile usare l'endpoint mlflow/databricks/registered-models/getdell'API dell'area di lavoro . Ad esempio, il codice seguente restituisce l'oggetto modello registrato con le relative proprietà, incluso il relativo ID:

curl -n -X GET -H 'Content-Type: application/json' -d '{"name": "model_name"}' \
https://<databricks-instance>/api/2.0/mlflow/databricks/registered-models/get

Il valore restituito ha il formato:

{
  "registered_model_databricks": {
    "name":"model_name",
    "id":"ceb0477eba94418e973f170e626f4471"
  }
}

ID e URL del processo

Un processo è un modo per eseguire un notebook o un file JAR immediatamente o su base pianificata.

Per ottenere un URL di processo, fare clic su Jobs IconFlussi di lavoro nella barra laterale e fare clic su un nome di processo. L'ID processo è dopo il testo #job/ nell'URL. L'URL del processo è necessario per risolvere la causa radice delle esecuzioni del processo non riuscite.

Nello screenshot seguente l'URL del processo è:

https://westus.azuredatabricks.net/?o=6280049833385130#job/1

In questo esempio l'ID processo è 1.

Job URL