Ottenere gli identificatori per gli oggetti dell'area di lavoro
Questo articolo illustra come ottenere l'area di lavoro, il cluster, il dashboard, la directory, il modello, il notebook e gli URL e gli URL di processo in Azure Databricks.
URL, ID e nomi di istanza dell'area di lavoro
Un nome di istanza univoco, noto anche come URL per area di lavoro, viene assegnato a ogni distribuzione di Azure Databricks. Si tratta del nome di dominio completo usato per accedere alla distribuzione di Azure Databricks ed effettuare richieste API.
Un area di lavoro di Azure Databricks è la posizione in cui viene eseguita la piattaforma Azure Databricks e in cui è possibile creare cluster Spark e pianificare i carichi di lavoro. Un'area di lavoro ha un ID univoco dell'area di lavoro numerica.
URL per area di lavoro
Questo URL di singole aree di lavoro ha il formato seguente adb-<workspace-id>.<random-number>.azuredatabricks.net
. L'ID dell'area di lavoro viene visualizzato immediatamente dopo adb-
e prima del “punto” (.). Per l'URL per area di lavoro https://adb-5555555555555555.19.azuredatabricks.net/
:
- Il nome dell'istanza è
adb-5555555555555555.19.azuredatabricks.net
. - L’ID dell’area di lavoro è
5555555555555555
.
Determinare l'URL per area di lavoro
È possibile determinare l'URL per area di lavoro:
Nel browser al momento dell'accesso:
Nel portale di Azure, selezionando la risorsa e notando il valore nel campo URL:
Uso dell'API di Azure. Vedere Ottenere un URL per area di lavoro usando l'API di Azure.
URL di area legacy
Importante
Evitare di usare URL regionali legacy. Potrebbe non funzionare per le nuove aree di lavoro, sarà meno affidabile e offrirà prestazioni ridotte rispetto agli URL per area di lavoro.
L'URL di area legacy è costituito dall'area in cui viene distribuita l'area di lavoro di Azure Databricks più il dominio azuredatabricks.net
, ad esempio https://westus.azuredatabricks.net/
.
- Se si accede a un URL di area legacy come
https://westus.azuredatabricks.net/
, il nome dell'istanza èwestus.azuredatabricks.net
. - L'ID dell'area di lavoro viene visualizzato nell'URL solo dopo aver eseguito l'accesso usando un URL di area legacy. Viene visualizzato dopo
o=
. Nell'URLhttps://<databricks-instance>/?o=6280049833385130
, l'ID dell'area di lavoro è6280049833385130
.
ID e URL del cluster
Un cluster di Azure Databricks offre una piattaforma unificata per diversi casi d'uso, ad esempio l'esecuzione di pipeline ETL di produzione, analisi di streaming, analisi ad hoc e Machine Learning. Ogni cluster ha un ID univoco denominato ID cluster. Questo vale sia per i cluster di tutti gli scopi che per i cluster di processi. Per ottenere i dettagli di un cluster usando l'API REST, l'ID cluster è essenziale.
Per ottenere l'ID cluster, fare clic sulla scheda Cluster nella barra laterale e quindi selezionare un nome del cluster. L'ID cluster è il numero dopo il /clusters/
componente nell'URL di questa pagina
https://<databricks-instance>/#/setting/clusters/<cluster-id>
Nello screenshot seguente l'ID cluster è 0831-211914-clean632
.
URL e ID del dashboard
Un dashboard di intelligenza artificiale/BI è una presentazione di visualizzazioni e commenti dei dati. Ogni dashboard ha un ID univoco. È possibile usare questo ID per costruire collegamenti diretti che includono i valori di filtro e parametro preimpostati oppure accedere al dashboard usando l'API REST.
URL del dashboard di esempio:
https://adb-62800498333851.30.azuredatabricks.net/sql/dashboardsv3/01ef9214fcc7112984a50575bf2b460f
ID dashboard di esempio:
01ef9214fcc7112984a50575bf2b460f
ID e URL del notebook
Un notebook è un'interfaccia basata sul web per un documento che contiene codice eseguibile, visualizzazioni e testo descrittivo. I notebook sono un'interfaccia per interagire con Azure Databricks. Ogni notebook ha un ID univoco. L'URL del notebook ha l'ID del notebook, quindi l'URL del notebook è univoco per un notebook. Può essere condiviso con chiunque nella piattaforma Azure Databricks con l'autorizzazione per visualizzare e modificare il notebook. Inoltre, ogni comando notebook (cella) ha un URL diverso.
Per trovare un URL o un ID del notebook, aprire un notebook. Per trovare un URL di cella, fare clic sul contenuto del comando.
URL di notebook di esempio:
https://adb-62800498333851.30.azuredatabricks.net/?o=6280049833385130#notebook/1940481404050342`
ID di notebook di esempio:
1940481404050342
.URL del comando di esempio (cella):
https://adb-62800498333851.30.azuredatabricks.net/?o=6280049833385130#notebook/1940481404050342/command/2432220274659491
ID cartella
Una cartella è una directory usata per archiviare i file che possono essere usati nell'area di lavoro di Azure Databricks. Questi file possono essere notebook, librerie o sottocartelle. È presente un ID specifico associato a ogni cartella e a ogni singola sottocartella. L'API Autorizzazioni fa riferimento a questo ID come directory_id e viene usato per impostare e aggiornare le autorizzazioni per una cartella.
Per recuperare il directory_id , usare l'API dell'area di lavoro:
curl -n -X GET -H 'Content-Type: application/json' -d '{"path": "/Users/me@example.com/MyFolder"}' \
https://<databricks-instance>/api/2.0/workspace/get-status
Di seguito è riportato un esempio della risposta di chiamata API:
{
"object_type": "DIRECTORY",
"path": "/Users/me@example.com/MyFolder",
"object_id": 123456789012345
}
Model ID
Un modello fa riferimento a un modello registrato MLflow, che consente di gestire i modelli MLflow nell'ambiente di produzione tramite transizioni di fase e controllo delle versioni. L'ID modello registrato è necessario per modificare le autorizzazioni per il modello a livello di codice tramite l’API Autorizzazioni.
Per ottenere l'ID di un modello registrato, è possibile usare l'endpoint mlflow/databricks/registered-models/get
dell'API dell'area di lavoro . Ad esempio, il codice seguente restituisce l'oggetto modello registrato con le relative proprietà, incluso il relativo ID:
curl -n -X GET -H 'Content-Type: application/json' -d '{"name": "model_name"}' \
https://<databricks-instance>/api/2.0/mlflow/databricks/registered-models/get
Il valore restituito ha il formato:
{
"registered_model_databricks": {
"name":"model_name",
"id":"ceb0477eba94418e973f170e626f4471"
}
}
ID e URL del processo
Un processo è un modo per eseguire un notebook o un file JAR immediatamente o in base a una pianificazione.
Per ottenere un URL di processo, fare clic su Flussi di lavoro nella barra laterale e fare clic su un nome di processo. L'ID processo è dopo il testo #job/
nell'URL. L'URL del processo è necessario per risolvere la causa radice delle esecuzioni del processo non riuscite.
Nello screenshot seguente l'URL è:
https://westus.azuredatabricks.net/?o=6280049833385130#job/1
In questo esempio, l'ID è 1
.