Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Il terminale Web di Azure Databricks offre un modo pratico e altamente interattivo per eseguire comandi della shell in un'interfaccia della riga di comando (CLI), inclusi i comandi dell'interfaccia della riga di comando di Databricks, per eseguire azioni sugli oggetti Databricks a livello di codice. È particolarmente utile per i casi d'uso avanzati, ad esempio le operazioni batch su più file, che le interfacce utente esistenti potrebbero non supportare completamente.
Più utenti possono usare il terminale Web in un unico ambiente di calcolo.
È possibile usare il terminale Web per eseguire le operazioni seguenti:
- Apportare modifiche rapide ai file usando Vim o Emacs.
- Monitorare l'utilizzo delle risorse con comandi come
htop(utilizzo del cluster) onvidia-smi(utilizzo GPU). - Eseguire script Python che non usano Spark.
- Eseguire operazioni di file con comandi della shell,
mvad esempio emkdir. - Installare e gestire le librerie sul sistema di calcolo.
- Usare l'interfaccia della riga di comando di Databricks per automatizzare vari aspetti di Azure Databricks.
Requisiti
Avviso
Azure Databricks gestisce il proxy per il servizio terminale web dalla porta 7681 sul driver Spark di calcolo. Questo proxy Web è destinato all'uso solo con il terminale Web. Se la porta viene occupata all'avvio del calcolo o si verifica un conflitto, il terminale Web potrebbe non funzionare come previsto. Se vengono avviati altri servizi Web sulla porta 7681, gli utenti di calcolo potrebbero essere esposti a potenziali exploit di sicurezza. Né Databricks né Microsoft sono responsabili di eventuali problemi derivanti dall'installazione di software non supportato in un ambiente di calcolo.
- Il terminale Web è disabilitato per impostazione predefinita per tutti gli utenti dell'area di lavoro. Per abilitarla, vedere Abilitare il terminale Web.
- AUTORIZZAZIONE CAN ATTACH TO per un ambiente di calcolo.
- Per usare il terminale Web con la modalità di accesso standard (in precedenza modalità di accesso condiviso), il calcolo deve trovarsi in Databricks Runtime 15.1 o versione successiva.
Avviare il terminale Web
È possibile avviare il terminale Web dalla pagina dei dettagli di calcolo o da un notebook.
Da un computer portatile
Per avviare il terminale Web da un notebook:
- Connettere il notebook al calcolo.
- Nella parte inferiore della barra laterale destra del notebook fare clic sull'icona del terminale
avviare il terminale Web.
- In alternativa, fare clic sull'elenco a discesa del calcolo collegato, passare il puntatore del mouse sul calcolo collegato, quindi fare clic su Web Terminale.
Il terminale Web viene aperto in un pannello nella parte inferiore della schermata. I pulsanti in alto a destra del pannello consentono di:
-
Aprire una nuova sessione del terminale in una nuova scheda.
-
Ricaricare una sessione del terminale.
-
Chiudere il pannello inferiore. Per riaprire il pannello, fare clic
parte inferiore della barra laterale destra.
Dalla pagina dei dettagli di calcolo
Per avviare il terminale Web dalla pagina dei dettagli di calcolo:
- Nella barra laterale dell'area di lavoro fare clic su Calcolo.
- Nella scheda Calcolo generico, fare clic sul nome del calcolo.
- Fare clic su Start per avviare il calcolo.
- Nella scheda App fare clic su Terminale Web.
Viene visualizzata una nuova scheda con l'interfaccia utente del terminale Web e il prompt di Bash.
Usare il terminale Web
Nel terminale Web è possibile eseguire comandi dalla radice all'interno del contenitore del nodo del driver di calcolo.
Ogni utente può avere fino a 100 sessioni del terminale Web attive (schede) aperte. Le sessioni inattive del terminale web potrebbero scadere e l'applicazione web del terminale si riconnetterà, avviando un nuovo processo della shell. Se si vuole mantenere la sessione Bash, Databricks consiglia di usare tmux.
Eseguire i comandi della CLI di Databricks
È anche possibile usare il terminale Web per eseguire i comandi dell'interfaccia della riga di comando di Databricks. L'interfaccia della riga di comando disponibile è sempre la versione più recente e l'autenticazione si basa sull'utente corrente.
Annotazioni
I comandi del profilo di configurazione non sono supportati quando si eseguono comandi dell'interfaccia della riga di comando nel terminale Web. Questo perché il terminale Web usa le variabili di ambiente per l'autenticazione nell'interfaccia della riga di comando, che precede i profili di configurazione nell'ordine di autenticazione di valutazione.
Il calcolo deve soddisfare i requisiti seguenti:
- Databricks Runtime 15.0 o versione successiva
- L'area di lavoro non deve essere abilitata per il collegamento privato
Avviare il terminale Web ed eseguire il comando seguente per restituire informazioni sull'utente corrente:
databricks current-user me
Sono disponibili anche i comandi bundle, che consentono di creare e gestire i bundle di asset di Databricks direttamente dal terminale Web all'interno dell'area di lavoro databricks. Ad esempio, per creare, distribuire ed eseguire un bundle semplice usando il modello predefinito:
Dalla radice del terminale Web passare alla home page dell'area di lavoro ed eseguire
bundle init:cd /Workspace/Users/someone@example.com databricks bundle initAccettare le richieste del modello predefinito, quindi passare alla directory del bundle e distribuirla:
cd my_project databricks bundle deployÈ possibile visualizzare il bundle distribuito
my_projectnell'interfaccia utente dell'area di lavoro di Databricks.Eseguire infine il processo predefinito nel bundle:
databricks bundle run my_project_jobPassare a Esecuzione dei processi per visualizzare il processo in esecuzione.
Configurare il terminale Web
È possibile impostare configurazioni persistenti per il terminale Web usando i file di configurazione bashrc.
Databricks carica automaticamente i file denominati .bashrc dalla cartella home del file system dell'area di lavoro. Le impostazioni di questi file vengono attivate automaticamente ogni volta che si avvia una nuova sessione del terminale.
Se desideri importare altri file (come .zshrc) per l'utilizzo del terminale web, importali dal tuo file .bashrc per mantenere la configurazione.
Salvare tutti i file di configurazione nella cartella dell'area di lavoro in cui è possibile configurarli usando un editor di testo.
Limiti
Azure Databricks non supporta l'esecuzione di processi Spark dal terminale Web.
Il terminale Web di Azure Databricks non è disponibile nei tipi di calcolo seguenti:
- Calcolo dei processi
- Calcolo avviato con il set di variabili di ambiente
DISABLE_WEB_TERMINAL=true. - Calcolo standard in Databricks Runtime versione precedente alla 15.1.
- Calcolo standard con tipi di istanza arm in Databricks Runtime inferiore alla 16.4.
- Calcolo serverless con ambiente serverless versione 1.
- Calcolo avviato con la configurazione di Spark
spark.databricks.pyspark.enableProcessIsolationimpostata sutrue.
È previsto un limite rigido di 12 ore dal caricamento della pagina iniziale, dopo il quale qualsiasi connessione, anche se attiva, verrà terminata. È possibile aggiornare il terminale Web per riconnettersi. Databricks consiglia di usare tmux per mantenere la sessione della shell.
Le risorse di calcolo arm in Databricks Runtime inferiore alla 16.4 non possono usare terminali Web per accedere ai file dell'area di lavoro, inclusi i file nelle cartelle Git.
L'abilitazione di Docker Container Services disabilita il terminale Web.