Collegare un notebook alle risorse di calcolo
Questo articolo illustra le opzioni per le risorse di calcolo dei notebook. È possibile eseguire un notebook in un cluster Databricks, un calcolo serverless o, per i comandi SQL, è possibile usare un SQL warehouse, un tipo di calcolo ottimizzato per l'analisi SQL.
Elaborazione serverless per notebook
L'ambiente di calcolo serverless consente di connettere rapidamente il notebook alle risorse di calcolo su richiesta.
Per connettersi al calcolo serverless, fare clic sul menu a discesa Connetti nel notebook e selezionare Serverless.
Per altre informazioni, vedere Calcolo serverless per notebook .
Collegare un notebook a un cluster
Per collegare un notebook a un cluster, è necessaria l'autorizzazione CAN ATTACH TO a livello di cluster.
Importante
Se un notebook è collegato a un cluster, qualsiasi utente con l'autorizzazione CAN RUN per il notebook dispone dell'autorizzazione implicita per accedere al cluster.
Per collegare un notebook a un cluster, fare clic sul selettore di calcolo nella barra degli strumenti del notebook e selezionare un cluster dal menu a discesa.
Il menu mostra una selezione di cluster usati di recente o attualmente in esecuzione.
Per selezionare tutti i cluster disponibili, fare clic su Altro. Fare clic sul nome del cluster per visualizzare un menu a discesa e selezionare un cluster esistente.
È anche possibile creare un nuovo cluster selezionando Crea nuova risorsa dal menu a discesa.
Importante
Per un notebook collegato sono definite le variabili Apache Spark seguenti.
Classe | Nome variabile |
---|---|
SparkContext |
sc |
SQLContext /HiveContext |
sqlContext |
SparkSession (Spark 2.x) |
spark |
Non creare un SparkSession
oggetto , SparkContext
o SQLContext
. In questo modo si verifica un comportamento incoerente.
Usare un notebook con una warehouse SQL
Quando un notebook è collegato a un'istanza di SQL Warehouse, è possibile eseguire celle SQL e Markdown. L'esecuzione di una cella in qualsiasi altro linguaggio, ad esempio Python o R, genera un errore. Le celle SQL eseguite in un'istanza di SQL Warehouse vengono visualizzate nella cronologia delle query di SQL Warehouse. L'utente che ha eseguito una query può visualizzare il profilo di query dal notebook facendo clic sul tempo trascorso nella parte inferiore dell'output.
L'esecuzione di un notebook richiede un'istanza di SQL Warehouse pro o serverless. È necessario avere accesso all'area di lavoro e al warehouse SQL.
Per collegare un notebook a un'istanza di SQL Warehouse , eseguire le operazioni seguenti:
Fare clic sul selettore di calcolo nella barra degli strumenti del notebook. Il menu a discesa mostra le risorse di calcolo attualmente in esecuzione o usate di recente. I warehouse SQL sono contrassegnati con .
Dal menu selezionare un'istanza di SQL Warehouse.
Per visualizzare tutti i warehouse SQL disponibili, selezionare Altro... dal menu a discesa. Viene visualizzata una finestra di dialogo che mostra le risorse di calcolo disponibili per il notebook. Selezionare SQL Warehouse, scegliere il warehouse da usare e fare clic su Connetti.
È anche possibile selezionare un'istanza di SQL Warehouse come risorsa di calcolo per un notebook SQL quando si crea un flusso di lavoro o un processo pianificato.
Limitazioni delle warehouse SQL
Per altre informazioni, vedi Limitazioni note per notebook Databricks.
Rimuovere un notebook
Per scollegare un notebook da una risorsa di calcolo, fare clic sul selettore di calcolo nella barra degli strumenti del notebook e passare il puntatore del mouse sul cluster collegato o sql warehouse nell'elenco per visualizzare un menu laterale. Nel menu laterale, scegliere Scollegare.
È anche possibile scollegare i notebook da un cluster usando la scheda Notebooks nella pagina dei dettagli del cluster.
Suggerimento
È consigliabile rimuovere i notebook inutilizzati dai cluster. In questo modo si libera spazio di memoria sul driver.