Condividi tramite


Usare Visual Studio Code con Databricks Connect per Python

Nota

Questo articolo illustra Databricks Connect per Databricks Runtime 13.3 LTS e versioni successive.

Questo articolo illustra come usare Databricks Connect per Python con Visual Studio Code. Databricks Connect consente di connettere IDE, server notebook e altre applicazioni personalizzate ai cluster Di Azure Databricks. Vedere Che cos'è Databricks Connect?. Per la versione Scala di questo articolo, vedere Usare Visual Studio Code con Databricks Connect per Scala.

Nota

Prima di iniziare a usare Databricks Connect, è necessario configurare il client Databricks Connect.

Suggerimento

L'estensione Databricks per Visual Studio Code include già il supporto predefinito per Databricks Connect per Databricks Runtime 13.3 LTS e versioni successive. Vedere Eseguire il debug del codice usando Databricks Connect per l'estensione Databricks per Visual Studio Code.

Per usare Databricks Connect with Visual Studio Code and Python (Connettersi a Visual Studio Code e Python), seguire queste istruzioni.

  1. Avviare Visual Studio Code.

  2. Aprire la cartella che contiene l'ambiente virtuale Python (File > Open Folder).

  3. Nel terminale di Visual Studio Code (Visualizza > terminale) attivare l'ambiente virtuale.

  4. Impostare l'interprete Python corrente come quello a cui si fa riferimento dall'ambiente virtuale:

    1. Nel riquadro comandi (visualizza riquadro comandi) digitare Python: Select Interpretere quindi premere INVIO>.
    2. Selezionare il percorso dell'interprete Python a cui si fa riferimento dall'ambiente virtuale.
  5. Aggiungere alla cartella un file di codice Python (.py) che contiene il codice di esempio o il proprio codice. Se si usa il proprio codice, è necessario inizializzare DatabricksSession almeno come illustrato nel codice di esempio.

  6. Per eseguire il codice, fare clic su Esegui > senza eseguire debug dal menu principale. Tutto il codice Python viene eseguito localmente, mentre tutto il codice PySpark che coinvolge le operazioni del dataframe viene eseguito nel cluster nell'area di lavoro remota di Azure Databricks e le risposte di esecuzione vengono inviate al chiamante locale.

  7. Per eseguire il debug del codice:

    1. Con il file di codice Python aperto, impostare eventuali punti di interruzione in cui si vuole sospendere il codice durante l'esecuzione.
    2. Fare clic sull'icona Esegui e debug sulla barra laterale oppure fare clic su Visualizza > esegui dal menu principale.
    3. Nella visualizzazione Esegui e debug fare clic sul pulsante Esegui e debug.
    4. Seguire le istruzioni visualizzate per avviare l'esecuzione e il debug del codice.

    Tutto il codice Python viene sottoposto a debug in locale, mentre tutto il codice PySpark continua a essere eseguito nel cluster nell'area di lavoro remota di Azure Databricks. Il codice principale del motore Spark non può essere sottoposto a debug direttamente dal client.

Per istruzioni di esecuzione e debug più specifiche, vedere Configurare ed eseguire il debug del debugger e Python in VS Code.