Dela via


Använda Visual Studio Code med Databricks Connect för Python

Kommentar

Den här artikeln beskriver Databricks Connect för Databricks Runtime 13.3 LTS och senare.

Den här artikeln beskriver hur du använder Databricks Connect för Python med Visual Studio Code. Med Databricks Connect kan du ansluta populära IDE:er, notebook-servrar och andra anpassade program till Azure Databricks-kluster. Se Vad är Databricks Connect?. Scala-versionen av den här artikeln finns i Använda Visual Studio Code med Databricks Connect för Scala.

Kommentar

Innan du börjar använda Databricks Connect måste du konfigurera Databricks Connect-klienten.

Dricks

Databricks-tillägget för Visual Studio Code har redan inbyggt stöd för Databricks Connect för Databricks Runtime 13.3 LTS och senare. Se Felsöka kod med Databricks Connect för Databricks-tillägget för Visual Studio Code.

Följ dessa instruktioner om du vill använda Databricks Connect med Visual Studio Code och Python.

  1. Starta Visual Studio Code.

  2. Öppna mappen som innehåller din virtuella Python-miljö (Öppna filmapp>).

  3. Aktivera den virtuella miljön i Visual Studio Code-terminalen (visa > terminalen).

  4. Ange den aktuella Python-tolken som den som refereras från den virtuella miljön:

    1. På kommandopaletten (visa > kommandopaletten) skriver du Python: Select Interpreteroch trycker sedan på Retur.
    2. Välj sökvägen till Python-tolken som refereras från den virtuella miljön.
  5. Lägg till en Python-kodfil (.py) i mappen som innehåller antingen exempelkoden eller din egen kod. Om du använder din egen kod måste du åtminstone initiera DatabricksSession enligt exempelkoden.

  6. Om du vill köra koden klickar du på Kör > kör utan felsökning på huvudmenyn. All Python-kod körs lokalt, medan all PySpark-kod som involverar DataFrame-åtgärder körs på klustret på den fjärranslutna Azure Databricks-arbetsytan och körningssvar skickas tillbaka till den lokala anroparen.

  7. Så här felsöker du koden:

    1. När Python-kodfilen är öppen anger du eventuella brytpunkter där du vill att koden ska pausas när den körs.
    2. Klicka på ikonen Kör och felsök i sidofältet eller klicka på Visa > kör på huvudmenyn.
    3. I vyn Kör och felsök klickar du på knappen Kör och felsöka.
    4. Följ anvisningarna på skärmen för att börja köra och felsöka koden.

    All Python-kod debuggas lokalt, medan all PySpark-kod fortsätter att köras på klustret på den fjärranslutna Azure Databricks-arbetsytan. Spark-motorns kärnkod kan inte kopplas direkt från klienten.

Mer specifika instruktioner för körning och felsökning finns i Konfigurera och köra felsökningsprogrammet och Python-felsökningen i VS Code.