Dela via


Använda JupyterLab med Databricks Connect för Python

Kommentar

Den här artikeln beskriver Databricks Connect för Databricks Runtime 13.3 LTS och senare.

Den här artikeln beskriver hur du använder Databricks Connect för Python med JupyterLab. Med Databricks Connect kan du ansluta populära notebook-servrar, IDE:er och andra anpassade program till Azure Databricks-kluster. Se Vad är Databricks Connect?.

Kommentar

Innan du börjar använda Databricks Connect måste du konfigurera Databricks Connect-klienten.

Följ dessa instruktioner om du vill använda Databricks Connect med JupyterLab och Python.

  1. Om du vill installera JupyterLab, med din virtuella Python-miljö aktiverad, kör du följande kommando från terminalen eller kommandotolken:

    pip3 install jupyterlab
    
  2. Starta JupyterLab i webbläsaren genom att köra följande kommando från den aktiverade virtuella Python-miljön:

    jupyter lab
    

    Om JupyterLab inte visas i webbläsaren kopierar du url:en som börjar med localhost eller 127.0.0.1 från den virtuella miljön och anger den i webbläsarens adressfält.

  3. Skapa en ny anteckningsbok: i JupyterLab klickar du på Arkiv ny anteckningsbok på huvudmenyn, väljer Python 3 (ipykernel) och klickar på Välj. > >

  4. I anteckningsbokens första cell anger du antingen exempelkoden eller din egen kod. Om du använder din egen kod måste du åtminstone initiera DatabricksSession enligt exempelkoden.

  5. Om du vill köra anteckningsboken klickar du på Kör > kör alla celler. All kod körs lokalt, medan all kod som involverar DataFrame-åtgärder körs på klustret på den fjärranslutna Azure Databricks-arbetsytan och kör svar skickas tillbaka till den lokala anroparen.

  6. Om du vill felsöka anteckningsboken klickar du på buggikonen (Aktivera felsökningsprogram) bredvid Python 3 (ipykernel) i anteckningsbokens verktygsfält. Ange en eller flera brytpunkter och klicka sedan på Kör > kör alla celler. All kod kopplas från lokalt, medan all Spark-kod fortsätter att köras på klustret på den fjärranslutna Azure Databricks-arbetsytan. Spark-motorns kärnkod kan inte kopplas direkt från klienten.

  7. Om du vill stänga av JupyterLab klickar du på Stäng av fil>. Om JupyterLab-processen fortfarande körs i terminalen eller kommandotolken stoppar du den här processen genom att trycka på Ctrl + c och sedan ange y för att bekräfta.

Mer specifika felsökningsinstruktioner finns i Felsökningsprogram.