Sdílet prostřednictvím


Použití editoru Visual Studio Code s Databricks Connect pro Python

Poznámka:

Tento článek popisuje Databricks Connect pro Databricks Runtime 13.3 LTS a vyšší.

Tento článek popisuje, jak používat Databricks Connect pro Python se sadou Visual Studio Code. Databricks Connect umožňuje připojit k clusterům Azure Databricks oblíbené prostředí IDEs, servery poznámkových bloků a další vlastní aplikace. Podívejte se, co je Databricks Connect? Informace o verzi Scala tohoto článku najdete v tématu Použití editoru Visual Studio Code s Databricks Connect pro Scala.

Poznámka:

Než začnete používat Databricks Connect, musíte nastavit klienta Databricks Connect.

Tip

Rozšíření Databricks pro Visual Studio Code už má integrovanou podporu databricks Connect pro Databricks Runtime 13.3 LTS a vyšší. Viz Ladění kódu pomocí Databricks Connect pro rozšíření Databricks pro Visual Studio Code.

Pokud chcete používat Databricks Connect se sadou Visual Studio Code a Pythonem, postupujte podle těchto pokynů.

  1. Spusťte Visual Studio Code.

  2. Otevřete složku, která obsahuje vaše virtuální prostředí Pythonu (Soubor > otevřít složku).

  3. V terminálu editoru Visual Studio Code (terminál zobrazení>) aktivujte virtuální prostředí.

  4. Nastavte aktuální interpret Pythonu tak, aby byl odkazovaný z virtuálního prostředí:

    1. Na paletě příkazů (>zobrazit paletu příkazů) zadejte Python: Select Interpretera stiskněte Enter.
    2. Vyberte cestu k interpretu Pythonu, na který odkazuje virtuální prostředí.
  5. Přidejte do složky soubor kódu Pythonu (.py), který obsahuje ukázkový kód nebo vlastní kód. Pokud používáte vlastní kód, musíte minimálně inicializovat DatabricksSession , jak je znázorněno v ukázkovém kódu.

  6. Chcete-li spustit kód, klepněte na tlačítko Spustit > bez ladění v hlavní nabídce. Veškerý kód Pythonu běží místně, zatímco veškerý kód PySpark zahrnující operace datového rámce běží v clusteru ve vzdáleném pracovním prostoru Azure Databricks a odpovědi na spuštění se odešlou zpět do místního volajícího.

  7. Ladění kódu:

    1. Když máte otevřený soubor kódu Pythonu, nastavte všechny zarážky, u kterých chcete, aby se kód při spuštění pozastavil.
    2. Klikněte na ikonu Spustit a Ladit na bočním panelu nebo v hlavní nabídce klikněte na Zobrazit > spustit.
    3. V zobrazení Spustit a Ladit klikněte na tlačítko Spustit a Ladit.
    4. Postupujte podle pokynů na obrazovce a začněte kód spouštět a ladit.

    Veškerý kód Pythonu je laděný místně, zatímco veškerý kód PySpark se bude dál spouštět v clusteru ve vzdáleném pracovním prostoru Azure Databricks. Základní kód modulu Spark nelze ladit přímo z klienta.

Konkrétnější pokyny ke spuštění a ladění najdete v tématu Konfigurace a spuštění ladicího programu a ladění Pythonu ve VS Code.