Použití editoru Visual Studio Code s Databricks Connect pro Python
Poznámka:
Tento článek popisuje Databricks Connect pro Databricks Runtime 13.3 LTS a vyšší.
Tento článek popisuje, jak používat Databricks Connect pro Python se sadou Visual Studio Code. Databricks Connect umožňuje připojit k clusterům Azure Databricks oblíbené prostředí IDEs, servery poznámkových bloků a další vlastní aplikace. Podívejte se, co je Databricks Connect? Informace o verzi Scala tohoto článku najdete v tématu Použití editoru Visual Studio Code s Databricks Connect pro Scala.
Poznámka:
Než začnete používat Databricks Connect, musíte nastavit klienta Databricks Connect.
Tip
Rozšíření Databricks pro Visual Studio Code už má integrovanou podporu databricks Connect pro Databricks Runtime 13.3 LTS a vyšší. Viz Ladění kódu pomocí Databricks Connect pro rozšíření Databricks pro Visual Studio Code.
Pokud chcete používat Databricks Connect se sadou Visual Studio Code a Pythonem, postupujte podle těchto pokynů.
Spusťte Visual Studio Code.
Otevřete složku, která obsahuje vaše virtuální prostředí Pythonu (Soubor > otevřít složku).
V terminálu editoru Visual Studio Code (terminál zobrazení>) aktivujte virtuální prostředí.
Nastavte aktuální interpret Pythonu tak, aby byl odkazovaný z virtuálního prostředí:
- Na paletě příkazů (>zobrazit paletu příkazů) zadejte
Python: Select Interpreter
a stiskněte Enter. - Vyberte cestu k interpretu Pythonu, na který odkazuje virtuální prostředí.
- Na paletě příkazů (>zobrazit paletu příkazů) zadejte
Přidejte do složky soubor kódu Pythonu (
.py
), který obsahuje ukázkový kód nebo vlastní kód. Pokud používáte vlastní kód, musíte minimálně inicializovatDatabricksSession
, jak je znázorněno v ukázkovém kódu.Chcete-li spustit kód, klepněte na tlačítko Spustit > bez ladění v hlavní nabídce. Veškerý kód Pythonu běží místně, zatímco veškerý kód PySpark zahrnující operace datového rámce běží v clusteru ve vzdáleném pracovním prostoru Azure Databricks a odpovědi na spuštění se odešlou zpět do místního volajícího.
Ladění kódu:
- Když máte otevřený soubor kódu Pythonu, nastavte všechny zarážky, u kterých chcete, aby se kód při spuštění pozastavil.
- Klikněte na ikonu Spustit a Ladit na bočním panelu nebo v hlavní nabídce klikněte na Zobrazit > spustit.
- V zobrazení Spustit a Ladit klikněte na tlačítko Spustit a Ladit.
- Postupujte podle pokynů na obrazovce a začněte kód spouštět a ladit.
Veškerý kód Pythonu je laděný místně, zatímco veškerý kód PySpark se bude dál spouštět v clusteru ve vzdáleném pracovním prostoru Azure Databricks. Základní kód modulu Spark nelze ladit přímo z klienta.
Konkrétnější pokyny ke spuštění a ladění najdete v tématu Konfigurace a spuštění ladicího programu a ladění Pythonu ve VS Code.