Spouštění a ladění buněk poznámkového bloku pomocí Databricks Connect pomocí rozšíření Databricks pro Visual Studio Code

2025-03-25

Můžete spouštět a ladit poznámkové bloky, jednu buňku najednou nebo všechny buňky najednou a zobrazit výsledky v uživatelském rozhraní editoru Visual Studio Code pomocí rozšíření Databricks pro integraci nástroje Visual Studio Code Databricks Connect. Veškerý kód běží místně, zatímco veškerý kód zahrnující operace datového rámce běží v clusteru ve vzdáleném pracovním prostoru Azure Databricks a odpovědi na spuštění se odešlou zpět místnímu volajícímu. Veškerý kód je laděný místně, zatímco veškerý kód Sparku se bude dál spouštět v clusteru ve vzdáleném pracovním prostoru Azure Databricks. Základní kód modulu Spark nelze ladit přímo z klienta.

Poznámka:

Tato funkce funguje s Databricks Runtime 13.3 a vyššími.

Pokud chcete povolit integraci Databricks Connect pro poznámkové bloky v rozšíření Databricks pro Visual Studio Code, musíte databricks Connect nainstalovat v rozšíření Databricks pro Visual Studio Code. Viz Ladění kódu pomocí Databricks Connect pro rozšíření Databricks pro Visual Studio Code.

Spustit buňky poznámkového bloku Pythonu

U poznámkových bloků s názvy souborů, které mají příponu .py, se při otevření poznámkového bloku v integrovaném vývojovém prostředí Visual Studio Code v každé buňce zobrazí tlačítka Spustit buňku, Spustit nad a Ladit buňku. Při spuštění buňky se její výsledky zobrazí na samostatné kartě integrovaného vývojového prostředí (IDE). Při ladění se v laděné buňce zobrazují tlačítka Pokračovat, Zastavit a Krokovat . Při ladění buňky můžete použít funkce ladění editoru Visual Studio Code, jako je sledování stavů proměnných a zobrazení zásobníku volání a konzoly ladění.

Poznámkové bloky s názvy souborů, které mají .ipynb rozšíření, obsahují při otevření poznámkového bloku v integrovaném vývojovém prostředí editoru Visual Studio Code poznámkový blok a jeho buňky další funkce. Viz Spuštění buněk a Práce s buňkami kódu v Editoru poznámkových bloků.

Další informace o formátech poznámkových bloků pro názvy souborů s příponami .py a .ipynb najdete v tématu Import a export poznámkových bloků Databricks.

Spusťte buňky notebooku Jupyter v Pythonu

Spuštění nebo ladění poznámkového bloku Jupyter v Pythonu (.ipynb):

V projektu otevřete poznámkový blok Jupyter Pythonu, který chcete spustit nebo ladit. Ujistěte se, že soubor Pythonu je ve formátu poznámkového bloku Jupyter a má příponu .ipynb.

Návod

Nový poznámkový blok Jupyter v Pythonu můžete vytvořit spuštěním >příkazu Create: New Jupyter Notebook z palety příkazů.
Klikněte na Spustit všechny buňky pro spuštění všech buněk bez ladění. Použijte Spustit buňku ke spuštění jednotlivé odpovídající buňky bez ladění, nebo Spustit po řádku pro spuštění jednotlivé buňky po řádku s omezenou možností ladění, přičemž hodnoty proměnných jsou zobrazeny na panelu Jupyter (Zobrazení > Otevřít zobrazení > Jupyter).

Chcete-li provést úplné ladění v jednotlivých buňkách, nastavte zarážky a v nabídce vedle tlačítka Spustit buňku klepněte na příkaz Ladit buňku.

Po kliknutí na některou z těchto možností se může zobrazit výzva k instalaci chybějících závislostí balíčku poznámkového bloku Jupyter v Pythonu. Kliknutím ho nainstalujte.

Další informace najdete v poznámkových blocích Jupyter v editoru VS Code.

Globální poznámkové bloky

Jsou povoleny také následující globální poznámkové bloky:

spark, který představuje instanci databricks.connect.DatabricksSession, je předem nakonfigurovaný tak, aby vytvořil instanci DatabricksSession získáním přihlašovacích údajů pro ověřování Azure Databricks z rozšíření. Pokud už je DatabricksSession v kódu buňky poznámkového bloku instancována, místo toho se použijí tato nastavení DatabricksSession. Podívejte se na příklady kódu pro Databricks Connect pro Python.
udf, předkonfigurováno jako alias pro pyspark.sql.functions.udf, což je alias pro uživatelsky definované funkce v Pythonu. Viz pyspark.sql.functions.udf.
sql, předkonfigurováno jako alias pro spark.sql. spark, jak je popsáno výše, představuje předkonfigurovanou instanci databricks.connect.DatabricksSession. Viz Spark SQL.
dbutils, předkonfigurován jako instance nástroje Databricks, která se importuje z databricks-sdk a vytvoří instanci získáním ověřovacích údajů Azure Databricks z rozšíření. Viz Používání nástrojů Databricks.
Poznámka:

Podpora pro poznámkové bloky s Databricks Connect zahrnuje jen podmnožinu nástrojů Databricks.

Pokud chcete povolit dbutils.widgets, musíte nejprve nainstalovat sadu Databricks SDK pro Python spuštěním následujícího příkazu v terminálu místního vývojového počítače:
```
pip install 'databricks-sdk[notebook]'
```
display, předem nakonfigurovaný jako alias pro vestavěný Jupyter IPython.display.display. Vizte IPython.display.display.
displayHTML, předkonfigurováno jako alias pro dbruntime.display.displayHTML, což je alias pro display.HTML z ipython. Viz IPython.display.html.

Kouzla poznámkových bloků

Jsou povoleny také následující magicky poznámkového bloku:

%fs, což je stejné jako volání dbutils.fs . Viz jazyky mixu.
%sh, který spustí příkaz pomocí magických příkazů %%script na lokálním počítači. Tento příkaz se nespustí ve vzdáleném pracovním prostoru Azure Databricks. Viz jazyky mixu.
%md a %md-sandbox, která spouští cell magic %%markdown. Viz jazyky mixu.
%sql, který běží spark.sql. Viz jazyky mixu.
%pip, který běží pip install na místním počítači. Tento proces se nespustí pip install ve vzdáleném pracovním prostoru Azure Databricks. Viz Správa knihoven pomocí %pip příkazů.
%run, který spouští jiný poznámkový blok. Viz Orchestrace poznámkových bloků a modularizace kódu v poznámkových blocích.
Poznámka:

Pokud chcete povolit %run, musíte nejprve nainstalovat knihovnu nbformat spuštěním následujícího příkazu v terminálu místního vývojového počítače:
```
pip install nbformat
```

Mezi další funkce, které jsou povolené, patří:

Datové rámce Sparku se převedou na datové rámce pandas, které se zobrazují ve formátu tabulky Jupyter.

Omezení

Mezi omezení spouštění buněk v poznámkových blocích v editoru Visual Studio Code patří:

Magie poznámkových bloků %r a %scala nejsou podporovány a zobrazují chybu, pokud jsou volány. Viz jazyky mixu.
Příkaz %sql pro notebook nepodporuje některé příkazy DML, například Zobrazit tabulky.