Poznámka
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Můžete spouštět a ladit poznámkové bloky, jednu buňku najednou nebo všechny buňky najednou a zobrazit výsledky v uživatelském rozhraní editoru Visual Studio Code pomocí rozšíření Databricks pro integraci nástroje Visual Studio Code Databricks Connect. Veškerý kód běží místně, zatímco veškerý kód zahrnující operace datového rámce běží v clusteru ve vzdáleném pracovním prostoru Azure Databricks a odpovědi na spuštění se odešlou zpět místnímu volajícímu. Veškerý kód je laděný místně, zatímco veškerý kód Sparku se bude dál spouštět v clusteru ve vzdáleném pracovním prostoru Azure Databricks. Základní kód modulu Spark nelze ladit přímo z klienta.
Poznámka:
Tato funkce funguje s Databricks Runtime 13.3 a vyššími.
Pokud chcete povolit integraci Databricks Connect pro poznámkové bloky v rozšíření Databricks pro Visual Studio Code, musíte databricks Connect nainstalovat v rozšíření Databricks pro Visual Studio Code. Viz Ladění kódu pomocí Databricks Connect pro rozšíření Databricks pro Visual Studio Code.
Spustit buňky poznámkového bloku Pythonu
U poznámkových bloků s názvy souborů, které mají příponu .py
, se při otevření poznámkového bloku v integrovaném vývojovém prostředí Visual Studio Code v každé buňce zobrazí tlačítka Spustit buňku, Spustit nad a Ladit buňku. Při spuštění buňky se její výsledky zobrazí na samostatné kartě integrovaného vývojového prostředí (IDE). Při ladění se v laděné buňce zobrazují tlačítka Pokračovat, Zastavit a Krokovat . Při ladění buňky můžete použít funkce ladění editoru Visual Studio Code, jako je sledování stavů proměnných a zobrazení zásobníku volání a konzoly ladění.
Poznámkové bloky s názvy souborů, které mají .ipynb
rozšíření, obsahují při otevření poznámkového bloku v integrovaném vývojovém prostředí editoru Visual Studio Code poznámkový blok a jeho buňky další funkce. Viz Spuštění buněk a Práce s buňkami kódu v Editoru poznámkových bloků.
Další informace o formátech poznámkových bloků pro názvy souborů s příponami .py
a .ipynb
najdete v tématu Import a export poznámkových bloků Databricks.
Spusťte buňky notebooku Jupyter v Pythonu
Spuštění nebo ladění poznámkového bloku Jupyter v Pythonu (.ipynb
):
V projektu otevřete poznámkový blok Jupyter Pythonu, který chcete spustit nebo ladit. Ujistěte se, že soubor Pythonu je ve formátu poznámkového bloku Jupyter a má příponu
.ipynb
.Návod
Nový poznámkový blok Jupyter v Pythonu můžete vytvořit spuštěním >příkazu Create: New Jupyter Notebook z palety příkazů.
Klikněte na Spustit všechny buňky pro spuštění všech buněk bez ladění. Použijte Spustit buňku ke spuštění jednotlivé odpovídající buňky bez ladění, nebo Spustit po řádku pro spuštění jednotlivé buňky po řádku s omezenou možností ladění, přičemž hodnoty proměnných jsou zobrazeny na panelu Jupyter (Zobrazení > Otevřít zobrazení > Jupyter).
Chcete-li provést úplné ladění v jednotlivých buňkách, nastavte zarážky a v nabídce vedle tlačítka Spustit buňku klepněte na příkaz Ladit buňku.
Po kliknutí na některou z těchto možností se může zobrazit výzva k instalaci chybějících závislostí balíčku poznámkového bloku Jupyter v Pythonu. Kliknutím ho nainstalujte.
Další informace najdete v poznámkových blocích Jupyter v editoru VS Code.
Globální poznámkové bloky
Jsou povoleny také následující globální poznámkové bloky:
spark
, který představuje instancidatabricks.connect.DatabricksSession
, je předem nakonfigurovaný tak, aby vytvořil instanciDatabricksSession
získáním přihlašovacích údajů pro ověřování Azure Databricks z rozšíření. Pokud už jeDatabricksSession
v kódu buňky poznámkového bloku instancována, místo toho se použijí tato nastaveníDatabricksSession
. Podívejte se na příklady kódu pro Databricks Connect pro Python.udf
, předkonfigurováno jako alias propyspark.sql.functions.udf
, což je alias pro uživatelsky definované funkce v Pythonu. Viz pyspark.sql.functions.udf.sql
, předkonfigurováno jako alias prospark.sql
.spark
, jak je popsáno výše, představuje předkonfigurovanou instancidatabricks.connect.DatabricksSession
. Viz Spark SQL.dbutils
, předkonfigurován jako instance nástroje Databricks, která se importuje zdatabricks-sdk
a vytvoří instanci získáním ověřovacích údajů Azure Databricks z rozšíření. Viz Používání nástrojů Databricks.Poznámka:
Podpora pro poznámkové bloky s Databricks Connect zahrnuje jen podmnožinu nástrojů Databricks.
Pokud chcete povolit
dbutils.widgets
, musíte nejprve nainstalovat sadu Databricks SDK pro Python spuštěním následujícího příkazu v terminálu místního vývojového počítače:pip install 'databricks-sdk[notebook]'
display
, předem nakonfigurovaný jako alias pro vestavěný JupyterIPython.display.display
. Vizte IPython.display.display.displayHTML
, předkonfigurováno jako alias prodbruntime.display.displayHTML
, což je alias prodisplay.HTML
zipython
. Viz IPython.display.html.
Kouzla poznámkových bloků
Jsou povoleny také následující magicky poznámkového bloku:
%fs
, což je stejné jako volánídbutils.fs
. Viz jazyky mixu.%sh
, který spustí příkaz pomocí magických příkazů%%script
na lokálním počítači. Tento příkaz se nespustí ve vzdáleném pracovním prostoru Azure Databricks. Viz jazyky mixu.%md
a%md-sandbox
, která spouští cell magic%%markdown
. Viz jazyky mixu.%sql
, který běžíspark.sql
. Viz jazyky mixu.%pip
, který běžípip install
na místním počítači. Tento proces se nespustípip install
ve vzdáleném pracovním prostoru Azure Databricks. Viz Správa knihoven pomocí%pip
příkazů.%run
, který spouští jiný poznámkový blok. Viz Orchestrace poznámkových bloků a modularizace kódu v poznámkových blocích.Poznámka:
Pokud chcete povolit
%run
, musíte nejprve nainstalovat knihovnu nbformat spuštěním následujícího příkazu v terminálu místního vývojového počítače:pip install nbformat
Mezi další funkce, které jsou povolené, patří:
- Datové rámce Sparku se převedou na datové rámce pandas, které se zobrazují ve formátu tabulky Jupyter.
Omezení
Mezi omezení spouštění buněk v poznámkových blocích v editoru Visual Studio Code patří:
- Magie poznámkových bloků
%r
a%scala
nejsou podporovány a zobrazují chybu, pokud jsou volány. Viz jazyky mixu. - Příkaz
%sql
pro notebook nepodporuje některé příkazy DML, například Zobrazit tabulky.