Sdílet prostřednictvím


Vyvíjejte pipeline kód ve svém místním vývojovém prostředí

Zdrojový kód kanálu Pythonu můžete vytvořit ve svém upřednostňovaném integrovaném vývojovém prostředí (IDE).

Aktualizace kódu kanálu napsaného v integrovaném vývojovém prostředí (IDE) nelze ověřit ani spustit. Soubory zdrojového kódu musíte nasadit zpět do pracovního prostoru Azure Databricks a nakonfigurovat je jako součást kanálu.

Tento článek obsahuje přehled podpory místního vývoje integrovaného vývojového prostředí (IDE). Pro interaktivnější vývoj a testování doporučuje Databricks používat Editor kanálů Lakeflow. Viz Vývoj a ladění kanálů ETL pomocí Editoru kanálů Lakeflow.

Konfigurace místního integrovaného vývojového prostředí (IDE) pro vývoj pipeline

Databricks poskytuje modul Pythonu pro místní vývoj distribuovaný prostřednictvím PyPI. Pokyny k instalaci a použití najdete v tématu Zástupný skript Pythonu pro DLT.

Tento modul obsahuje odkazy na rozhraní a docstring pro rozhraní Python kanálu, které při psaní kódu v integrovaném vývojovém prostředí (IDE) poskytuje kontrolu syntaxe, automatické dokončování a kontrolu datových typů.

Tento modul obsahuje rozhraní, ale žádné funkční implementace. Tuto knihovnu nelze použít pro lokální vytváření nebo spuštění pipeline.

Balíčky prostředků Databricks můžete použít k zabalení a nasazení zdrojového kódu a konfigurací do cílového pracovního prostoru a k aktivaci spuštění aktualizace v kanálu nakonfigurovaném tímto způsobem. Viz Převod kanálu na projekt Sady prostředků Databricks.

Rozšíření Databricks pro Visual Studio Code nabízí dodatečné funkce pro práci s pipeline pomocí Databricks Asset Bundles. Podívejte se na Bundle Resource Explorer.

Synchronizujte kód pipeline z integrovaného vývojového prostředí (IDE) do pracovního prostoru

Následující tabulka shrnuje možnosti synchronizace zdrojového kódu kanálu mezi místním prostředím IDE a pracovním prostorem Azure Databricks:

Nástroj nebo vzor Podrobnosti
Sady zdrojů Databricks Sada prostředků Databricks slouží k nasazení prostředků kanálu v rozsahu složitosti od jednoho souboru zdrojového kódu až po konfigurace pro několik kanálů, úloh a souborů zdrojového kódu. Viz Převod kanálu na projekt Sady prostředků Databricks.
Rozšíření Databricks pro Visual Studio Code Azure Databricks poskytuje integraci se sadou Visual Studio Code, která zahrnuje snadnou synchronizaci mezi místním prostředím IDE a soubory pracovního prostoru. Toto rozšíření také poskytuje nástroje pro použití sad prostředků Databricks k nasazení pipeline prostředků. Podívejte se , co je rozšíření Databricks pro Visual Studio Code?.
Soubory pracovního prostoru Soubory pracovního prostoru Databricks můžete použít k nahrání zdrojového kódu kanálu do pracovního prostoru Databricks a následnému importu kódu do kanálu. Podívejte se na co jsou soubory pracovního prostoru.
Složky Gitu Složky Git umožňují synchronizovat kód mezi místním prostředím a pracovním prostorem Azure Databricks pomocí úložiště Git jako zprostředkujícího úložiště. Viz složky Git v Azure Databricks.