Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Zdrojový kód kanálu Pythonu můžete vytvořit ve svém upřednostňovaném integrovaném vývojovém prostředí (IDE).
Aktualizace kódu kanálu napsaného v integrovaném vývojovém prostředí (IDE) nelze ověřit ani spustit. Soubory zdrojového kódu musíte nasadit zpět do pracovního prostoru Azure Databricks a nakonfigurovat je jako součást kanálu.
Tento článek obsahuje přehled podpory místního vývoje integrovaného vývojového prostředí (IDE). Pro interaktivnější vývoj a testování doporučuje Databricks používat Editor kanálů Lakeflow. Viz Vývoj a ladění kanálů ETL pomocí Editoru kanálů Lakeflow.
Konfigurace místního integrovaného vývojového prostředí (IDE) pro vývoj pipeline
Databricks poskytuje modul Pythonu pro místní vývoj distribuovaný prostřednictvím PyPI. Pokyny k instalaci a použití najdete v tématu Zástupný skript Pythonu pro DLT.
Tento modul obsahuje odkazy na rozhraní a docstring pro rozhraní Python kanálu, které při psaní kódu v integrovaném vývojovém prostředí (IDE) poskytuje kontrolu syntaxe, automatické dokončování a kontrolu datových typů.
Tento modul obsahuje rozhraní, ale žádné funkční implementace. Tuto knihovnu nelze použít pro lokální vytváření nebo spuštění pipeline.
Balíčky prostředků Databricks můžete použít k zabalení a nasazení zdrojového kódu a konfigurací do cílového pracovního prostoru a k aktivaci spuštění aktualizace v kanálu nakonfigurovaném tímto způsobem. Viz Převod kanálu na projekt Sady prostředků Databricks.
Rozšíření Databricks pro Visual Studio Code nabízí dodatečné funkce pro práci s pipeline pomocí Databricks Asset Bundles. Podívejte se na Bundle Resource Explorer.
Synchronizujte kód pipeline z integrovaného vývojového prostředí (IDE) do pracovního prostoru
Následující tabulka shrnuje možnosti synchronizace zdrojového kódu kanálu mezi místním prostředím IDE a pracovním prostorem Azure Databricks:
| Nástroj nebo vzor | Podrobnosti |
|---|---|
| Sady zdrojů Databricks | Sada prostředků Databricks slouží k nasazení prostředků kanálu v rozsahu složitosti od jednoho souboru zdrojového kódu až po konfigurace pro několik kanálů, úloh a souborů zdrojového kódu. Viz Převod kanálu na projekt Sady prostředků Databricks. |
| Rozšíření Databricks pro Visual Studio Code | Azure Databricks poskytuje integraci se sadou Visual Studio Code, která zahrnuje snadnou synchronizaci mezi místním prostředím IDE a soubory pracovního prostoru. Toto rozšíření také poskytuje nástroje pro použití sad prostředků Databricks k nasazení pipeline prostředků. Podívejte se , co je rozšíření Databricks pro Visual Studio Code?. |
| Soubory pracovního prostoru | Soubory pracovního prostoru Databricks můžete použít k nahrání zdrojového kódu kanálu do pracovního prostoru Databricks a následnému importu kódu do kanálu. Podívejte se na co jsou soubory pracovního prostoru. |
| Složky Gitu | Složky Git umožňují synchronizovat kód mezi místním prostředím a pracovním prostorem Azure Databricks pomocí úložiště Git jako zprostředkujícího úložiště. Viz složky Git v Azure Databricks. |