您可以在慣用的整合開發環境 (IDE) 中撰寫 Python 管線原始程式碼。
您無法驗證或執行在 IDE 中撰寫的管線程式碼的更新。 您必須將原始程式碼檔案部署回 Azure Databricks 工作區,並將其設定為管線的一部分。
本文提供本機 IDE 開發支援的概觀。 如需更具互動式的開發和測試,Databricks 建議使用 Lakeflow 管線編輯器。 請參閱 使用 Lakeflow 管線編輯器來開發和偵錯 ETL 管線。
設定本機 IDE 以進行管線開發
Databricks 提供 Python 模組,用於透過 PyPI 發行的本機開發。 如需安裝和使用指示,請參閱 DLT 的 Python 存根。
此模組具有管道 Python 介面的介面和文件字串參考,可在您在 IDE 中撰寫程式碼時提供語法檢查、自動完成和資料類型檢查。
此模組包含介面,但沒有功能實作。 您無法使用此程式庫在本機建立或執行管線。
你可以使用 Declarative Automation Bundles 將原始碼與設定打包並部署到目標工作區,並觸發在以這種方式設定的管線上執行更新。 參見 「將管線轉換為組合專案」。
Visual Studio Code 的 Databricks 擴充功能則提供更多功能,用於使用 Declarative Automation Bundles 處理管線。 請參閱 套件組合資源總管。
將 IDE 的流水線程式碼同步至工作區
下表摘要說明在本機 IDE 與 Azure Databricks 工作區之間同步處理管線原始碼的選項:
| 工具或模式 | 詳細資訊 |
|---|---|
| 宣告式自動化套件組 | 使用宣告式自動化套件來部署各類管線資產,從單一原始碼檔案,甚至到多個管線、工作及原始碼檔案的配置。 參見 「將管線轉換為組合專案」。 |
| 適用於 Visual Studio Code 的 Databricks 擴充功能 | Azure Databricks 提供與 Visual Studio Code 的整合,其中包含本機 IDE 與工作區檔案之間的輕鬆同步處理。 此擴充套件亦提供使用宣告式自動化套件部署管線資產的工具。 請參閱什麼是適用於 Visual Studio Code 的 Databricks 延伸模組?。 |
| 工作區檔案 | 您可以使用 Databricks 工作區檔案,將管線原始程式碼上傳至 Databricks 工作區,然後將該程式代碼匯入管線。 請參閱 什麼是工作區檔案?。 |
| Git 資料夾 | Git 資料夾可讓您使用 Git 存放庫作為媒介,在本機環境與 Azure Databricks 工作區之間同步程式代碼。 請參閱 Azure Databricks Git 資料夾。 |