共用方式為


在本機開發環境中開發管線程式碼

您可以在慣用的整合開發環境 (IDE) 中撰寫 Python 管線原始程式碼。

您無法驗證或執行在 IDE 中撰寫的管線程式碼的更新。 您必須將原始程式碼檔案部署回 Azure Databricks 工作區,並將其設定為管線的一部分。

本文提供本機 IDE 開發支援的概觀。 如需更具互動式的開發和測試,Databricks 建議使用 Lakeflow 管線編輯器。 請參閱 使用 Lakeflow 管線編輯器來開發和偵錯 ETL 管線

設定本機 IDE 以進行管線開發

Databricks 提供 Python 模組,用於透過 PyPI 發行的本機開發。 如需安裝和使用指示,請參閱 DLT 的 Python 存根

此模組具有管道 Python 介面的介面和文件字串參考,可在您在 IDE 中撰寫程式碼時提供語法檢查、自動完成和資料類型檢查。

此模組包含介面,但沒有功能實作。 您無法使用此程式庫在本機建立或執行管線。

您可以使用 Databricks 資產套件組合,將原始程式碼和組態封裝並部署至目標工作區,並在以這種方式設定的管線上觸發執行更新。 請參閱 將管線轉換成 Databricks 資產套件組合專案

適用於 Visual Studio Code 的 Databricks 擴充功能具有使用 Databricks 資產套件組合處理管線的其他功能。 請參閱 套件組合資源總管

將 IDE 的流水線程式碼同步至工作區

下表摘要說明在本機 IDE 與 Azure Databricks 工作區之間同步處理管線原始碼的選項:

工具或模式 詳細資訊
Databricks 資產套件組合 使用 Databricks 資產組合來部署管線資產,範圍從單一原始碼檔案到多個管線、作業和原始碼檔案的組態複雜度。 請參閱 將管線轉換成 Databricks 資產套件組合專案
適用於 Visual Studio Code 的 Databricks 擴充功能 Azure Databricks 提供與 Visual Studio Code 的整合,其中包含本機 IDE 與工作區檔案之間的輕鬆同步處理。 此延伸模組也提供使用 Databricks 資產套件組合來部署管線資產的工具。 請參閱什麼是適用於 Visual Studio Code 的 Databricks 延伸模組?
工作區檔案 您可以使用 Databricks 工作區檔案,將管線原始程式碼上傳至 Databricks 工作區,然後將該程式代碼匯入管線。 請參閱 什麼是工作區檔案?
Git 資料夾 Git 資料夾可讓您使用 Git 存放庫作為媒介,在本機環境與 Azure Databricks 工作區之間同步程式代碼。 請參閱 Azure Databricks Git 資料夾