什麼是適用於 Visual Studio Code 的 Databricks 延伸項目?
適用於 Visual Studio Code 的 Databricks 延伸項目可讓您從本機開發電腦上執行的 Visual Studio Code 整合式開發環境 (IDE) 連線到遠端 Azure Databricks 工作區。 接著,您可以:
- 使用 Visual Studio Code UI 定義、部署及執行 Databricks Asset Bundles,以將 CI/CD 模式和最佳做法套用至 Azure Databricks 作業、Delta Live Tables 管線和 MLOps Stack。 請參閱什麼是 Databricks Asset Bundles?和 Databricks Asset Bundles 延伸項目功能。
- 在遠端工作區中的 Azure Databricks 叢集上,從 Visual Studio Code 執行本機 Python 程式碼檔案。 請參閱在叢集上執行 Python 檔案
- 從 Visual Studio Code 執行本機 Python 程式碼檔案 (
.py
) 和 Python、R、Scala 和 SQL 筆記本 (.py
、.ipynb
、.r
、.scala
和.sql
),作為遠端工作區中的 Azure Databricks 作業。 請參閱執行 Python 檔案作為作業。 - 使用觸發選取對話方塊的簡單檢查清單,建立及設定偵錯環境和 Databricks Connect。 請參閲為適用於 Visual Studio Code 的 Databricks 延伸項目使用 Databricks Connect 偵錯程式碼。
- 使用 Databricks Connect 在 Visual Studio Code 內對筆記本逐個資料格地進行偵錯。 請參閱使用適用於 Visual Studio Code 的 Databricks 延伸項目,配合 Databricks Connect 執行和偵錯筆記本資料格。
- 同步處理您使用遠端工作區中的程式碼在 Visual Studio Code 中開發的本機程式碼。
注意
適用於 Visual Studio Code 的 Databricks 延伸項目支援以自動化作業的形式執行 R、Scala 和 SQL 筆記本,但不會在 Visual Studio Code 中提供對這些語言的任何更深入支援。
開始使用
若要開始使用適用於 Visual Studio Code 的 Databricks 延伸項目:
- 安裝延伸項目。
- 建立新的 Databricks 專案,或移轉現有的 Visual Studio Code 專案。
- 使用 Databricks 延伸項目 UI 輕鬆地設定專案。
- 在延伸項目教學課程中執行一些 Python 程式碼。
- 使用 Databricks Connect 整合對程式碼進行偵錯。
- 使用
pytest
測試您的程式碼。 請參閱使用適用於 Visual Studio Code 的 Databricks 延伸項目執行 pytest 的測試。
建立新的 Databricks 專案
安裝延伸項目之後,您可以使用適用於 Visual Studio Code 的 Databricks 延伸項目來建立新的 Databricks 專案:
- 啟動 Visual Studio Code。
- 按一下 Visual Studio Code 側邊欄中的 Databricks 圖示,以開啟延伸項目。
- 按一下 [建立新的 Databricks 專案]。
- 在 [命令選擇區]中,選取專案的主機和驗證方法。 請參閲 適用於 Visual Studio Code 的 Databricks 延伸項目的驗證設定。
- 在 [提供您要成為新專案的資料夾路徑] 中,輸入您要在其中建立專案的本機開發計算機上資料夾的路徑,或按一下 [開啟資料夾選取對話方塊],然後選取專案資料夾的路徑。
- 對於在 Databricks 專案初始化檢視中要使用的範本,請使用向上和向下箭號來選取專案範本,然後按 Enter。 如需配套項目範本的相關資訊,請參閱 Databricks Asset Bundle 項目範本。
- 為專案輸入此專案的唯一名稱,或保留預設專案名稱
my_project
,然後按 Enter 鍵。 - 選擇是否要將虛設常式 (範例) 筆記本、虛設常式 (範例) Delta Live Tables 管線或虛設常式 (範例) Python 套件新增至專案,或這些虛設常式的任何組合 (範例)。
- 按任意鍵以關閉 Databricks Project Init 編輯器索引標籤。
- 針對 [選取您要開啟的專案],選擇您剛才建立的專案。
將專案遷移至 Databricks 專案
如果您有想要移轉至 Databricks 專案的現有專案,請使用適用於 Visual Studio Code 的 Databricks 延伸項目開啟它以開始移轉:
- 啟動 Visual Studio Code。 從主功能表中,按一下 [檔案] > [開啟資料夾],並瀏覽至您的專案以開啟它。
- 按一下 Visual Studio Code 側邊欄中的 Databricks 圖示,以開啟延伸項目。
- 按一下 [遷移至 Databricks 專案]。
- 在 [命令選擇區]中,選取專案的主機和驗證方法。 請參閲 適用於 Visual Studio Code 的 Databricks 延伸項目的驗證設定。
注意
如果您使用適用於 Visual Studio Code v1 的 Databricks 延伸項目開啟建立的專案,則會使用專案現有的驗證和工作區設定自動嘗試移轉。 只有在自動移轉失敗時,才能使用移轉按鈕。
開啟現有的 Databricks Asset Bundles 專案
如果適用於 Visual Studio Code 的 Databricks 延伸項目在目前資料夾中發現多個 Databricks Asset Bundles 專案,適用於 Visual Studio Code 的 Databricks 延伸項目可讓您選擇要開啟的專案。
注意
Databricks Asset Bundles 專案在專案的根資料夾中有 databricks.yml
檔案。 請參閱 Databricks Asset Bundle 組態。
啟動 Visual Studio Code。 從主功能表中,按一下 [檔案] > [開啟資料夾],然後瀏覽至包含套件組合專案的目錄。
按一下 Visual Studio Code 側邊欄中的 Databricks 圖示,以開啟延伸項目。
按一下 [ 開啟現有的 Databricks 專案]。
在 [命令選擇區] 中,選取現有的 Databricks Asset Bundles 專案。
在 [命令選擇區]中,選取專案的主機和驗證方法。 請參閲 適用於 Visual Studio Code 的 Databricks 延伸項目的驗證設定。
將另一個 Databricks 專案新增至工作區
適用於 Visual Studio Code 的 Databricks 延伸項目可讓您在 Visual Studio Code 工作區內有多個 Databricks 專案,並輕鬆地在這些專案之間切換。 若要新增另一個專案:
啟動 Visual Studio Code。 從主功能表中,按一下 [檔案] > [新增資料夾至工作區],然後瀏覽至包含其他套件組合專案的目錄。
按一下 Visual Studio Code 側邊欄中的 Databricks 圖示,以開啟延伸項目。
按一下 [使用中工作區資料夾],選取要使用的延伸項目專案。