Databricks for Visual Studio Code 擴充功能讓你可以從你本地開發機器上的 Visual Studio Code 或 Cursor 連線到你的遠端 Azure Databricks 工作區。 接著,您可以:
- 定義、部署並執行宣告式自動化套件,將 CI/CD 模式與最佳實務套用至 Lakeflow 作業、Lakeflow Spark 宣告式管線及 MLOps 堆疊,使用 Visual Studio Code 介面。 請參閱 「什麼是宣告式自動化套件?」 以及「 宣告式自動化套件」擴充功能。
- 在 Azure Databricks 叢集或遠端工作空間的無伺服器運算中,從 Visual Studio Code 執行本地 Python 程式碼檔案。 請參考 在叢集上執行 Python 檔案。
- 在遠端工作空間中,使用 Visual Studio Code 將本地 Python 程式碼檔案和 Python、R、Scala 以及 SQL 筆記本(
.py、.py、.ipynb、.r和.scala)作為 Lakeflow Jobs 來運行。 請參考 Run a Python file as a job。 - 使用簡單的檢查清單以觸發選擇對話框,設置和配置您的偵錯環境及 Databricks Connect。 請參閱使用 Databricks Connect 進行 Debug 程式碼,了解 Visual Studio Code 的 Databricks 擴充功能。
- 在 Visual Studio Code 中用 Databricks Connect 逐格除錯筆記本。 請參考 使用 Databricks Connect 以執行並除錯筆記本儲存格,對於 Visual Studio Code 使用 Databricks 擴充功能。
- 將你在 Visual Studio Code 中開發的本地程式碼與遠端工作空間的程式碼同步。 請參閱 將您的工作區資料夾同步至 Databricks
注意
Visual Studio Code 的 Databricks 擴充套件支援以自動化工作形式執行 R、Scala 和 SQL 筆記本,但在 Visual Studio Code 中並未提供更深入的這些語言支援。
開始
要開始使用 Visual Studio Code 的 Databricks 擴充功能:
- 安裝延伸項目。
- Create 一個新的 Databricks 專案,或 convert一個現有的 Visual Studio Code 專案。
- 使用 Databricks 擴充功能 UI 輕鬆地設定您的專案。
- 可以執行一些Python程式碼,作為擴充功能教學的一部分。
- 使用 Databricks Connect 整合對程式碼進行偵錯。
- 使用
pytest測試您的程式碼。 請參考 使用 Databricks 擴充套件於 Visual Studio Code 運行 Python 測試。
建立新的 Databricks 專案
安裝完擴充功能後,你可以使用 Visual Studio Code 的 Databricks 擴充功能建立新的 Databricks 專案:
- 啟動 Visual Studio Code。
- 點擊Visual Studio Code側邊欄的 Databricks 圖示即可開啟擴充功能。
- 按一下 建立新專案。
- 在 命令選擇區中,選取專案的主機和驗證方法。 請參考 為 Visual Studio Code 的 Databricks 擴充套件設定授權。
- 在提供專案資料夾路徑欄位中,輸入您想在本機開發電腦上創建專案的資料夾路徑,或點選開啟資料夾選取對話框,然後選擇專案資料夾的路徑。
- 若要讓 範本在 Databricks 專案初始化檢視中使用,請使用向上和向下箭號來選取專案範本,然後按 Enter。 有關套件專案範本的資訊,請參閱宣告式自動化套件專案範本。
- 為專案輸入此專案的唯一名稱,或保留預設專案名稱
my_project,然後按 Enter 鍵。 - 你可以選擇在專案中加入存根(範例)筆記本、存根(範例)Delta Live Tables 管線,或是存根(範例)Python 套件,或這些存根(範例)的任意組合。
- 按任意鍵關閉 Databricks Project Init 編輯器分頁。
- 請針對您想要開啟的專案,選擇您剛剛建立的專案。
開啟一個現有的宣告式自動化套件專案
宣告式自動化套件專案在專案根目錄中有一個 databricks.yml 檔案。 請參閱 宣告式自動化套件的設定。 如果你想在現有的 Declarative Automation Bundles 專案中使用這個擴充功能:
啟動 Visual Studio Code。 從主功能表中,按一下 [檔案] >[開啟資料夾],然後瀏覽至包含套件組合專案的目錄。
點擊Visual Studio Code側邊欄中的 Databricks 圖示即可開啟並開始使用擴充功能的功能。
如果 Visual Studio Code 的 Databricks 擴充功能發現目前資料夾中有多個宣告式自動化套件專案,它會讓你選擇在根目錄中開啟專案或建立專案設定檔。
- 如果你選擇了一個專案,在 指令面板中選擇你現有的 Declarative Automation Bundles 專案。
- 如果您在根資料夾中建立組態,該資料夾會變成配套專案。
選取專案的主機和驗證方法。 請參考 為 Visual Studio Code 的 Databricks 擴充套件設定授權。
注意
如果你開啟使用 Databricks 擴充套件為 Visual Studio Code v1 建立的專案,遷移會自動透過專案現有的認證與工作區設定進行。 只有在自動移轉失敗時,才能使用移轉按鈕。
在 Databricks 專案之間切換
Visual Studio Code 的 Databricks 擴充功能允許你在 Visual Studio Code 工作空間中放置多個 Databricks 專案,並輕鬆切換。 當您的多套件專案在 Visual Studio Code 工作區開啟時:
點擊Visual Studio Code側邊欄的 Databricks 圖示即可開啟擴充功能。
按一下 本機資料夾 選取擴充功能要使用的專案。
注意
執行動作僅適用於使用中套件組合中的檔案。
將項目轉換成 Databricks 專案
如果您有想要轉換成 Databricks 專案的現有專案:
- 啟動 Visual Studio Code。 從主功能表中,按一下 [檔案] >[開啟資料夾],並瀏覽至您的專案以開啟它。
- 點擊Visual Studio Code側邊欄的 Databricks 圖示即可開啟擴充功能。
- 按一下 [建立設定]。
- 在 命令選擇區中,選取專案的主機和驗證方法。 請參考 為 Visual Studio Code 的 Databricks 擴充套件設定授權。