使用適用於Visual Studio Code 的 Databricks 擴充功能設定 Databricks 專案
適用於 Visual Studio Code 的 Databricks 延伸模組會在延伸模組面板中提供 組態 檢視,可讓您輕鬆地設定及更新 Databricks 專案的設定。 這些功能包括目標工作區部署選取器、輕鬆設定驗證和計算、工作區資料夾同步,以及啟用偵錯所需 Python 虛擬環境的簡單步驟。
當您建立或移轉專案至 Databricks 項目之後,即可使用 Visual Studio Code 的 Databricks 延伸模組內的組態檢視。 請參閱 建立新的 Databricks 專案。
注意
Visual Studio Code 的舊版 Databricks 擴充功能在專案 JSON 檔案中定義組態設定,並在終端機中設定環境變數。 在發行版本中,專案和環境組態位於 和 databricks.yml
檔案中databricks.env
。
如果您的專案是 Databricks 資產套件組合,Databricks 擴充 UI 也會提供 套件組合資源 總管和 套件組合變數檢視 來管理您的套件組合資源和變數。 請參閱 Databricks Asset Bundles 擴充功能。
變更目標部署工作區
若要選取或切換 Databricks 專案的部署目標(例如,若要從 dev
目標切換到 prod
目標):
在 Databricks 延伸模組面板的 [組態] 檢視中,點擊齒輪圖示(選取與 目標相關的 Databricks 資產組合目標)。
在 命令選擇區中,選取所需的部署目標。
設定目標之後, 就會顯示主機 和部署 模式 。 如需 Databricks 資產配套部署模式的相關信息,請參閱 Databricks 資產套件組合部署模式。
您可以修改與專案相關聯之組態檔中的workspace
目標databricks.yml
設定,來變更工作區主機。 參閲目標。
注意
下列適用於 Visual Studio Code 功能的 Databricks 擴充功能只有在目標部署模式開發時才可使用:
- 使用附加的開發叢集進行配套作業
- 同步工作區資料夾檔案
- 選取互動式開發叢集
設定專案的 Databricks 設定檔
當您 建立 Databricks 專案,或 將 項目轉換成 Databricks 專案時,您可以設定設定檔,其中包含用來連線到 Databricks 的驗證設定。 如果您想要變更所使用的驗證配置檔,請按兩下組態檢視中與 AuthType 相關聯的齒輪圖示。
如需適用於 Visual Studio Code 驗證之 Databricks 延伸模組的詳細資訊,請參閱 為 Visual Studio Code 設定 Databricks 延伸模組的授權。
選取叢集以執行程式代碼和作業
使用適用於 Visual Studio Code 的 Databricks 擴充功能,您可以選取現有的 Azure Databricks 叢集,或建立新的 Azure Databricks 叢集來執行程式代碼和作業。 聯機到計算之後,會顯示叢集的標識碼、Databricks 運行時間版本、建立者、狀態和存取模式。 您也可以啟動和停止叢集,並直接流覽至叢集的頁面詳細數據。
提示
如果您不想等候作業叢集啟動,請檢查 叢集選取範圍下方的覆寫作業叢集 ,以在開發模式中使用選取的叢集來執行配套作業。
使用現有的叢集
如果您有想要使用的現有 Azure Databricks 叢集:
在 [組態] 檢視中,於 [叢集] 旁,點擊 [選取叢集] 或齒輪圖示(設定叢集)。
在 命令選擇區中,選取您想要使用的叢集。
建立新叢集
如果您沒有現有的 Azure Databricks 叢集,或想要建立新的叢集:
在 [組態] 檢視中,按兩下 [叢集] 旁的齒輪 (設定叢集) 圖示。
在命令選擇區中,按兩下 [建立新叢集]。
當系統提示您開啟外部網站(您的 Azure Databricks 工作區),請按兩下 [ 開啟]。
如果出現提示,請登入您的 Azure Databricks 工作區。
請遵循指示來 建立叢集。
注意
Databricks 建議您建立 個人計算 叢集。 這可讓您立即開始執行工作負載,將計算管理額外負荷降至最低。
建立叢集並執行之後,請返回 Visual Studio Code。
在 [組態] 檢視中,按兩下 [叢集] 旁的齒輪 (設定叢集) 圖示。
在命令 選擇區中,按下您想要使用的叢集。
同步您的工作區資料夾到 Databricks
您可以在 Databricks 延伸模組面板的 [組態] 檢視中,按一下與您的 Databricks 專案相關聯的 遠端資料夾 同步處理圖示(開始同步處理),以同步處理該遠端 Databricks 工作區資料夾。
注意
適用於 Visual Studio Code 的 Databricks 擴充功能僅適用於其建立的工作區目錄。 除非您已由延伸模組建立,否則您無法在專案中使用現有的工作區目錄。
若要導覽至 Databricks 中的工作區檢視,請按一下與 [遠端資料夾]相關聯的外部連結圖示[在外部開啟連結]圖示。
延伸模組會根據 file_path
專案相關聯 Databricks 資產套件組合組態的對應中的 workspace
設定,決定要使用的 Azure Databricks 工作區資料夾。 請參閱 工作區。
注意
適用於 Visual Studio Code 的 Databricks 擴充功能只會執行單向、自動同步處理本機 Visual Studio Code 專案到遠端 Azure Databricks 工作區中相關工作區資料夾的檔案變更。 此遠端工作區目錄中的檔案是暫時性的。 請勿從遠端工作區內起始這些檔案的變更,因為這些變更不會同步處理回本機專案。
如需舊版 Visual Studio Code Databricks 延伸模組之工作區目錄同步功能的使用詳細資訊,請參閱 Visual Studio Code Databricks 延伸模組的工作區目錄選擇。
設定 Python 環境和 Databricks Connect
組態檢視的 [Python 環境] 區段可讓您輕鬆設定 Python 虛擬開發環境和安裝 Databricks Connect,以執行和偵錯程式代碼和筆記本數據格。 Python 虛擬環境可確保您的專案使用相容的 Python 和 Python 套件版本(在此案例中為 Databricks Connect 套件)。
若要為您的項目設定 Python 虛擬環境 ,請在 延伸模組面板的 [組態 ] 檢視中:
- 按兩下 [Python 環境] 底下的紅色 [啟動虛擬環境] 專案。
- 在 [命令選擇區]中,選取 [Venv] 或 [Conda]。
- 選取您想要安裝的相依性,如果有的話。
若要變更環境,請按兩下與作用中環境相關聯的齒輪圖示 (變更虛擬環境)。
如需安裝 Databricks Connect 的相關信息,其可在 Visual Studio Code 中啟用執行和偵錯程式代碼和筆記本,請參閱 使用 Databricks Connect 偵錯 Visual Studio Code 的 Databricks 延伸模組的程式代碼。