共用方式為


使用適用於Visual Studio Code 的 Databricks 擴充功能設定 Databricks 專案

適用於 Visual Studio Code 的 Databricks 延伸模組會在延伸模組面板中提供組 檢視,可讓您輕鬆地設定及更新 Databricks 專案的設定。 這些功能包括目標工作區部署選取器、輕鬆設定驗證和計算、工作區資料夾同步,以及啟用偵錯所需 Python 虛擬環境的簡單步驟。

當您建立或移轉專案至 Databricks 項目之後,即可使用 Visual Studio Code 的 Databricks 延伸模組內的組態檢視。 請參閱 建立新的 Databricks 專案

注意

Visual Studio Code 的舊版 Databricks 擴充功能在專案 JSON 檔案中定義組態設定,並在終端機中設定環境變數。 在發行版本中,專案和環境組態位於 和 databricks.env 檔案中databricks.yml

如果您的專案是 Databricks 資產套件組合,Databricks 擴充 UI 也會提供 套件組合資源 總管和 套件組合變數檢視 來管理您的套件組合資源和變數。 請參閱 Databricks Asset Bundles 擴充功能

變更目標部署工作區

若要選取或切換 Databricks 專案的部署目標(例如,從 dev 目標切換至 prod 目標):

  1. 在 Databricks 延伸模組面板的 [組態] 檢視中,按兩下與目標相關聯的齒輪圖示 [選取 Databricks 資產組合目標]。

    選取 Databricks 資產套件組合目標

  2. 在命令 選擇區中,選取所需的部署目標。

設定目標之後, 就會顯示主機 和部署 模式 。 如需 Databricks 資產配套部署模式的相關信息,請參閱 Databricks 資產套件組合部署模式

您可以修改與專案相關聯之組態檔中的databricks.yml目標workspace設定,來變更工作區主機。 請參閱 目標

注意

下列適用於 Visual Studio Code 功能的 Databricks 擴充功能只有在目標部署模式開發時才可使用:

  • 使用附加的開發叢集進行配套作業
  • 同步工作區資料夾檔案
  • 選取互動式開發叢集

設定專案的 Databricks 設定檔

當您 建立 Databricks 專案或 將專案移 轉至 Databricks 專案時,您會設定設定檔,其中包含用來連線到 Databricks 的驗證設定。 如果您想要變更所使用的驗證配置檔,請按兩下組態檢視中AuthType 相關聯的齒輪圖示。

如需適用於 Visual Studio Code 驗證之 Databricks 延伸模組的詳細資訊,請參閱 Visual Studio Code Databricks 延伸模組的驗證設定。

選取執行程式代碼和作業的叢集

使用適用於 Visual Studio Code 的 Databricks 擴充功能,您可以選取現有的 Azure Databricks 叢集,或建立新的 Azure Databricks 叢集來執行程式代碼和作業。 聯機到計算之後,會顯示叢集的標識碼、Databricks 運行時間版本、建立者、狀態和存取模式。 您也可以啟動和停止叢集,並直接流覽至叢集的頁面詳細數據。

提示

如果您不想等候作業叢集啟動,請檢查 叢集選取範圍下方的覆寫作業叢集 ,以在開發模式中使用選取的叢集來執行配套作業。

使用現有的叢集

如果您有想要使用的現有 Azure Databricks 叢集:

  1. 在 [組態] 檢視中,按兩下 [叢集] 旁的 [選取叢集] 或齒輪 (設定叢集) 圖示。

    設定叢集

  2. 在 [ 命令選擇區] 中,選取您想要使用的叢集。

建立新叢集

如果您沒有現有的 Azure Databricks 叢集,或想要建立新的叢集:

  1. 在 [組態] 檢視中,按兩下 [叢集] 旁的齒輪 (設定叢集) 圖示。

  2. 在命令選擇區,按兩下 [建立新叢集]。

  3. 當系統提示您開啟外部網站(您的 Azure Databricks 工作區),請按兩下 [ 開啟]。

  4. 如果出現提示,請登入您的 Azure Databricks 工作區。

  5. 請遵循指示來 建立叢集

    注意

    Databricks 建議您建立 個人計算 叢集。 這可讓您立即開始執行工作負載,將計算管理額外負荷降至最低。

  6. 建立叢集並執行之後,請返回 Visual Studio Code。

  7. 在 [組態] 檢視中,按兩下 [叢集] 旁的齒輪 (設定叢集) 圖示。

    設定叢集圖示 3

    在命令 選擇區中,按下您想要使用的叢集。

同步處理工作區資料夾與 Databricks

您可以在 Databricks 延伸模組面板的 [組態] 檢視中按兩下與 [工作區資料夾] 相關聯的同步圖示 [開始同步處理],以同步處理與 Databricks 專案相關聯的遠端 Databricks 工作區資料夾

注意

適用於 Visual Studio Code 的 Databricks 擴充功能僅適用於其建立的工作區目錄。 除非您已由延伸模組建立,否則您無法在專案中使用現有的工作區目錄。

若要流覽至 Databricks 中的工作區檢視,請按兩下與 [工作區資料夾] 相關聯的外部連結圖示[開啟外部連結] 圖示。

延伸模組會根據 file_path 專案相關聯 Databricks 資產套件組合組態的對應中的 workspace 設定,決定要使用的 Azure Databricks 工作區資料夾。 請參閱 工作區

注意

適用於 Visual Studio Code 的 Databricks 擴充功能只會執行單向、自動同步處理本機 Visual Studio Code 專案到遠端 Azure Databricks 工作區中相關工作區資料夾的檔案變更。 此遠端工作區目錄中的檔案是暫時性的。 請勿從遠端工作區內起始這些檔案的變更,因為這些變更不會同步處理回本機專案。

如需適用於 Visual Studio Code 之舊版 Databricks 延伸模組之工作區目錄同步功能的使用量詳細數據,請參閱 為 Visual Studio Code 的 Databricks 延伸模組選取工作區目錄。

設定 Python 環境和 Databricks Connect

檢視的 [Python 環境] 區段可讓您輕鬆設定 Python 虛擬開發環境和安裝 Databricks Connect,以執行和偵錯程式代碼和筆記本數據格。 Python 虛擬環境可確保您的專案使用相容的 Python 和 Python 套件版本(在此案例中為 Databricks Connect 套件)。

若要為您的項目設定 Python 虛擬環境 ,請在 延伸模組面板的 [組態 ] 檢視中:

  1. 按兩下 [Python 環境] 底下的紅色 [啟動虛擬環境] 專案。
  2. 在 [ 命令選擇區] 中,選取 [Venv] 或 [Conda]。
  3. 選取您想要安裝的相依性,如果有的話。

若要變更環境,請按兩下與作用中環境相關聯的齒輪圖示 (變更虛擬環境)。

如需安裝 Databricks Connect 的相關信息,其可在 Visual Studio Code 中啟用執行和偵錯程式代碼和筆記本,請參閱 使用 Databricks Connect 偵錯 Visual Studio Code 的 Databricks 延伸模組的程式代碼