工作區連結庫 (舊版)

重要

此檔已淘汰,且可能未更新。 不再支援此內容中所提及的產品、服務或技術。 請參閱叢集程式庫

注意

工作區連結庫已被取代,不應使用。 不過,將連結庫儲存為工作區檔案與工作區連結庫不同,但仍受到完全支援。 您可以直接將儲存為工作區檔案的連結庫安裝到計算或作業工作。

工作區連結庫可作為您建立叢集安裝連結庫的本機存放庫。 工作區庫可能是貴組織所建立的自定義程式碼,或可能是貴組織已標準化之開放原始碼連結庫的特定版本。

您必須先在叢集上安裝工作區連結庫,才能在筆記本或作業中使用。 請參閱 將工作區連結庫安裝到叢集

[共享資料夾] 中的工作區連結庫可供工作區中的所有使用者使用,而使用者資料夾中的工作區連結庫則僅適用於該使用者。

重要

使用 Databricks Runtime 14.3 LTS 和以下版本時,可以從 DBFS 安裝連結庫。 不過,任何工作區使用者都可以修改儲存在 DBFS 中的連結庫檔案。 若要改善 Azure Databricks 工作區中連結庫的安全性,在 Databricks Runtime 15.0 和更新版本中預設會淘汰和停用 DBFS 根目錄中的連結庫檔案。 請參閱 在 DBFS 根目錄中儲存連結庫已被取代,並預設為停用。

相反地,Databricks 建議 將所有連結庫,包括 Python 連結庫、JAR 檔案和 Spark 連接器上傳至工作區檔案或 Unity 目錄磁碟區,或使用連結庫套件存放庫。 如果您的工作負載不支援這些模式,您也可以使用儲存在雲端物件記憶體中的連結庫。

工作區連結庫與儲存工作區檔案的連結庫有何不同?

「工作區連結庫」一詞是指任何已註冊至工作區的連結庫。 工作區連結庫會與筆記本和工作區檔案並排顯示,並遵循其包含目錄的 ACL 規則。

「工作區檔案」一詞是指儲存在工作區中的任何任意檔案。 您可以將 Python .whl 套件儲存為工作區檔案,然後將其註冊為工作區連結庫。 請參閱 什麼是工作區檔案?

您可以將連結庫上傳為工作區檔案。 請參閱 工作區檔案基本用法

雖然您可以將許多文件類型上傳至工作區檔案,但只能使用工作區檔案來安裝 Python .whl 檔案。 請參閱 叢集範圍的連結庫

在 Databricks Runtime 13.3 LTS 和更新版本中,您可以使用 %pip 安裝儲存為工作區檔案的 Python 轉輪檔案。 請參閱 使用 %pip 安裝儲存為工作區檔案的套件。

建立工作區連結庫

警告

此功能已不再提供。 請參閱 不再提供工作區連結庫的建立和安裝。

  1. 以滑鼠右鍵按下您要儲存文件庫的工作區資料夾。
  2. 選取 [ 建立 > 連結庫]。 [建立連結庫] 對話框隨即出現。
  3. 選取 [連結 庫來源 ],並遵循適當的程式:

上傳 Jar、Python 蛋或 Python 滾輪檔案

注意

安裝 Python 蛋類檔案已被取代,並將在未來的 Databricks Runtime 版本中移除。

重要

使用 Databricks Runtime 14.3 LTS 和以下版本時,可以從 DBFS 安裝連結庫。 不過,任何工作區使用者都可以修改儲存在 DBFS 中的連結庫檔案。 若要改善 Azure Databricks 工作區中連結庫的安全性,在 Databricks Runtime 15.0 和更新版本中預設會淘汰和停用 DBFS 根目錄中的連結庫檔案。 請參閱 在 DBFS 根目錄中儲存連結庫已被取代,並預設為停用。

相反地,Databricks 建議 將所有連結庫,包括 Python 連結庫、JAR 檔案和 Spark 連接器上傳至工作區檔案或 Unity 目錄磁碟區,或使用連結庫套件存放庫。 如果您的工作負載不支援這些模式,您也可以使用儲存在雲端物件記憶體中的連結庫。

  1. 在 [連結庫來源] 按鈕清單中,選取 [ 上傳]。
  2. 選取 [Jar]、 [Python 蛋][Python Whl]。
  3. 選擇性地輸入連結庫名稱。
  4. 將 Jar、Egg 或 Whl 拖曳至下拉式方塊,或按兩下拉式方塊並瀏覽至檔案。 檔案會上傳至 dbfs:/FileStore/jars
  5. 按一下 [建立]。 連結庫狀態畫面隨即顯示。

參考上傳的 JAR、Python 蛋或 Python 滾輪檔案

您可以藉由參考儲存在 DBFS 根目錄、物件儲存區或工作區檔案中的 JAR、Python 蛋類或 Python 轉輪檔案,來建立新的工作區連結庫。 遵循此工作流程會註冊連結庫的指標,而不需要上傳或移動檔案。

使用 Databricks Runtime 13.2 和更新版本,您也可以參考 Unity 目錄中的磁碟 。 這項功能處於 公開預覽狀態

針對共用存取模式,您必須將 JAR 新增至 allowlist。 請參閱 共享計算上的 Allowlist 連結庫和 init 腳本。

  1. 在 [連結庫來源] 按鈕清單中選取 [檔案路徑/ADLS ]。
  2. 選取 [Jar]、 [Python 蛋][Python Whl]。
  3. 選擇性地輸入連結庫名稱。
  4. 指定連結庫的路徑,例如下列範例:
    • abfss://container-name@storage-account-name.dfs.core.windows.net/path/to/library.whl
    • /Workspace/path/to/library.whl
    • dbfs:/path/to/library.whl
    • /Volumes/<catalog>/<schema>/<volume>/<path_to_library_file>
  5. 按一下 [建立]。 連結庫狀態畫面隨即顯示。

如需在物件記憶體中使用連結庫的詳細資訊,請參閱 從物件記憶體安裝連結庫。

如需工作區檔案的詳細資訊,請參閱 使用 Azure Databricks 上的檔案。

將工作區連結庫安裝到叢集

注意

Azure Databricks 會依叢集上安裝工作區連結庫的順序來處理所有工作區連結庫。 如果連結庫之間有相依性,您可能需要注意叢集上安裝的順序。

重要

使用 Databricks Runtime 14.3 LTS 和以下版本時,可以從 DBFS 安裝連結庫。 不過,任何工作區使用者都可以修改儲存在 DBFS 中的連結庫檔案。 若要改善 Azure Databricks 工作區中連結庫的安全性,在 Databricks Runtime 15.0 和更新版本中預設會淘汰和停用 DBFS 根目錄中的連結庫檔案。 請參閱 在 DBFS 根目錄中儲存連結庫已被取代,並預設為停用。

相反地,Databricks 建議 將所有連結庫,包括 Python 連結庫、JAR 檔案和 Spark 連接器上傳至工作區檔案或 Unity 目錄磁碟區,或使用連結庫套件存放庫。 如果您的工作負載不支援這些模式,您也可以使用儲存在雲端物件記憶體中的連結庫。

在單一使用者存取模式中,會使用指派主體的身分識別(用戶或服務主體)。 在共用存取模式中,連結庫會使用安裝連結庫的使用者身分識別。 無隔離共用存取模式不支援磁碟區,但使用與共用存取模式相同的身分識別指派。

若要查看在叢集上安裝連結庫的所有選項,請參閱 叢集連結庫

若要安裝已存在於工作區中的連結庫,您可以從叢集 UI 或連結庫 UI 開始:

Cluster

  1. 在提要欄位中,按兩下 [計算圖示計算]。
  2. 按兩下叢集名稱。
  3. 按兩下 [連結庫] 索引 標籤
  4. 按兩下 [ 安裝新增]。
  5. 在 [連結庫來源] 按鈕清單中,選取 [ 工作區連結庫]。
  6. 選取工作區連結庫。
  7. 按一下 [安裝]

程式庫

  1. 移至包含連結庫的資料夾。
  2. 按兩下連結庫名稱。
  3. 選取您要安裝連結庫之叢集旁的複選框,然後按兩下 [ 安裝]。 只有執行中的叢集會出現在清單中。

檢視工作區連結庫詳細數據

注意

工作區資料夾提供探索工作區連結庫及管理 ACL 的便利性。

  1. 移至包含連結庫的工作區資料夾。
  2. 按兩下連結庫名稱。

連結庫詳細數據頁面會顯示執行中的叢集和 連結庫的安裝狀態 。 如果已安裝連結庫,頁面就會包含套件主機的連結。 如果連結庫已上傳,頁面會顯示所上傳套件檔案的連結。

移動工作區連結庫

注意

工作區資料夾提供探索工作區連結庫及管理 ACL 的便利性。 移動工作區連結庫並不會移動檔案,但可以修改哪些使用者可以存取工作區連結庫。

  1. 移至包含連結庫的工作區資料夾。
  2. 以滑鼠右鍵按兩下連結庫名稱,然後選取[ 移動]。 資料夾瀏覽器隨即顯示。
  3. 按兩下目的地資料夾。
  4. 按兩下 [ 移動]。

刪除工作區連結庫

重要

刪除工作區連結庫之前,您應該 從所有叢集卸載 它。

若要刪除工作區連結庫:

  1. 將連結庫移至 [垃圾箱] 資料夾。
  2. 永久刪除 [回收站] 資料夾中的連結庫,或清空 [回收站] 資料夾。