共用方式為


計算範圍限定的程式庫

叢集庫可供在叢集上執行的所有筆記本和作業使用。 本文詳細說明在Azure Databricks工作區中使用 Install library UI。

注意

如果您使用強制執行連結庫安裝的原則建立計算,則無法在計算上安裝或卸載連結庫。 工作區系統管理員掌控政策層級的所有資料庫管理。

您可以使用下列方法將連結庫安裝到叢集:

在叢集上安裝程式庫

要在叢集上安裝程式庫時,可以這樣做:

  1. 在側邊欄中按下 計算圖示 [計算]
  2. 按一下叢集名稱。
  3. 按下 程式庫 標籤頁。
  4. 按一下 [ 安裝新項目]。
  5. [ 安裝函式庫 ] 對話框顯示。
  6. 選取其中一個 資源庫來源 選項,完成顯示的指示,然後按一下 [安裝]

重要

使用 Databricks Runtime 14.3 LTS 及更舊版本時,可從 DBFS 安裝程式庫。 不過,任何工作區使用者都可以修改儲存在 DBFS 的程式庫檔案。 為了提升 Azure Databricks 工作空間中函式庫的安全性,在 Databricks Runtime 15.1 及以上版本中預設會棄用並停用在 DBFS 根目錄中的函式庫檔案。 請參閱在 DBFS 根目錄儲存程式庫已被取代,並預設為停用

相反地,Databricks 建議將所有函式庫,包括 Python 函式庫、JAR 檔案和 Spark 連接器,上傳到工作區檔案或 Unity 目錄卷,或使用函式庫套件庫。 如果您的工作負載不支援這些模式,您也可以使用儲存在雲端物件記憶體的程式庫。

並非所有叢集存取模式都支援所有連結庫組態。 請參閱 計算範疇庫

函式庫來源 指示
工作區 選擇工作區檔案,或上傳 Whl、壓縮的 Wheelhouse(含 *.wheelhouse.whl 這個副檔名)、JAR、ZIP、tar 或 requirements.txt 檔案。 請參閱 從工作區檔案安裝程式庫
磁碟區 從磁碟區選取 Whl、JAR 或 requirements.txt 檔案。 請參閱 從磁碟區安裝程式庫
檔案路徑/ADLS 選取連結庫類型,並提供連結庫物件的完整URI(例如:/Workspace/path/to/library.whl/Volumes/path/to/library.whlabfss://container-name@storage-account-name.dfs.core.windows.net/path/to/library.whl)。 請參閱 從物件儲存安裝函式庫
PyPI 輸入 PyPI 套件名稱。 請參閱 PyPI 套件
Maven 指定 Maven 座標。 請參閱 Maven 或 Spark 套件
CRAN 輸入套件的名稱。 請參閱 CRAN套件
DBFS (不建議) 將 JAR 或 Whl 檔案載入 DBFS 根目錄。 不建議這麼做,因為儲存在 DBFS 中的檔案可由任何工作區使用者修改。

當您在叢集上安裝連結庫時,已連結至該叢集的筆記本將不會立即看到新的連結庫。 您必須啟動新工作階段以檢視筆記本中的新程式庫。

注意

安裝超過 2 小時的程式庫將會標示為失敗。

使用策略安裝函式庫

如果您使用強制執行連結庫安裝的原則建立叢集,則指定的連結庫會自動安裝在叢集上。 您無法安裝其他連結庫或卸載任何連結庫。

工作區管理員可以將程式庫新增至原則,使他們能夠在所有使用該原則的計算資源上管理和強制執行程式庫安裝。 如需系統管理員指示,請參閱 將程式庫新增至政策

從叢集中移除函式庫

注意

當您從叢集卸載連結庫時,只有在重新啟動叢集時,才會移除連結庫。 在您重新啟動叢集之前,卸載程式庫的狀態會顯示為 等待重新啟動的卸載

若要移除函式庫,您可以使用叢集 UI:

  1. 在側邊欄中按下 計算圖示 [計算]
  2. 按一下叢集名稱。
  3. 按下 程式庫 標籤頁。
  4. 選取您要從中卸載資料庫的叢集旁的複選框,按一下 [卸載],然後點擊 確認。 狀態會變更為 卸載等待重新啟動

按兩下 [重新啟動 ] 和 [確認 ] 以卸載連結庫。 程式庫已從叢集的 [程式庫] 索引標籤中移除。

查看叢集上安裝的程式庫

  1. 在側邊欄中按下 計算圖示 [計算]
  2. 按兩下叢集名稱。
  3. 按一下程式庫索引標籤。針對每個程式庫,索引標籤會顯示名稱和版本、類型、安裝狀態,以及如果已上傳的話,來源檔案。

更新叢集安裝的程式庫

若要更新叢集安裝的連結庫,請卸載舊版的連結庫,並安裝新版本。

注意

Requirements.txt檔案不需要卸載和重新啟動。 如果您已修改 requirements.txt 檔案的內容,您可以直接重新安裝它以更新已安裝檔案的內容。