共用方式為


Spark 中的程式庫管理

重要

此功能目前為預覽功能。 適用於 Microsoft Azure 預覽版的補充使用規定包含適用於 Beta 版、預覽版或尚未發行至正式運作之 Azure 功能的更合法條款。 如需此特定預覽的相關信息,請參閱 AKS 預覽資訊的 Azure HDInsight。 如需問題或功能建議,請在 AskHDInsight提交要求,並提供詳細數據,並遵循我們在 Azure HDInsight 社群取得更多更新。

連結庫管理的目的是讓開放原始碼或自定義程式代碼可供叢集上執行的筆記本和作業使用。 您可以從 PyPI 存放庫上傳 Python 連結庫。 本文著重於管理叢集 UI 中的連結庫。 AKS 上的 Azure HDInsight 已包含叢集中的許多常見連結庫。 若要查看 AKS 叢集上的 HDI 中包含哪些連結庫,請檢閱連結庫管理頁面。

安裝程式庫

您可以透過兩種模式安裝連結庫:

  • 叢集安裝
  • 筆記本範圍

已安裝叢集

在叢集上執行的所有筆記本都可以使用叢集連結庫。 您可以直接從公用存放庫安裝叢集連結庫,例如 PyPi。 從 Maven 存放庫上傳,從雲端記憶體上傳自定義連結庫位於藍圖中。

顯示叢集已安裝連結庫管理員頁面的螢幕快照。

筆記本範圍

適用於 Python 和 Scala 的筆記本範圍連結庫,可讓您安裝連結庫,並建立範圍設定為筆記本會話的環境。 這些連結庫不會影響在相同叢集上執行的其他筆記本。 筆記本範圍的連結庫不會保存,而且必須針對每個會話重新安裝。

注意

當您需要特定筆記本的自定義環境時,請使用筆記本範圍的連結庫。

連結庫安裝模式

PyPI:藉由在安裝 UI 中提及連結庫名稱和版本,從 開放原始碼 PyPI 存放庫擷取連結庫。

檢視已安裝的連結庫

  1. 從 [概觀] 頁面,流覽至 [連結庫管理員]。

    顯示連結庫管理員頁面的螢幕快照。

  2. 從Spark叢集管理員,按兩下 [連結庫管理員]。

  3. 您可以從這裡檢視已安裝的連結庫清單。

    顯示如何檢視已安裝連結庫的螢幕快照。

新增連結庫小工具

PyPI

  1. 從 [PyPI] 索引標籤中,輸入 [套件名稱] 和 [套件版本]。

  2. 按一下 [安裝]

    顯示如何安裝 PyPI 的螢幕快照。

卸載連結庫

如果您決定不再使用連結庫,您可以透過連結庫管理頁面中的 [卸載] 按鈕輕鬆地刪除連結庫套件。

  1. 選取並按下連結庫名稱

    顯示如何選取連結庫的螢幕快照。

  2. 點選小工具中的 [ 卸載 ]

    顯示如何卸載連結庫的螢幕快照。

    注意

    • 從 Jupyter Notebook 安裝的套件只能從 Jupyter Notebook 中刪除。
    • 從連結庫管理員安裝的套件只能從連結庫管理員卸載。
    • 若要升級連結庫/套件,請卸載目前版本的連結庫,並安裝所需的連結庫版本。
    • 從 Jupyter Notebook 安裝連結庫特別適用於會話。 它不是持續性的。
    • 安裝繁重的套件可能需要一些時間,因為其大小和複雜度。