共用方式為


將 Spark 連結庫從 Azure Synapse 遷移至 Fabric

Azure Synapse Spark 集區提供不同的摘要和自定義連結庫選項。 在 Fabric 中,每個運行時間都會隨附一組預安裝的連結庫(內建連結庫)。 不過,根據您的案例和特定需求,您也可以使用 環境連結庫內嵌連結庫來包含其他連結庫。 若要將 Azure Synapse Spark 集區連結庫移至 Fabric,請使用環境連結庫。

如需Spark連結庫考慮,請參閱 Azure Synapse Spark 與 Fabric 之間的差異。

必要條件

  • 如果您還沒有網狀架構工作區,請在租使用者中建立 Fabric 工作區
  • 如果您還沒有環境,請在工作區中建立 環境

選項 1:將 Spark 連結庫新增至自定義環境

您可以將 Spark 集區連結庫移至環境,如下所示:

  1. 開啟 Synapse Studio:登入 Azure。 流覽至您的 Azure Synapse 工作區,然後開啟 Synapse Studio。
  2. 找出 Spark 連結庫
    • 移至 [ 管理 ] 區域,然後選取 [Apache Spark 集區]。
    • 尋找 Apache Spark 集區,選取 [套件 ],然後找出集區的 Spark 連結庫。
  3. 取得 Spark 連結庫:找出集區中安裝的requirements.txt、environment.yml或工作區套件。 取得集區上已安裝的連結庫清單。
  4. 擁有 Spark 連結庫之後,請將自訂 Spark 連結庫新增至 Fabric 中的環境。 在您的 環境中,移至 [ 連結庫 ] 並新增連結庫:
    • 您可以從 公用連結庫 上傳.yml檔案。 您也可以使用 PyPI 和 Conda 來安裝連結庫。
    • 自定義連結庫, 您可以使用 .jar/.whl/.tar.gz 檔案來安裝連結庫。
  5. 按兩下 [ 儲存發佈 變更]。

顯示 Spark 連結庫的螢幕快照。

深入瞭解將Spark連結庫新增至 環境

注意

請注意,連結庫安裝可能需要一些時間。