建立 Azure Databricks 的連結服務

已完成

若要在 Azure Databricks 工作區中執行 Notebook,Azure Data Factory 管線必須能夠連線到工作區;這需要驗證。 若要啟用此已驗證的連線,您必須執行兩個設定工作:

  1. 為您的 Azure Databricks 工作區產生存取權杖
  2. 在Azure Data Factory資源中建立連結的服務,該資源會使用存取權杖來連線到 Azure Databricks。

產生存取權杖

存取權杖會提供 Azure Databricks 的驗證方法,以替代使用者名稱和密碼形式的認證。 您可以為應用程式產生存取權杖,並指定到期期限,之後必須在用戶端應用程式中重新產生和更新權杖。

若要建立存取權杖,請在 Azure Databricks 入口網站 [使用者設定] 頁面,使用 [開發人員] 索引標籤上的 [產生新權杖] 選項。

A screenshot of the Access tokens tab in the User Settings page in the Azure Databricks portal.

建立連結服務

若要從 Azure Data Factory 連線到 Azure Databricks,您必須建立 Azure Databricks 計算的連結服務。 您可以在 Azure Data Factory Studio 的 [管理] 區段中的 [連結服務] 頁面中建立連結服務

A screenshot of the New linked service wizard in Azure Data Factory Studio.

當您建立 Azure Databricks 連結服務時,您必須指定下列組態設定:

設定 描述
Name 連結服務的唯一名稱
描述 有意義的描述
整合執行階段 用來在此連結服務中執行活動的整合執行時間。 如需詳細資訊,請參閱 Azure Data Factory 中的整合執行階段
Azure 訂用帳戶 佈建 Azure Databricks 所在的 Azure 訂用帳戶
Databricks 工作區 Azure Databricks 工作區
Cluster 將執行活動程式碼的 Spark 叢集。 您可以讓 Azure Databricks 視需要動態佈建作業叢集,也可以指定工作區中的現有叢集。
驗證類型 Azure Databricks 驗證連結連線的方式。 例如,使用存取權杖 (在此情況下,您必須指定您為工作區產生的存取權杖)。
叢集組態 Databricks 執行階段版本、Python 版本、背景工作節點類型和叢集的背景工作節點數目。