管理整合執行階段

已完成

在 Data Factory 中,活動可定義要執行的動作。 連結服務可定義目標資料存放區或計算服務。 整合執行階段提供活動與連結服務之間的基礎結構。

Integration Runtime 會提供參考給連結服務或活動,並提供可在其中執行活動或從中分派活動的計算環境。 如此一來,就能在最接近目標資料存放區或計算服務的區域執行活動,效率最高,又滿足安全性和合規性需求。

簡單來說,Integration Runtime (IR) 是 Azure Data Factory 所使用的計算基礎結構。 IR 可橫跨不同的網路環境提供下列資料整合功能,包括:

  • 資料流程:在受控的 Azure 計算環境中執行資料流程。
  • 資料移動:在公用網路中的資料存放區與私人網路 (內部部署或虛擬私人網路) 中的資料存放區之間複製資料。 可支援內建的連接器、格式轉換、資料行對應,以及高效能和可調式資料轉送。
  • 活動分派:分派和監視在 Azure Databricks、Azure HDInsight、Azure Machine Learning、Azure SQL Database、SQL Server 等各種計算服務上執行的轉換活動。
  • SSIS 套件執行:在受控 Azure 計算環境中,以原生方式執行 SQL Server Integration Services (SSIS) 套件。

每當建立 Azure Data Factory 執行個體時,就會建立預設的 Integration Runtime 階段環境,來支援在公用網路中的雲端資料存放區和計算服務上的作業。 當整合執行階段設定為「自動解析」時,可以檢視此情況

整合執行階段類型

Data Factory 提供三種整合執行階段,建議選擇最符合所需之資料整合功能和網路環境需求的類型。 這三種類型為:

  • Azure
  • 自我裝載
  • Azure-SSIS

您可以在 connectVia 屬性中明確定義 Integration Runtime 階段設定,如果未定義,則會使用預設的 Integration Runtime,並將屬性設定為「自動解析」。

下表描述每個整合執行階段類型的功能和網路支援:

IR 類型 公用網路 私人網路
Azure 資料流程 資料流程
資料移動 資料移動
活動分派 活動分派
自我裝載 資料移動 資料移動
活動分派 活動分派
Azure-SSIS SSIS 封裝執行 SSIS 封裝執行

決定要使用的整合執行階段

有許多因素會影響您要使用的 Integration Runtime。 以下指南可協助您選取正確的 IR

複製活動

對於複製活動,需要來源和接收連結服務來定義資料流程的方向。 下列邏輯可決定使用哪個整合執行階段執行個體來執行複製:

  • 在兩個雲端資料來源之間複製:當來源和接收連結服務皆使用 Azure IR 時,ADF 將會在您已指定區域 Azure IR 時使用該 IR,或在您選擇自動解析 IR (預設值) 時自動判斷 Azure IR 的位置,如整合執行階段位置一節所說明。

  • 在雲端資料來源與私人網路中的資料來源之間複製:如果任一來源或接收連結服務指向自我裝載 IR,則會在自我裝載整合執行階段上執行複製活動。

  • 在私人網路中的兩個資料來源之間複製:來源和接收連結服務必須指向相同的整合執行階段執行個體,而該整合執行階段會用來執行複製活動。

查閱和 GetMetadata 活動

查閱和 GetMetadata 的活動會在與資料存放區連結服務相關聯的整合執行階段上執行。

轉換活動

每個轉換活動都有一個指向整合執行階段的目標計算「連結服務」。 轉換活動就是從這個整合執行階段執行個體分派而來。

資料流程活動

資料流程活動會在與其相關聯的整合執行時間上執行。