練習 - 管理自我裝載整合執行階段

已完成

在 Data Factory 中,活動可定義要執行的動作。 連結服務可定義目標資料存放區或計算服務。 整合執行階段提供活動與連結服務之間的橋樑。

自我裝載整合執行階段

自我裝載整合執行階段能夠:

  • 在雲端資料存放區和私人網路中的資料存放區之間執行複製活動。
  • 在內部部署或 Azure 虛擬網路中,針對計算資源分派下列轉換活動:
    • HDInsight Hive 活動 (BYOC - 自攜叢集)
    • HDInsight Pig 活動 (BYOC)
    • HDInsight MapReduce 活動 (BYOC)
    • HDInsight Spark 活動 (BYOC)
    • HDInsight Streaming 活動 (BYOC)
    • Machine Learning 批次執行活動
    • Machine Learning 更新資源活動
    • 預存程序活動
    • Data Lake Analytics U-SQL 活動
    • 自訂活動 (在 Azure Batch 上執行)
    • 查閱活動
    • 取得中繼資料活動。

自我裝載整合執行階段在邏輯上會向 Azure Data Factory 註冊,而用來支援其功能的計算資源由您提供。 因此,自我裝載 IR 沒有明確的位置屬性。 用來執行資料移動時,自我裝載 IR 會從來源取出資料,並將其寫入目的地。

在 Azure Data Factory 內建立自我裝載整合執行階段

  1. 在 Azure Data Factory UI 的 [讓我們開始吧] 頁面上,從最左邊窗格中選取 [管理],然後選取 [整合執行階段]。 選取 + 新增。

    Create an integration runtime

  2. 在 [整合執行階段設定] 頁面上,選取 [Azure]、[自我裝載],然後選取 [繼續]。

    Create a selfhosted IR

  3. 在 [整合執行階段設定] 頁面上,鍵入 MySelfHostedIR 的名稱,然後按一下 [建立]

    Integration runtime setup

  4. 複製並貼上驗證金鑰。 選取 [下載] 並安裝整合執行階段。

    Integration runtime setup keys

  5. 在本機 Windows 電腦下載自我裝載整合執行階段。 執行安裝程式。

  6. 在 [註冊 Integration Runtime (自我裝載)] 頁面上,貼上您先前儲存的金鑰,然後選取 [註冊]。

    Register the integration runtime

  7. 在 [新增 Integration Runtime (自我裝載) 節點] 頁面上,選取 [完成]。

  8. 在自我裝載整合執行階段註冊成功之後,您會看到下列視窗:

    Successful registration

自動部署

您也可以透過 Azure Resource Manager 範本,或使用 PowerShell,在 Azure VM 上設定自我裝載 IR

  1. 在 PowerShell 中執行下列命令

    Set-AzDataFactoryV2IntegrationRuntime -ResourceGroupName $resourceGroupName -DataFactoryName $dataFactoryName -Name $selfHostedIntegrationRuntimeName -Type SelfHosted -Description "selfhosted IR description"
    
  2. 在本機電腦下載並安裝自我裝載整合執行階段。

  3. 擷取驗證金鑰,並使用該金鑰註冊自我裝載整合執行階段。 以下是 PowerShell 範例:

    Get-AzDataFactoryV2IntegrationRuntimeKey -ResourceGroupName $resourceGroupName -DataFactoryName $dataFactoryName -Name $selfHostedIntegrationRuntimeName