연습 - 자체 호스팅 통합 런타임 관리

완료됨

Data Factory에서 작업은 수행할 작업을 정의합니다. 연결된 서비스는 대상 데이터 저장소 또는 컴퓨팅 서비스를 정의합니다. 통합 런타임은 작업과 연결된 서비스 간의 브리지를 제공합니다.

자체 호스팅 통합 런타임

자체 호스팅 통합 런타임은 다음을 수행할 수 있습니다.

  • 클라우드 데이터 저장소와 개인 네트워크의 데이터 저장소 간에 복사 작업을 실행.
  • 온-프레미스 또는 Azure Virtual Network의 컴퓨팅 리소스에 대해 다음과 같은 변환 작업을 디스패치합니다.
    • HDInsight Hive 작업(BYOC-Bring Your Own Cluster)
    • HDInsight Pig 작업(BYOC)
    • HDInsight MapReduce 작업(BYOC)
    • HDInsight Spark 작업(BYOC)
    • HDInsight 스트리밍 작업 (BYOC)
    • Machine Learning Batch Execution 작업
    • Machine Learning 업데이트 리소스 작업
    • 저장 프로시저 작업
    • Data Lake Analytics U-SQL 작업
    • 사용자 지정 작업(Azure Batch에서 실행)
    • 조회 작업
    • 메타데이터 가져오기 작업.

자체 호스팅 통합 런타임은 Azure Data Factory 및 사용자가 제공한 기능을 지원하는 데 사용되는 컴퓨팅 리소스에 논리적으로 등록됩니다. 따라서 자체 호스팅 IR에 대한 명시적 위치 속성은 없습니다. 데이터 이동을 수행하기 위해 사용하는 경우 자체 호스팅 IR은 소스에서 데이터를 추출하고 대상에 씁니다.

Azure Data Factory에서 자체 호스팅 Integration Runtime 생성

  1. Azure Data Factory UI의 시작하기 페이지의 맨 왼쪽 창에서 관리를 선택하고 통합 런타임을 선택합니다. +새로 생성를 선택합니다.

    Create an integration runtime

  2. IR 설치 페이지에서 Azure, 자체 호스트를 차례로 선택하고 계속을 선택합니다.

    Create a selfhosted IR

  3. IR 설치 페이지에서 이름으로 MySelfHostedIR을 입력하고 생성를 클릭합니다.

    Integration runtime setup

  4. 인증 키를 복사하여 붙여넣습니다. 다운로드를 선택하고 통합 런타임을 설치합니다.

    Integration runtime setup keys

  5. 로컬 Windows 컴퓨터에 자체 호스팅된 통합 런타임을 다운로드합니다. 설치 관리자를 실행합니다.

  6. Integration Runtime(자체 호스팅) 등록 페이지에서 이전에 저장한 키를 붙여넣고 등록을 선택합니다.

    Register the integration runtime

  7. 새 통합 런타임(자체 호스팅) 노드 페이지에서 마침을 선택합니다.

  8. 자체 호스팅 통합 런타임이 성공적으로 등록되면 다음 창이 표시됩니다.

    Successful registration

자동 배포

Azure Resource Manager 템플릿을 통해 또는 PowerShell을 사용하여 Azure VM에서 자체 호스팅 IR을 설정할 수도 있습니다.

  1. PowerShell에서 다음 명령을 실행합니다.

    Set-AzDataFactoryV2IntegrationRuntime -ResourceGroupName $resourceGroupName -DataFactoryName $dataFactoryName -Name $selfHostedIntegrationRuntimeName -Type SelfHosted -Description "selfhosted IR description"
    
  2. 로컬 컴퓨터에서 자체 호스팅 통합 런타임을 다운로드하여 설치합니다.

  3. 인증 키를 검색한 다음 해당 키를 사용하여 자체 호스팅 통합 런타임을 등록합니다. 다음은 PowerShell 예제입니다.

    Get-AzDataFactoryV2IntegrationRuntimeKey -ResourceGroupName $resourceGroupName -DataFactoryName $dataFactoryName -Name $selfHostedIntegrationRuntimeName