다음을 통해 공유


빠른 시작: 복사 작업을 사용하여 전용 SQL 풀에 데이터 로드

Azure Synapse Analytics는 데이터를 수집, 변환, 모델링 및 분석하는 데 도움이 되는 다양한 분석 엔진을 제공합니다. 전용 SQL 풀은 T-SQL 기반 컴퓨팅 및 스토리지 기능을 제공합니다. Synapse 작업 영역에서 전용 SQL 풀을 만든 후 더 빠른 분석 인사이트를 위해 데이터를 로드, 모델링, 처리 및 제공할 수 있습니다.

이 빠른 시작에서는 Azure SQL Database에서 Azure Synapse Analytics로 데이터를 로드하는 방법을 알아봅니다. 다른 데이터 저장소 유형에서 데이터를 복사할 때도 이와 유사한 단계를 따를 수 있습니다. 이 유사한 흐름은 다른 원본 및 싱크의 데이터 복사에도 적용됩니다.

필수 조건

  • Azure 구독: Azure 구독이 없는 경우 시작하기 전에 무료 Azure 계정을 만듭니다.
  • Azure Synapse 작업 영역: 빠른 시작: Synapse 작업 영역 만들기의 지침에 따라 Azure Portal을 사용하여 Synapse 작업 영역을 만듭니다.
  • Azure SQL Database: 이 자습서는 Azure SQL Database의 Adventure Works LT 샘플 데이터 세트에서 데이터를 복사합니다. Azure SQL Database에서 샘플 데이터베이스 만들기의 지침에 따라 SQL Database에서 이 샘플 데이터베이스를 만들 수 있습니다. 또는 유사한 단계를 수행하여 다른 데이터 저장소를 사용할 수 있습니다.
  • Azure Storage 계정: Azure Storage는 복사 작업의 준비 영역으로 사용됩니다. Azure Storage 계정이 없는 경우 스토리지 계정 만들기의 지침을 참조하세요.
  • Azure Synapse Analytics: 전용 SQL 풀을 싱크 데이터 저장소로 사용합니다. Azure Synapse Analytics 인스턴스가 없는 경우 만드는 단계는 전용 SQL 풀 만들기 를 참조하세요.

Synapse 작업 영역을 만든 후 Synapse Studio를 여는 두 가지 방법이 있습니다.

  • Azure Portal에서 Synapse 작업 영역을 엽니다. 시작하기 아래의 Synapse Studio 열기 카드에서 열기를 선택합니다.
  • Azure Synapse Analytics를 열고 작업 영역에 로그인합니다.

이 빠른 시작에서는 "adftest2020"이라는 작업 영역을 예로 사용합니다. 자동으로 Synapse Studio 홈페이지로 이동합니다.

Synapse Studio 홈페이지

연결된 서비스 만들기

Azure Synapse Analytics에서 연결된 서비스는 다른 서비스에 대한 연결 정보를 정의하는 위치입니다. 이 섹션에서는 Azure SQL Database 및 Azure Data Lake Storage Gen2(ADLS Gen2) 연결된 서비스라는 두 가지 종류의 연결된 서비스를 만듭니다.

  1. Synapse Studio 홈페이지의 왼쪽 탐색 영역에서 관리 탭을 선택합니다.

  2. 외부 연결에서 연결된 서비스를 선택합니다.

    새 연결된 서비스 만들기

  3. 연결된 서비스를 추가하려면 새로 만들기를 선택합니다.

  4. 갤러리에서 Azure SQL Database를 선택한 다음, 계속을 선택합니다. 검색 상자에 "sql"을 입력하여 커넥터를 필터링할 수 있습니다.

    새 Azure SQL Database 연결된 서비스 만들기

  5. 새 연결된 서비스 페이지의 드롭다운 목록에서 서버 이름 및 DB 이름을 선택하고 사용자 이름 및 암호를 지정합니다. 연결 테스트를 클릭하여 설정의 유효성을 검사한 다음 만들기를 선택합니다.

    Azure SQL Database 연결된 서비스 구성

  6. 3-4단계를 반복하지만 갤러리에서 대신 Azure Data Lake Storage Gen2 를 선택합니다. 새 연결된 서비스 페이지의 드롭다운 목록에서 스토리지 계정 이름을 선택합니다. 연결 테스트를 클릭하여 설정의 유효성을 검사한 다음 만들기를 선택합니다.

    Azure Data Lake Storage Gen2 구성

파이프라인 만들기

파이프라인에는 활동 집합을 실행하기 위한 논리적 흐름이 포함됩니다. 이 섹션에서는 Azure SQL Database에서 전용 SQL 풀로 데이터를 수집하는 복사 작업이 포함된 파이프라인을 만듭니다.

  1. 통합 탭으로 이동합니다. 파이프라인 헤더 옆에 있는 더하기 아이콘을 선택하고 파이프라인을 선택합니다.

    새 파이프라인 만들기

  2. 작업 창의 이동 및 변환 아래에서 데이터 복사를 파이프라인 캔버스로 끕니다.

  3. 복사 작업을 선택하고 원본 탭으로 이동합니다. 새로 만들기를 선택하여 새 원본 데이터 세트를 만듭니다.

    원본 데이터 세트 만들기

  4. 데이터 저장소로 Azure SQL Database 를 선택하고 계속을 선택합니다.

  5. 속성 설정 창에서 이전 단계에서 만든 Azure SQL Database 연결된 서비스를 선택합니다.

  6. 테이블 이름 아래에서 다음 복사 작업에서 사용할 샘플 테이블을 선택합니다. 이 빠른 시작에서는 "SalesLT.Customer" 테이블을 예로 사용합니다.

    원본 데이터 세트 속성 설정

  7. 완료되면 확인을 선택합니다.

  8. 복사 작업을 선택하고 싱크 탭으로 이동합니다. 새로 만들기를 선택하여 새 싱크 데이터 세트를 만듭니다.

  9. 데이터 저장소로 Azure Synapse 전용 SQL 풀 을 선택하고 계속을 선택합니다.

  10. 속성 설정 창에서 이전 단계에서 만든 SQL Analytics 풀을 선택합니다. 기존 테이블에 쓰는 경우 테이블 이름 아래에서 드롭다운에서 선택합니다. 그렇지 않으면 "편집"을 선택하고 새 테이블 이름을 입력합니다. 완료되면 확인을 선택합니다.

  11. 싱크 데이터 세트 설정의 경우 테이블 옵션 필드에서 테이블 자동 만들기 를 사용하도록 설정합니다.

    자동 만들기 사용

  12. 설정 페이지에서 스테이징 사용 확인란을 선택합니다. 이 옵션은 원본 데이터가 PolyBase와 호환되지 않는 경우에 적용됩니다. 스테이징 설정 섹션에서 이전 단계에서 만든 Azure Data Lake Storage Gen2 연결된 서비스를 스테이징 스토리지로 선택합니다.

    스토리지는 PolyBase를 사용하여 Azure Synapse Analytics에 로드하기 전에 데이터를 준비하는 데 사용됩니다. 복사가 완료되면 Azure Data Lake Storage Gen2의 중간 데이터가 자동으로 정리됩니다.

    스테이징 활성화

  13. 파이프라인의 유효성을 검사하려면 도구 모음에서 유효성 검사를 선택합니다. 페이지 오른쪽에 파이프라인 유효성 검사 출력의 결과가 표시됩니다.

파이프라인 디버그 및 게시

파이프라인 구성이 완료되면 아티팩트를 게시하기 전에 디버그 실행을 실행하여 모든 것이 올바른지 확인할 수 있습니다.

  1. 파이프라인을 디버그하려면 도구 모음에서 디버그를 선택합니다. 창의 아래쪽에 있는 출력 탭에서 파이프라인 실행 상태가 표시됩니다.

    파이프라인 디버그

  2. 파이프라인 실행이 성공하면 위쪽 도구 모음에서 모두 게시를 선택합니다. 이 작업은 만든 엔터티(데이터 세트 및 파이프라인)를 Synapse Analytics 서비스에 게시합니다.

  3. 성공적으로 게시된 메시지가 표시될 때까지 기다립니다. 알림 메시지를 보려면 오른쪽 위에 있는 벨 단추를 선택합니다.

파이프라인을 작동시키고 모니터링하기

이 섹션에서는 이전 단계에서 게시된 파이프라인을 수동으로 트리거합니다.

  1. 도구 모음에서 트리거 추가를 선택한 다음, 지금 트리거를 선택합니다. 파이프라인 실행 페이지에서 확인을 선택합니다.

  2. 왼쪽 사이드바에 있는 모니터 탭으로 이동합니다. 수동 트리거로 트리거되는 파이프라인 실행이 표시됩니다.

  3. 파이프라인 실행이 성공적으로 완료되면 파이프라인 이름 열 아래의 링크를 선택하여 활동 실행 세부 정보를 보거나 파이프라인을 다시 실행합니다. 이 예제에서는 활동이 하나뿐이므로 목록에 하나의 항목만 표시됩니다.

  4. 복사 작업에 대한 자세한 내용을 보려면 작업 이름 열 아래의 세부 정보 링크(안경 아이콘)를 선택합니다. 원본에서 싱크로 복사된 데이터 양, 데이터 처리량, 해당 기간의 실행 단계 및 사용된 구성과 같은 세부 정보를 모니터링할 수 있습니다.

    활동 세부 정보

  5. 파이프라인 실행 보기로 다시 전환하려면 위쪽에서 모든 파이프라인 실행 링크를 선택합니다. 새로 고침을 선택하여 목록을 새로 고칩니다.

  6. 데이터가 전용 SQL 풀에 올바르게 기록되었는지 확인합니다.

다음 단계

Azure Synapse Analytics 지원에 대해 알아보려면 다음 문서로 계속 진행하세요.