다음을 통해 공유


이벤트 스트림에 레이크하우스 대상 추가

이 문서에서는 Microsoft Fabric 이벤트 스트림의 이벤트 스트림에 레이크하우스를 대상으로 추가하는 방법을 보여 줍니다.

참고 항목

미리 보기에 있는 향상된 기능을 사용하려면 맨 위에 있는 향상된 기능을 선택합니다. 그렇지 않으면 표준 기능을 선택합니다. 미리 보기로 제공되는 향상된 기능에 대한 자세한 내용은 패브릭 이벤트 스트림 소개를 참조 하세요.

Important

레이크하우스 대상 테이블에 데이터를 쓰기 위한 스키마 적용이 있습니다. 테이블에 대한 모든 새 쓰기는 쓰기 시 대상 테이블의 스키마와 호환되어야 하므로 데이터 품질이 보장됩니다.

출력이 새 델타 테이블에 기록되면 첫 번째 레코드를 기반으로 테이블 스키마가 만들어집니다. 출력 데이터의 모든 레코드는 기존 테이블의 스키마에 프로젝팅됩니다.

들어오는 데이터에 기존 테이블 스키마에 없는 열이 있는 경우 테이블에 기록된 데이터에 추가 열이 포함되지 않습니다. 마찬가지로 들어오는 데이터에 기존 테이블 스키마에 있는 열이 없는 경우 누락된 열은 값이 null로 설정된 테이블에 씁니다.

필수 조건

  • 기여자 이상의 권한으로 eventstream이 있는 Fabric 프리미엄 작업 영역에 액세스합니다.
  • 기여자 이상의 권한으로 Lakehouse가 있는 프리미엄 작업 영역에 액세스합니다.

참고 항목

하나의 Eventstream에 대한 최대 원본 및 대상 수는 11개입니다.

레이크하우스를 대상으로 추가

레이크하우스 대상을 기본 또는 파생 이벤트 스트림에 추가하려면 다음 단계를 수행합니다.

  1. 이벤트 스트림에 대한 편집 모드에서 리본에서 대상 추가를 선택하고 드롭다운 목록에서 Lakehouse를 선택합니다.

    Lakehouse가 강조 표시된 대상 추가 드롭다운 목록의 스크린샷

  2. lakehouse 노드를 스트림 노드 또는 연산자에 커넥트.

  3. Lakehouse 구성 화면에서 다음 정보를 완료합니다.

    1. 대상 이름을 입력합니다.
    2. 레이크하우스가 포함된 작업 영역을 선택합니다.
    3. 지정한 작업 영역에서 기존 Lakehouse 를 선택합니다.
    4. 기존 델타 테이블을 선택하거나 데이터를 받을 새 델타 테이블을 만듭니다.
    5. 레이크하우스로 전송되는 입력 데이터 형식 을 선택합니다. 지원되는 데이터 형식은 JSON, Avro 및 CSV(헤더 포함)입니다.

    Lakehouse 구성 화면의 위쪽 부분 스크린샷.

  4. 고급을 선택합니다.

  5. 레이크하우스 대상에는 두 가지 수집 모드를 사용할 수 있습니다. 시나리오에 따라 이러한 모드를 구성하여 패브릭 이벤트 스트림이 Lakehouse에 쓰는 방식을 최적화합니다.

    • 최소 행은 Lakehouse가 단일 파일에서 수집하는 최소 행 수입니다. 최소 행은 1개이고 최대 행은 파일당 2백만 행입니다. 최소 행 수가 적을수록 수집 중에 Lakehouse가 만드는 파일이 더 많아집니다.

    • 최대 기간은 레이크하우스가 단일 파일을 수집하는 데 걸리는 최대 기간 입니다. 최소값은 1분이고 최대값은 2시간입니다. 기간이 길수록 파일에 더 많은 행이 수집됩니다.

    Lakehouse 구성 화면의 고급 섹션 스크린샷

  6. 저장을 선택합니다.

  7. 새로 추가된 레이크하우스 대상을 구현하려면 게시를 선택합니다.

    게시 단추가 강조 표시된 편집 모드의 스트림 및 레이크하우스 대상 스크린샷

이러한 단계를 완료하면 라이브 보기에서 레이크하우스 대상을 시각화할 수 있습니다. 세부 정보 창에서 Notebook 바로 가기에서 최적화 테이블을 선택하여 대상 레이크하우스 테이블 내의 작은 스트리밍 파일을 통합하는 Notebook 내에서 Apache Spark 작업을 시작할 수 있습니다.

라이브 보기의 레이크하우스 대상 및 테이블 최적화 단추 스크린샷

Eventstream에 다른 대상을 추가하는 방법을 알아보려면 다음 문서를 참조하세요.

필수 조건

시작하기 전에 다음 필수 구성 요소를 완료해야 합니다.

  • Eventstream이 있는 기여자 이상의 권한이 있는 프리미엄 작업 영역에 액세스합니다.
  • Lakehouse가 있는 기여자 이상의 권한이 있는 프리미엄 작업 영역에 액세스할 수 있습니다.

참고 항목

하나의 Eventstream에 대한 최대 원본 및 대상 수는 11개입니다.

레이크하우스를 대상으로 추가

작업 영역에서 레이크하우스를 만든 경우 다음 단계에 따라 이벤트 스트림에 레이크하우스를 대상으로 추가합니다.

  1. 리본에서 새 대상을 선택하거나 기본 편집기 캔버스에서 "+"를 선택한 다음, Lakehouse를 선택합니다. Lakehouse 대상 구성 화면이 나타납니다.

  2. 이벤트 스트림 대상의 이름을 입력하고 Lakehouse에 대한 정보를 완료합니다.

    Lakehouse 대상 구성 화면의 스크린샷.

    1. 레이크하우스: 지정한 작업 영역에서 기존 레이크하우스를 선택합니다.

    2. 델타 테이블: 기존 델타 테이블을 선택하거나 데이터를 받을 새 델타 테이블을 만듭니다.

      참고 항목

      레이크 하우스 테이블에 데이터를 쓸 때 스키마 적용있습니다. 즉, 테이블에 대한 모든 새 쓰기는 쓰기 시 대상 테이블의 스키마와 호환되어야 하므로 데이터 품질이 보장됩니다.

      출력 데이터의 모든 레코드는 기존 테이블의 스키마에 프로젝팅됩니다. 출력을 새 델타 테이블에 쓸 때 첫 번째 레코드를 기반으로 테이블 스키마가 만들어집니다. 들어오는 데이터에 기존 테이블 스키마에 비해 추가 열이 있는 경우 추가 열을 포함하지 않고 테이블에 씁니다. 반대로 들어오는 데이터에 기존 테이블 스키마에 비해 열이 누락된 경우 열 값이 null로 설정된 테이블에 씁니다.

    3. 입력 데이터 형식: 레이크하우스로 전송되는 데이터(입력 데이터)의 형식을 선택합니다.

      참고 항목

      지원되는 입력 이벤트 데이터 형식은 JSON, Avro 및 CSV(헤더 포함)입니다.

    4. 이벤트 처리: 이벤트 처리 편집기를 사용하여 레이크하우스로 보내기 전에 데이터를 처리하는 방법을 지정할 수 있습니다. 이벤트 프로세서 열기를 선택하여 이벤트 처리 편집기를 엽니다. 이벤트 프로세서를 사용한 실시간 처리에 대한 자세한 내용은 이벤트 프로세서 편집기를 사용하여 이벤트 데이터 처리를 참조 하세요. 편집기를 마쳤으면 완료를 선택하여 Lakehouse 대상 구성 화면으로 돌아갑니다.

      이벤트 프로세서 편집기를 보여 주는 스크린샷

  3. 레이크하우스 대상에는 두 가지 수집 모드를 사용할 수 있습니다. 이러한 모드 중 하나를 선택하여 패브릭 이벤트 스트림 기능이 시나리오에 따라 Lakehouse에 쓰는 방법을 최적화합니다.

    1. 파일 당 행 – Lakehouse가 단일 파일에서 수집하는 최소 행 수입니다. 최소 행 수가 적을수록 수집 중에 Lakehouse가 만드는 파일이 더 많아집니다. 최소 행은 1행입니다. 최대 파일당 2M 행입니다.

    2. 기간 – Lakehouse에서 단일 파일을 수집하는 데 걸리는 최대 기간입니다. 기간이 길수록 파일에 더 많은 행이 수집됩니다. 최소는 1분, 최대값은 2시간입니다.

      수집 모드를 보여 주는 스크린샷

  4. 추가를 선택하여 레이크하우스 대상을 추가합니다.

  5. 레이크하우스 대상 내에서 사용할 수 있는 테이블 최적화 바로 가기입니다. 이 솔루션은 Notebook 내에서 Spark 작업을 시작하여 대상 Lakehouse 테이블 내에서 이러한 작은 스트리밍 파일을 통합하여 쉽게 수행할 수 있습니다.

    테이블 최적화 설정을 보여 주는 스크린샷

  6. 캔버스에 회전하는 상태 표시기가 있는 레이크하우스 대상이 나타납니다. 시스템에서 상태 활성으로 변경하는 데 몇 분 정도 걸립니다.

    레이크하우스 대상을 보여 주는 스크린샷.

대상 관리

편집/제거: 탐색 창 또는 캔버스를 통해 이벤트 스트림 대상을 편집하거나 제거할 수 있습니다.

편집을 선택하면 편집 창이 기본 편집기의 오른쪽에 열립니다. 이벤트 프로세서 편집기를 통해 이벤트 변환 논리를 포함하여 원하는 대로 구성을 수정할 수 있습니다.

캔버스에서 대상에 대한 수정 및 삭제 옵션을 선택할 위치를 보여 주는 스크린샷

Eventstream에 다른 대상을 추가하는 방법을 알아보려면 다음 문서를 참조하세요.