패브릭 레이크하우스로 데이터를 가져오는 옵션

데이터 가져오기 환경은 다음과 같이 레이크하우스로 데이터를 가져오기 위한 모든 사용자 시나리오를 다룹니다.

  • 기존 SQL Server에 커넥트 레이크하우스의 Delta 테이블에 데이터를 복사합니다.
  • 컴퓨터에서 파일 업로드
  • 다른 레이크하우스에서 여러 테이블을 복사하여 새 델타 테이블로 병합합니다.
  • 레이크하우스에 데이터를 배치하기 위해 스트리밍 원본에 커넥트.
  • 다른 내부 레이크하우스 또는 외부 원본에서 데이터를 복사하지 않고 데이터를 참조합니다.

레이크하우스에 데이터를 로드하는 다양한 방법

Microsoft Fabric에서는 레이크하우스로 데이터를 가져올 수 있는 몇 가지 방법이 있습니다.

  • 로컬 컴퓨터에서 파일 업로드
  • 파이프라인에서 복사 도구 실행
  • 데이터 흐름 설정
  • Notebook 코드의 Apache Spark 라이브러리

로컬 파일 업로드

로컬 컴퓨터에 저장된 데이터를 업로드할 수도 있습니다. 레이크하우스 탐색기에서 직접 수행할 수 있습니다.

Screenshot of file upload dialog in the Lakehouse explorer.

파이프라인의 복사 도구

복사 도구는 확장성이 뛰어난 데이터 통합 솔루션으로, 다른 데이터 원본에 연결하고 데이터를 원래 형식으로 로드하거나 델타 테이블로 변환할 수 있습니다. 복사 도구는 이벤트를 기반으로 예약 또는 트리거하는 등 여러 가지 방법으로 수정할 수 있는 파이프라인 작업의 일부입니다. 자세한 내용은 복사 작업을 사용하여 데이터를 복사하는 방법을 참조하세요.

데이터 흐름

Power BI 데이터 흐름에 익숙한 사용자의 경우 레이크하우스에 데이터를 로드하는 데 동일한 도구를 사용할 수 있습니다. Lakehouse 탐색기 "데이터 가져오기" 옵션에서 빠르게 액세스하고 200개가 넘는 커넥터에서 데이터를 로드할 수 있습니다. 자세한 내용은 빠른 시작: 데이터를 가져와서 변환하는 첫 번째 데이터 흐름 만들기를 참조하세요.

Notebook 코드

사용 가능한 Spark 라이브러리를 사용하여 데이터 원본에 직접 연결하고, 데이터 프레임에 데이터를 로드한 다음, 레이크하우스에 저장할 수 있습니다. 이 메서드는 사용자 코드가 완전히 관리하는 Lakehouse에서 데이터를 로드하는 가장 개방적인 방법입니다.

참고 항목

Spark 코드로 만든 외부 델타 테이블은 SQL 분석 엔드포인트에 표시되지 않습니다. 테이블 공간의 바로 가기를 사용하여 SQL 분석 엔드포인트에 외부 델타 테이블을 표시합니다.

데이터 로드 방법 선택 시 고려 사항

사용 사례 권장
로컬 컴퓨터에서 작은 파일 업로드 로컬 파일 업로드 사용
작은 데이터 또는 특정 커넥터 데이터 흐름 사용
큰 데이터 원본 파이프라인에서 복사 도구 사용
복잡한 데이터 변환 Notebook 코드 사용