다음을 통해 공유


Microsoft Fabric에서 레이크하우스란 무엇입니까?

Microsoft Fabric 레이크하우스는 데이터 레이크의 확장성과 데이터 웨어하우스의 쿼리 기능을 결합합니다. 구조화된 데이터와 비구조화 데이터를 단일 위치에 저장하고, Delta Lake로 관리하며, 데이터 이동 없이 Apache Spark와 SQL을 사용하여 분석합니다. OneLake 바로 가기테넌트 간 데이터 공유를 사용하면 중복 없이 외부 원본 및 기타 조직에서 제어되는 데이터에 액세스할 수도 있습니다.

레이크하우스는 다음을 제공합니다.

  • 데이터 엔지니어링 및 분석 워크로드 모두에 대한 데이터 복사본 1
  • ACID 트랜잭션, 스키마 적용 및 시간 이동에 대한 Delta Lake 형식
  • Spark 및 SQL 액세스를 통해 데이터 엔지니어는 노트북을 사용하고 분석가는 T-SQL을 사용합니다.
  • Power BI, 파이프라인, 데이터 흐름 및 기타 Fabric 항목과의 내장 통합

레이크하우스 vs 데이터 웨어하우스

Microsoft Fabric 레이크하우스와 데이터 웨어하우스 간의 주요 차이점은 선호하는 개발 도구, 데이터 형식 및 워크로드 패턴에 따라 다릅니다. 둘 다 동일한 SQL 엔진을 공유하고 OneLake에서 델타 형식으로 데이터를 저장하지만 다른 시나리오를 위해 설계되었습니다.

Lakehouse 데이터 웨어하우스
기본 개발 도구 Apache Spark(Python, Scala, SQL, R) T-SQL
데이터 형식 구조화 및 비정형 구조적
다중 테이블 트랜잭션 아니오
데이터 수집 노트북, 파이프라인, 데이터 흐름, OneLake 바로 가기 (복사 없이 라이브 액세스) T-SQL(COPY INTO, INSERT, CTAS), 파이프라인
에 적합한 데이터 엔지니어링, 데이터 과학, 메달리온 아키텍처 BI 보고서, 차원 모델링, SQL 중심 팀

동일한 작업 공간에서 둘 다 사용할 수 있습니다. 예를 들어, 레이크하우스에서 Spark를 사용하여 데이터를 적재하고 변환한 다음, 큐레이팅된 데이터 세트를 SQL 기반 보고를 위해 웨어하우스로 제공할 수 있습니다. 자세한 지침은 웨어하우스와 레이크하우스 중에서 선택하세요.

Lakehouse 데이터 작업하기

여러 Fabric 도구를 통해 레이크하우스에서 데이터를 로드, 변환 및 쿼리할 수 있습니다.

수집 옵션에 대한 전체 비교는 Fabric Lakehouse로 데이터를 가져오는 옵션을 참조하십시오.

Lakehouse SQL 분석 엔드포인트

lakehouse를 만들 때 Fabric이 자동으로 SQL 분석 엔드포인트를 생성합니다. 이 엔드포인트를 사용하면 다음을 수행할 수 있습니다.

  • T-SQL을 사용하여 델타 테이블 쿼리 - 별도의 웨어하우스를 설정하지 않고 친숙한 SQL 구문을 사용합니다.
  • Power BI 직접 연결Power BI 의미 체계 모델 만들어 레이크하우스 데이터에 대한 보고서를 작성합니다.
  • 읽기 전용 액세스 공유 - 분석가와 보고서 작성기가 Spark 워크로드에 영향을 주지 않고 데이터를 쿼리할 수 있습니다.

참고

2025년 9월 5일부터 레이크하우스를 만들 때 기본 의미 체계 모델이 더 이상 자동으로 만들어지지 않습니다. 기존 기본 의미 체계 모델은 2025년 11월 30일까지 부모 항목에서 분리되어 독립적인 의미 체계 모델이 되었습니다. 자세한 내용은 Power BI Microsoft Fabric 의미 체계 모델을 참조하세요.

SQL 분석 엔드포인트는 읽기 전용이며 데이터 웨어하우스의 전체 T-SQL 표면을 지원하지 않습니다. 탐색, 보고 및 임시 쿼리에 사용합니다.

참고

델타 테이블만 SQL 분석 엔드포인트에 표시됩니다. 여기에는 로컬로 저장된 테이블과 함께 표시되고 쿼리할 수 있는 OneLake 바로 가기를 통해 도달한 델타 테이블이 포함됩니다. Parquet, CSV 및 기타 형식은 이 엔드포인트를 통해 쿼리할 수 없습니다. 테이블이 표시되지 않으면 델타 형식으로 변환합니다.

자동 테이블 검색 및 등록

레이크하우스는 데이터를 두 개의 최상위 폴더로 구성합니다. 즉, 관리되는 델타 테이블용 테이블 과 비정형 또는 비 델타 데이터에 대한 파일 입니다. Tables 폴더에 파일을 배치하면 Fabric이 자동으로 처리합니다.

  • 지원되는 형식(현재 델타 테이블에만 해당)에 대해 파일의 유효성을 검사합니다.
  • 열 이름, 데이터 형식, 압축 및 분할과 같은 메타데이터를 추출합니다.
  • Spark SQL 또는 T-SQL을 사용하여 즉시 쿼리할 수 있도록 메타스토어에 테이블을 등록합니다.

이 관리형 파일-테이블 환경에서는 관리되는 영역에 데이터를 배치할 때 수동으로 CREATE TABLE 구문을 작성할 필요가 없습니다.

Lakehouse를 사용한 멀티태스킹

레이크하우스는 사용자의 위치를 잃지 않고 여러 항목을 열고 전환할 수 있는 브라우저 탭 디자인을 사용합니다.

  • 실행 중인 작업을 유지합니다. 다른 탭으로 전환하면 데이터 로드 및 업로드가 계속 실행됩니다.

  • 컨텍스트를 유지합니다. 선택한 테이블, 파일 및 개체는 탭 사이를 탐색할 때 열린 상태로 유지됩니다.

  • 비차단 목록 다시 로드: 파일 및 테이블 목록은 작업을 차단하지 않고 백그라운드에서 새로 고쳐집니다.

  • 범위가 지정된 알림: 토스트 알림은 어느 레이크하우스에서 온 것인지 식별하여 탭 간 업데이트를 추적할 수 있도록 합니다.

접근하기 쉬운 레이크하우스 디자인

Lakehouse는 보조 기술과 접근성 있는 상호 작용 패턴을 지원합니다.

  • 화면 읽기 프로그램 호환성: 탐색 및 상호 작용을 위해 인기 있는 화면 읽기 프로그램과 함께 작동합니다.
  • 이미지에 대한 대체 텍스트: 모든 이미지에는 설명이 포함된 대체 텍스트가 포함됩니다.
  • 레이블이 지정된 양식 필드: 모든 양식 필드에는 화면 읽기 프로그램 및 키보드 사용자에 대한 레이블이 연결되어 있습니다.
  • 텍스트 재배치: 다양한 화면 크기 및 방향에 맞게 조정되는 반응형 레이아웃입니다.
  • 키보드 탐색: 마우스 없이 레이크하우스 탐색을 위한 전체 키보드 지원.