다음을 통해 공유


자습서: 소개

적용 대상:✅ Microsoft Fabric의 SQL 분석 엔드포인트 및 웨어하우스

이 자습서는 데이터 취득에서 데이터 소비에 이르는 엔드투엔드 데이터 웨어하우징 시나리오의 단계별 연습입니다. 이 자습서를 완료하여 Microsoft Fabric 사용자 환경, 다양한 환경 및 통합 지점, Microsoft Fabric 전문가 및 시민 개발자 환경에 대한 기본적인 이해를 구축합니다.

Microsoft Fabric의 많은 개념은 데이터 및 분석 전문가에게 익숙할 수 있지만 새 환경에서 이러한 개념을 적용하는 것은 어려울 수 있습니다. 자습서는 참조 아키텍처, 기능 및 특징의 전체 목록 또는 특정 모범 사례의 권장 사항이 아닙니다.

Data Warehouse 엔드투엔드 시나리오

이 자습서를 시작하기 전에 다음 단계를 수행합니다.

  1. Power BI 온라인 계정에 로그인하거나 계정이 없는 경우 평가판에 등록합니다.
  2. 테넌트에서 Microsoft Fabric 을 사용하도록 설정합니다.

이 자습서에서는 가상의 Wide World Importers 회사에서 웨어하우스 개발자의 역할을 수행합니다. 엔드 투 엔드 데이터 웨어하우스 솔루션을 구현합니다.

  1. 작업 영역만듭니다.
  2. 웨어하우스를 만듭니다.
  3. 파이프라인을 사용하여 원본에서 데이터 웨어하우스 차원 모델로 데이터를 수집합니다.
  4. 웨어하우스에서 T-SQL 사용하여 테이블을 만듭니다.
  5. 패브릭 포털에서 SQL 쿼리 편집기를 사용하여 T-SQL을 사용하여데이터를 로드합니다.
  6. SQL 쿼리 편집기를 사용하여 T-SQL 사용하여 테이블을 복제합니다.
  7. 저장 프로시저 사용하여 데이터를 변환하여 집계된 데이터 세트를 만듭니다.
  8. T-SQL로 시간 여행을 통해 특정 시점의 데이터를 확인하세요.
  9. 데이터 웨어하우스에서 결과를 검색하는 시각적 쿼리 편집기 사용하여 쿼리를 만듭니다.
  10. 데이터를 Notebook에서 분석합니다.
  11. SQL 쿼리 편집기를 사용하여 웨어하우스 간 쿼리 만들고 실행합니다.
  12. DirectLake 의미 체계 모델 및 Power BI 보고서 만들어 데이터를 분석합니다.
  13. OneLake 카탈로그에서 보고서 생성합니다.
  14. 작업 영역 및 기타 항목을 삭제하여 자습서 리소스를 정리합니다.

Data Warehouse 엔드투엔드 아키텍처

Data Warehouse 엔드투엔드 아키텍처를 보여 주는 다이어그램

데이터 원본 - Microsoft Fabric을 사용하면 Azure Data Services, 기타 클라우드 플랫폼 및 온-프레미스 데이터 원본에 쉽고 빠르게 연결할 수 있습니다.

수집 - Microsoft Fabric 파이프라인의 일부로 200개 이상의 네이티브 커넥터를 사용하고 데이터 흐름을 사용하여 데이터 변환을 끌어서 놓으면 조직에 대한 인사이트를 신속하게 작성할 수 있습니다. 바로 가기는 복사하거나 이동하지 않고도 기존 데이터에 연결하는 방법을 제공하는 Microsoft Fabric의 새로운 기능입니다. 이 자습서의 뒷부분에서 바로 가기 기능에 대한 자세한 내용을 확인할 수 있습니다.

변환 및 저장 - Microsoft Fabric은 Delta Lake 형식을 표준화합니다. 즉, Microsoft Fabric의 모든 엔진이 OneLake에 저장된 동일한 데이터를 읽고 작업할 수 있으므로 데이터 중복성이 필요하지 않습니다. 이 스토리지를 사용하면 조직의 필요에 따라 Data Warehouse 또는 데이터 메시를 빌드할 수 있습니다. 변환의 경우 파이프라인/데이터 흐름을 사용하는 로우코드 또는 노코드 환경을 선택하거나 코드 우선 환경에 T-SQL을 사용할 수 있습니다.

사용 - 업계 최고의 비즈니스 인텔리전스 도구인 Power BI를 사용하여 웨어하우스에서 데이터를 보고하고 시각화합니다. 각 웨어하우스에는 필요할 때 다른 보고 도구의 데이터에 연결하고 쿼리하기 위한 기본 제공 TDS 엔드포인트가 있습니다. 이 자습서에서는 샘플 웨어하우스에 의미 체계 모델을 만들어 단 몇 단계만에 별모양 스키마의 데이터 시각화를 시작합니다.

샘플 데이터

샘플 데이터의 경우 WWI(Wide World Importers) 샘플 데이터베이스를 사용합니다. Data Warehouse 엔드투엔드 시나리오의 경우 Microsoft Fabric 플랫폼의 규모 및 성능 기능을 자세히 살펴보기에 충분한 데이터를 생성했습니다.

와이드 월드 수입 (차 세계 대전)은 샌프란시스코 베이 지역에 본사를 둔 도매 참신 상품 수입 및 유통 업체입니다. 차 세계 대전의 고객은 주로 개인에게 재판매하는 회사입니다. 차 세계 대전은 또한 전문 상점, 슈퍼마켓, 컴퓨팅 상점, 관광 명소 상점 및 일부 개인과 같은 미국 전역의 소매 고객에게 판매합니다. 차 세계 대전은 차 세계 대전의 제품을 홍보 에이전트의 네트워크를 통해 다른 도매상에 판매. 회사 프로필 및 작업에 대한 자세한 내용은 Microsoft SQL용 Wide World Importers 샘플 데이터베이스를 참조하세요.

일반적으로 트랜잭션 시스템(또는 LOB(기간 업무) 애플리케이션)의 데이터를 데이터 레이크 또는 Data Warehouse 준비 영역으로 가져옵니다. 그러나 이 자습서에서는 WWI에서 제공하는 차원 모델을 초기 데이터 원본으로 사용합니다. 데이터를 Data Warehouse로 수집하고 T-SQL을 통해 변환하는 원본으로 사용합니다.

데이터 모델

WWI 차원 모델에는 별모양 스키마에 여러 팩트 테이블이 있습니다. 이 자습서에서는 테이블 및 관련 fact_sale 집중하여 엔드 투 엔드 데이터 웨어하우스 시나리오를 보여 줍니다.

fact_sale 테이블 및 관련 차원이 포함된 이 자습서에서 사용하는 데이터 모델을 보여 주는 다이어그램

다음 단계