다음을 통해 공유


Microsoft Fabric Warehouse의 차원 모델링

적용 대상:✅ Microsoft Fabric의 SQL 분석 엔드포인트 및 웨어하우스

이 문서는 웨어하우스 내의 차원 모델링에 대한 시리즈의 첫 번째 문서입니다. 테이블 만들기 및 테이블 데이터 관리와 같은 많은 T-SQL 기능을 지원하는 환경인 Microsoft Fabric의 Warehouse에 대한 실질적인 지침을 제공합니다. 따라서 차원 모델 테이블을 만들고 데이터로 로드하는 작업을 완벽하게 제어할 수 있습니다.

참고 항목

이 문서에서 데이터 웨어하우스라는 용어는 조직 전체에서 중요한 데이터의 포괄적인 통합을 제공하는 엔터프라이즈 데이터 웨어하우스를 가리킵니다. 반면, 독립 실행형 용어 웨어 하우스는 데이터 웨어하우스를 구현하는 데 사용할 수 있는 SaaS(Software as a Service) 관계형 데이터베이스 제품인 Fabric Warehouse를 의미합니다. 명확성을 위해 이 문서에서 후자는 패브릭 웨어하우스언급됩니다.

차원 모델링에 대한 경험이 부족한 경우 이 문서 시리즈가 첫 번째 단계라고 생각합니다. 차원 모델링 디자인에 대한 전체 토론을 제공하기 위한 것이 아닙니다. 자세한 내용은 랄프 킴볼 등의 데이터 웨어하우스 도구 키트: 차원 모델링에 대한 최종 가이드(2013년 3판)와 같이 널리 채택된 콘텐츠를 직접 참조하세요.

별모양 스키마 디자인

스타 스키마 는 관계형 데이터 웨어하우스에서 채택한 차원 모델링 디자인 기술입니다. 패브릭 웨어하우스를 만들 때 사용하는 권장 디자인 방법입니다. 별표 스키마는 팩트 테이블차원 테이블로 구성됩니다.

  • 차원 테이블 은 조직 및 분석 요구 사항과 관련된 엔터티를 설명합니다. 대체로 모델링하는 항목을 나타냅니다. 제품, 사람, 장소 또는 날짜 및 시간을 포함한 다른 개념이 될 수 있습니다. 자세한 내용 및 디자인 모범 사례는 이 시리즈의 차원 테이블을 참조하세요.
  • 팩트 테이블 은 관찰 또는 이벤트와 관련된 측정값을 저장합니다. 판매 주문, 주식 잔액, 환율, 온도 판독값 등을 저장할 수 있습니다. 팩트 테이블에는 집계할 수 있는 세분화된 값과 함께 차원 키가 포함됩니다. 자세한 내용 및 디자인 모범 사례는 이 시리즈의 팩트 테이블을 참조하세요.

스타 스키마 디자인은 분석 쿼리 워크로드에 최적화되어 있습니다. 이러한 이유로 엔터프라이즈 Power BI 의미 체계 모델의 필수 구성 요소로 간주됩니다. 분석 쿼리는 데이터 필터링, 그룹화, 정렬 및 요약과 관련이 있습니다. 팩트 데이터는 관련 차원 테이블의 필터 및 그룹화 컨텍스트 내에서 요약됩니다.

별 스키마라고 하는 이유는 팩트 테이블이 별의 중심을 형성하고 관련 차원 테이블이 별의 점을 형성하기 때문입니다.

다이어그램은 판매 팩트의 별표 스키마를 보여 줍니다. 별의 한 지점에는 각각 5개의 차원이 있습니다.

별 스키마에는 종종 여러 팩트 테이블이 포함되므로 여러 개의 별이 포함됩니다.

잘 디자인된 스타 스키마는 테이블 조인 수가 적고 유용한 인덱스의 가능성이 높기 때문에 고성능(관계형) 쿼리를 제공합니다. 또한 데이터 웨어하우스 디자인이 발전함에 따라 스타 스키마에는 낮은 유지 관리가 필요한 경우가 많습니다. 예를 들어 새 특성의 분석을 지원하기 위해 차원 테이블에 새 열을 추가하는 작업은 비교적 간단한 작업입니다. 데이터 웨어하우스의 범위가 발전함에 따라 새로운 팩트 및 차원을 추가하는 것과 같습니다.

차원 모델의 테이블은 ETL(추출, 변환 및 로드) 프로세스에 의해 정기적으로 업데이트되고 로드됩니다. 이 프로세스는 해당 데이터를 운영 데이터를 저장하는 원본 시스템과 동기화합니다. 자세한 내용은 이 시리즈의 테이블 로드를 참조하세요.

Power BI에 대한 차원 모델링

엔터프라이즈 솔루션의 경우 Fabric Warehouse의 차원 모델은 Power BI 의미 체계 모델을 만드는 데 권장되는 필수 구성 요소입니다. 차원 모델은 의미 체계 모델을 지원할 뿐만 아니라 기계 학습 모델과 같은 다른 환경의 데이터 원본이기도 합니다.

그러나 특정 상황에서는 최선의 방법이 아닐 수 있습니다. 예를 들어 IT에 의존하지 않고 신속하게 작업하기 위해 자유와 민첩성이 필요한 셀프 서비스 분석가는 원본 데이터에 직접 연결하는 의미 체계 모델을 만들 수 있습니다. 이러한 경우 차원 모델링 이론은 여전히 관련이 있습니다. 이 이론은 분석가가 데이터 웨어하우스에서 차원 모델을 만들고 로드할 필요가 없도록 하면서 직관적이고 효율적인 모델을 만드는 데 도움이 됩니다. 대신, 원본 데이터에 연결하고 변환하여 의미 체계 모델 테이블을 만들고 로드하는 논리를 정의하는 파워 쿼리를 사용하여 준차원 모델을 만들 수 있습니다. 자세한 내용은 별모양 스키마 및 Power BI에서의 중요도 이해를 참조하세요.

Important

파워 쿼리를 사용하여 의미 체계 모델에서 차원 모델을 정의하는 경우 과거 내용을 정확하게 분석하는 데 필요할 수 있는 기록 변경을 관리할 수 없습니다. 이 요구 사항인 경우 데이터 웨어하우스를 만들고 주기적인 ETL 프로세스가 차원 변경 내용을 캡처하고 적절하게 저장하도록 허용해야 합니다.

데이터 웨어하우스 계획

데이터 웨어하우스를 만들고 차원 모델을 심각하고 중요한 작업으로 디자인하는 방법에 접근해야 합니다. 데이터 웨어하우스가 데이터 플랫폼의 핵심 구성 요소이기 때문입니다. 조직 전체에 대한 분석 및 보고, 따라서 의사 결정을 지원하는 견고한 기반을 형성해야 합니다.

이를 위해 데이터 웨어하우스는 품질, 준수 및 역사적으로 정확한 데이터를 단일 버전의 진실저장하려고 노력해야 합니다. 빠른 성능으로 이해할 수 있고 탐색 가능한 데이터를 제공하고 적절한 사용자만 올바른 데이터에 액세스할 수 있도록 권한을 적용해야 합니다. 복원력을 위해 데이터 웨어하우스를 설계하여 요구 사항이 진화함에 따라 변경에 적응할 수 있도록 합니다.

데이터 웨어하우스의 성공적인 구현은 좋은 계획에 따라 달라집니다. 전략적 및 전술적 고려 사항 및 패브릭 및 데이터 웨어하우스의 성공적인 채택으로 이어지는 작업 항목에 대한 자세한 내용은 Microsoft Fabric 채택 로드맵참조하세요.

엔터프라이즈 데이터 웨어하우스를 반복적으로 빌드하는 것이 좋습니다. 먼저 가장 중요한 주제 영역으로 시작한 다음, 우선 순위 및 리소스에 따라 시간이 지남에 따라 데이터 웨어하우스를 다른 주제 영역으로 확장합니다.

이 시리즈의 다음 문서에서는 차원 테이블에 대한 지침 및 디자인 모범 사례에 대해 알아봅니다.