이 자습서에서는 Microsoft Fabric을 사용하여 Power BI 보고를 위해 데이터를 준비, 로드 및 모델링하는 방법을 알아봅니다. Dataflows Gen2를 사용하여 데이터를 수집하여 Lakehouse로 변환하고, 파이프라인을 사용하여 데이터 새로 고침을 오케스트레이션하고, Direct Lake 모드를 사용하여 차원 모델을 빌드합니다. 마지막으로, 보고서를 자동으로 생성하여 최신 판매 데이터를 시각화합니다.
이 자습서를 마치면 다음을 수행할 수 있습니다.
- 데이터 준비 및 레이크하우스에 로드
- 데이터 파이프라인을 오케스트레이션하여 데이터를 새로 고치고 실패할 때 전자 메일 보내기
- Lakehouse에서 의미 체계 모델 만들기
- 빠른 만들기를 사용하여 자동으로 보고서 만들기
필수 조건
시작하기 전에 다음이 있는지 확인합니다.
- 아직 사용하지 않은 경우 조직에 Fabric을 사용하도록 설정합니다 .
- 액세스 권한이 없는 경우 무료 평가판에 등록합니다.
- 새 작업 영역을 만들고 Fabric 용량을 할당합니다. 기존 작업 영역을 사용할 수 있지만 이 자습서에서는 비프로덕션 작업 영역을 사용하는 것이 좋습니다.
- Contoso 데이터에 대한 샘플 쿼리가 포함된 파워 쿼리 템플릿 파일을 다운로드합니다.
데이터를 저장할 레이크하우스 만들기
먼저 레이크하우스를 만들어 데이터를 저장합니다. Dataflows Gen2를 사용하여 준비 및 변환하고 파이프라인을 사용하여 예약된 새로 고침 및 전자 메일 알림을 오케스트레이션합니다.
작업 영역에서 페이지 맨 위에 있는 새 항목을 선택합니다.
새 항목 만들기 화면에서 Lakehouse를 검색하거나 선택합니다.
SalesLakehouse를 이름으로 입력하고(이름에 문자, 숫자 및 밑줄이 포함될 수 있지만 특수 문자나 공백은 포함할 수 없음) 만들기를 선택합니다.
Lakehouse 편집기에서 리본에서 새 데이터 흐름 Gen2 를 선택합니다.
참고 항목
또는 리본에서 데이터 가져오기 를 선택한 다음 새 데이터 흐름 Gen2를 선택합니다.
데이터 흐름 OnlineSalesDataflow 의 이름을 지정하고(문자, 숫자 및 밑줄만 사용) 만들기를 선택합니다.
Dataflows Gen2를 사용하여 레이크하우스에 데이터 준비 및 로드
데이터 흐름 Gen2에 대한 파워 쿼리 온라인 편집기에서 파워 쿼리 템플릿에서 가져오기를 선택하고 필수 구성 요소에서 다운로드한 ContosoSales.pqt 템플릿 파일을 선택합니다.
데이터 로드 그룹에서 DimDate 쿼리를 선택합니다. 메시지가 표시되면 연결 구성을 선택하고, 인증을 익명으로 설정하고, 연결을 선택합니다.
DimDate를 선택한 상태에서 데이터 미리 보기에서 DateKey 열을 찾습니다. 열 머리글에서 데이터 형식 아이콘을 선택하고 드롭다운에서 날짜/시간을 선택합니다.
열 유형 변경 창에서 현재 바꾸기를 선택합니다.
데이터 대상 구성
DimDate를 선택한 상태에서 오른쪽 아래에서 데이터 대상 설정을 검토합니다. 구성된 Lakehouse를 마우스로 가리키면 해당 속성을 볼 수 있습니다.
당신이 만든 Lakehouse는 모든 테이블의 목적지입니다. 기본 업데이트 방법은 각 새로 고침 중에 이전 데이터를 덮어쓰는 Replace입니다.
FactOnlineSales 테이블을 선택하고 해당 데이터 대상 설정을 검토합니다.
FactOnlineSales 원본이 자주 변경되므로 새 데이터를 추가하여 새로 고침을 최적화합니다. X 아이콘을 선택하여 현재 데이터 대상을 제거합니다. 다른 테이블의 목적지를 제거하지 마세요.
FactOnlineSales가 여전히 선택된 상태에서 아이콘을 + 선택하여 데이터 대상을 추가한 다음, Lakehouse를 선택합니다.
메시지가 표시되면 인증을 조직 계정 으로 설정하고 다음을 선택합니다.
탐색기에서 작업 영역을 선택하고 확장하여 모든 Lakehouse 항목을 봅니다. SalesLakehouse를 선택하고 새 테이블이 선택되었는지 확인하고 다음을 선택합니다.
데이터 대상 설정 패널에서 자동 설정 사용 선택을 취소하고 Update 메서드 를 추가로 설정하고 저장 설정을 선택합니다.
참고 항목
Append 메서드는 새로 고칠 때마다 테이블에 새 행을 추가하여 기존 데이터를 유지합니다.
홈 탭에서 저장 및 실행을 선택합니다.
파워 쿼리 온라인 편집기를 종료하려면 왼쪽 사이드 레일의 OnlineSalesDataflow 항목에서 X를 선택합니다.
참고 항목
X를 선택하면 편집기가 닫히지만 데이터 흐름은 삭제되지 않습니다.
데이터 파이프라인 오케스트레이션
데이터 흐름 새로 고침을 자동화하고 주요 세부 정보가 포함된 사용자 지정 Outlook 전자 메일을 보내 오류를 처리합니다.
작업 영역에서 새 항목을 선택합니다.
새 항목 만들기 화면에서 데이터 파이프라인을 검색하거나 선택합니다.
파이프라인의 이름을 SalesPipeline 으로 지정하고 만들기를 선택합니다.
파이프라인 편집기에서 파이프라인 작업을 선택한 다음, 데이터 흐름을 선택합니다.
참고 항목
리본에서 데이터 흐름을 선택할 수도 있습니다.
파이프라인 편집기에서 데이터 흐름 작업을 선택합니다. 일반 섹션에서 이름을OnlineSalesActivity로 설정합니다.
데이터 흐름 작업을 선택한 상태에서 설정 으로 이동하여 데이터 흐름 목록에서 OnlineSalesDataflow 를 선택합니다. 필요한 경우 새로 고침 아이콘을 선택하여 목록을 업데이트합니다.
활동 탭을 선택한 다음 Office365 Outlook 활동을 추가합니다.
참고 항목
동의 허용 창이 표시되면 확인을 선택하고, 조직 계정으로 로그인하고, 액세스를 허용합니다.
파이프라인 편집기에서 Office365 Outlook 활동을 선택합니다. 일반 섹션에서 실패 시 이름을메일로 설정합니다.
Office365 Outlook 활동을 선택한 상태에서 설정으로 이동합니다. 받는 사람 필드에 전자 메일 주소를 입력하고 제목을 파이프라인 오류로 설정합니다. 메일 본문의 경우 식 작성기에서 보기를 선택합니다.
참고 항목
보낸 사람(다른 이름으로 보내기), 참조, 숨은 참조 및 민감도 레이블과 같은 추가 전자 메일 옵션은 고급 속성에서 사용할 수 있습니다.
파이프라인 식 작성기에서 다음 식을 페이지 위쪽의 텍스트 블록에 붙여넣습니다.
@concat( 'Pipeline: ' , pipeline().PipelineId , '<br>' , 'Workspace: ' , pipeline().WorkspaceId , '<br>' , 'Time: ' , utcnow() )이 식은 파이프라인 ID, 작업 영역 ID 및 현재 UTC 시간을 전자 메일 본문에 동적으로 삽입합니다.
파이프라인 편집기에서 OnlineSalesActivity를 선택합니다. "X"(실패 시) 핸들에서 끌어서 실패 시 메일 작업에 놓습니다. 이렇게 하면 데이터 흐름 작업이 실패할 경우 전자 메일이 전송됩니다.
홈 탭에서 예약을 선택합니다. 다음과 같이 일정을 구성한 다음 적용을 선택합니다.
속성 값 예약된 실행 설정 반복 매일 시간 오전 12:00:00 홈 탭에서 실행을 선택합니다. 메시지가 표시되면 저장을 선택하고 실행 하여 계속합니다.
파이프라인의 상태를 모니터링하려면 작업 진행률을 표시하는 출력 테이블을 봅니다. 테이블이 자동으로 새로 고쳐지거나 새로 고침 아이콘을 선택하여 수동으로 업데이트할 수 있습니다.
상태가 성공으로 표시되면 작업 영역으로 돌아가서 자습서를 계속 진행합니다.
Lakehouse에서 의미 체계 모델 만들기
로드한 데이터는 보고서를 작성하는 데 사용할 준비가 거의 다 된 상태입니다. 다음으로 레이크하우스의 테이블을 사용하여 물리적 데이터를 구성하고 논리적 개체로 변환하는 메타데이터 계층인 의미 체계 모델을 만듭니다. 의미 체계 모델은 비즈니스 구조를 반영하고 데이터를 보다 쉽게 분석할 수 있도록 설계되었습니다.
작업 영역 보기에서 SalesLakehouse 항목을 선택합니다.
탐색기에서 홈 탭에서 새 의미 체계 모델을 선택합니다.
새 의미 체계 모델 창에서 모델 SalesModel의 이름을 지정합니다. 그런 다음 dbo 스키마와 테이블 그룹을 모두 확장합니다. 다음 테이블을 선택하고 확인을 선택합니다.
테이블 이름 DimCustomer DimDate DimEmployee DimProduct 디밍스토어 FactOnlineSales
관계 만들기
이 모델은 데이터 웨어하우스에서 공통적인 별모양 스키마를 사용합니다. 별의 중심에는 팩트 테이블이 있으며, 이 팩트 테이블을 둘러싸고 있는 차원 테이블들이 관련되어 있습니다.
FactOnlineSales 테이블에서 DimCustomer 테이블의 CustomerKey 열로 CustomerKey 열을 끌어서 놓아 관계를 만듭니다.
관계 만들기 창에서 다음 설정을 확인한 다음 확인을 선택합니다.
이 관계를 활성으로 만들기 시작: 테이블 1(열) 끝: 테이블 2(열) 카디널리티 교차 필터 방향 ☑ FactOnlineSales(CustomerKey) DimCustomer(CustomerKey) 다 대 일(*:1) 단일 다음 관계 각각에 대해 다음 단계를 반복합니다.
이 관계를 활성으로 만들기 시작: 테이블 1(열) 끝: 테이블 2(열) 카디널리티 교차 필터 방향 ☑ FactOnlineSales(ProductKey) DimProduct(ProductKey) 다 대 일(*:1) 단일 ☑ FactOnlineSales(StoreKey) DimStore(StoreKey) 다 대 일(*:1) 단일 ☑ FactOnlineSales(DateKey) DimDate(DateKey) 다 대 일(*:1) 단일 ☑ DimStore(StoreKey) DimEmployee(StoreKey) 다 대 일(*:1) 모두 다음 이미지는 모든 관계가 포함된 의미 체계 모델의 완성된 보기를 보여줍니다.
DAX로 측정값 작성
총 판매액을 계산하는 기본 측정값을 만듭니다.
FactOnlineSales 테이블을 선택하고 홈 탭에서 새 측정값을 선택합니다.
수식 편집기에서 다음 DAX 측정값을 입력한 다음 커밋할 확인 표시 를 선택합니다.
Total Sales Amount = SUM(FactOnlineSales[SalesAmount])
보고서 자동 만들기
이제 데이터를 모델링했으므로 빠른 만들기를 사용하여 빠르게 시각화하고 탐색할 수 있습니다.
왼쪽 사이드 레일에서 선택하여 작업 영역으로 돌아갑니다. SalesModel 항목을 마우스로 가리키고 줄임표(... )를 선택한 다음 자동 만들기 보고서를 선택합니다.
보고서가 자동으로 생성되고 데이터 창의 열 선택에 따라 동적으로 업데이트됩니다.
리본에서 저장 을 선택하여 현재 작업 영역에 복사본을 저장합니다.
참고 항목
전체 시각적 제작 환경을 입력하려면 리본에서 편집 을 선택합니다.
빠른 만들기에 대해 자세히 알아보세요.
관련 콘텐츠
자습서를 완료해 주셔서 감사합니다! 이 자습서에 대한 전용 작업 영역을 만든 경우 이제 삭제하거나 프로세스 중에 만든 개별 항목을 제거할 수 있습니다.
이 자습서에서는 Power BI 사용자가 Microsoft Fabric을 사용하여 모든 규모에서 인사이트를 쉽게 파악할 수 있는 방법을 보여 줍니다.