다음을 통해 공유


Lakehouse 자습서: 레이크하우스 만들기, 샘플 데이터 수집 및 보고서 작성

이 자습서에서는 Lakehouse를 빌드하고, 샘플 데이터를 Delta 테이블에 수집하고, 필요한 경우 변환을 적용한 다음, 보고서를 만듭니다.

필수 조건

  • Lakehouse를 만들기 전에 패브릭 작업 영역을 만들어야 합니다.
  • CSV 파일을 수집하기 전에 OneDrive를 구성해야 합니다. OneDrive를 구성하지 않은 경우 Microsoft 365 무료 평가판에 등록합니다. 무료 평가판 - 한 달 동안 Microsoft 365를 사용해 보세요.

레이크하우스 만들기

  1. Power BI왼쪽 메뉴에서 작업 영역을 선택합니다.

  2. 작업 영역을 열려면 맨 위에 있는 검색 텍스트 상자에 해당 이름을 입력하고 검색 결과에서 선택합니다.

  3. 왼쪽 아래에 있는 스위처에서 데이터 엔지니어 선택합니다.

    전환기 및 데이터 엔지니어 선택할 위치를 보여 주는 스크린샷

  4. 데이터 엔지니어 화면에서 Lakehouse를 선택하여 레이크하우스를 만듭니다.

  5. 새 레이크하우스 대화 상자의 이름 필드에 wwilakehouse입력합니다.

    새 레이크하우스 대화 상자의 스크린샷.

  6. 만들기를 선택하여 새 레이크하우스를 만들고 엽니다.

샘플 데이터 수집

참고 항목

OneDrive를 구성하지 않은 경우 Microsoft 365 무료 평가판에 등록합니다. 무료 평가판 - 한 달 동안 Microsoft 365를 사용해 보세요.

  1. 패브릭 샘플 리포지토리에서 dimension_customer.csv 파일을 다운로드합니다.

  2. 홈 탭의 레이크하우스에서 데이터 가져오기 아래에 레이크하우스에 데이터를 로드하는 옵션이 표시됩니다. 새 데이터 흐름 Gen2를 선택합니다.

    Lakehouse에 데이터를 로드하는 새 Dataflow Gen2 옵션을 선택할 위치를 보여 주는 스크린샷.

  3. 새 데이터 흐름 화면에서 텍스트/CSV 파일에서 가져오기를 선택합니다.

  4. 데이터 원본에 연결 화면에서 파일 업로드 라디오 단추를 선택합니다. 1단계에서 다운로드한 dimension_customer.csv 파일을 끌어서 놓습니다. 파일이 업로드되면 다음을 선택합니다.

    파일 업로드를 선택할 위치와 이전에 다운로드한 파일을 끌 위치를 보여 주는 스크린샷

  5. 파일 데이터 미리 보기 페이지에서 데이터를 미리 확인하고 만들기를 선택하여 계속 진행한 후 데이터 흐름 캔버스로 돌아갑니다.

  6. 쿼리 설정 창에서 이름 필드를 dimension_customer 업데이트합니다.

    참고 항목

    패브릭은 기본적으로 테이블 이름의 끝에 공백과 숫자를 추가합니다. 테이블 이름은 소문자여야 하며 공백을 포함해서는 안 됩니다. 적절하게 이름을 바꾸고 테이블 이름에서 공백을 제거하세요.

    이름을 입력하고 데이터 대상을 선택할 위치를 보여 주는 쿼리 설정 창의 스크린샷

  7. 이 자습서에서는 고객 데이터를 lakehouse와 연결했습니다. Lakehouse와 연결하려는 다른 데이터 항목이 있는 경우 다음을 추가할 수 있습니다.

    1. 메뉴 항목에서 데이터 대상 추가를 선택하고 Lakehouse를 선택합니다. 데이터 대상에 연결 화면에서 필요한 경우 계정에 로그인하고 다음을 선택합니다.

    2. 작업 영역에서 wwilakehouse로 이동합니다.

    3. dimension_customer 테이블이 없으면 새 테이블 설정을 선택하고 테이블 이름 dimension_customer 입력합니다. 테이블이 이미 있는 경우 기존 테이블 설정을 선택하고 개체 탐색기의 테이블 목록에서 dimension_customer 선택합니다. 다음을 선택합니다.

      대상 테이블을 선택하는 방법을 보여 주는 스크린샷

    4. 대상 설정 선택 창에서 업데이트 방법으로 바꾸기선택합니다. 데이터 흐름 캔버스로 돌아가려면 설정 저장을 선택합니다.

  8. 데이터 흐름 캔버스에서 비즈니스 요구 사항에 따라 데이터를 쉽게 변환할 수 있습니다. 간단히 하기 위해 이 자습서에서는 변경하지 않습니다. 계속하려면 화면 오른쪽 아래에서 게시를 선택합니다.

    게시 단추가 포함된 쿼리 설정 창의 스크린샷

  9. 데이터 흐름 이름 옆에 있는 회전 원은 항목 보기에서 게시가 진행 중임을 나타냅니다. 게시가 완료되면 ...선택하고 속성을 선택합니다. 데이터 흐름의 이름을 Load Lakehouse 테이블로 바꾸고 저장을 선택합니다.

  10. 데이터 흐름을 새로 고치려면 데이터 흐름 이름 옆에 있는 지금 새로 고침 옵션을 선택합니다. 이 옵션은 데이터 흐름을 실행하고 원본 파일에서 lakehouse 테이블로 데이터를 이동합니다. 진행 중인 동안 항목 보기의 새로 고침 열 아래에 회전하는 원이 표시됩니다.

    지금 새로 고침 아이콘을 찾을 수 있는 위치를 보여 주는 스크린샷

  11. 데이터 흐름이 새로 고쳐지면 왼쪽 탐색 모음에서 새 레이크하우스를 선택하여 dimension_customer Delta 테이블을 봅니다.

    Lakehouse가 열리는 탐색 패널의 스크린샷

  12. 테이블을 선택하여 데이터를 미리 봅니다. 레이크하우스의 SQL 분석 엔드포인트를 사용하여 SQL 문을 사용하여 데이터를 쿼리할 수도 있습니다. 화면 오른쪽 위에 있는 Lakehouse 드롭다운 메뉴에서 SQL 분석 엔드포인트를 선택합니다.

    SQL 분석 엔드포인트를 선택할 위치를 보여 주는 델타 테이블의 스크린샷

  13. dimension_customer 테이블을 선택하여 데이터를 미리 보거나 새 SQL 쿼리를 선택하여 SQL 문을 작성합니다.

    새 SQL 쿼리를 선택할 위치를 보여 주는 SQL 분석 엔드포인트 화면의 스크린샷.

  14. 다음 샘플 쿼리는 dimension_customer 테이블의 BuyingGroup 열을 기반으로 행 수를 집계합니다. SQL 쿼리 파일은 이후 참조를 위해 자동으로 저장되며 필요에 따라 이러한 파일의 이름을 바꾸거나 삭제할 수 있습니다.

    스크립트를 실행하려면 스크립트 파일의 맨 위에 있는 실행 아이콘을 선택합니다.

    SELECT BuyingGroup, Count(*) AS Total
    FROM dimension_customer
    GROUP BY BuyingGroup
    

보고서 작성

  1. 이전에는 모든 레이크하우스 테이블과 뷰가 의미 체계 모델에 자동으로 추가되었습니다. 최근 업데이트를 통해 새 레이크하우스의 경우 의미 체계 모델에 테이블을 수동으로 추가해야 합니다. Lakehouse를 열고 SQL 분석 엔드포인트 뷰로 전환합니다. 보고 탭에서 기본 의미 체계 모델 관리를 선택하고 의미 체계 모델에 추가할 테이블을 선택합니다. 이 경우 dimension_customer 테이블을 선택합니다.

    의미 체계 모델에 추가할 테이블을 선택할 수 있는 스크린샷

  2. 의미 체계 모델의 테이블이 항상 동기화되도록 하려면 SQL 분석 엔드포인트 보기로 전환하고 Lakehouse 설정 창을 엽니다. 기본 Power BI 의미 체계 모델을 선택하고 기본 Power BI 의미 체계 모델 동기화를 켭니다. 자세한 내용은 기본 Power BI 의미 체계 모델을 참조 하세요.

    데이터 동기화를 기본 의미 체계 모델로 설정하는 방법을 보여 주는 스크린샷

  3. 테이블을 추가한 후 Fabric은 lakehouse와 동일한 이름의 의미 체계 모델을 만듭니다.

    새 Lakehouse를 만들 때 생성된 기본 의미 체계 모델을 보여 주는 스크린샷.

  4. 의미 체계 모델 창에서 모든 테이블을 볼 수 있습니다. 보고서를 처음부터 만들거나 페이지를 매긴 보고서를 만들거나 Power BI에서 데이터를 기반으로 보고서를 자동으로 만들 수 있습니다. 이 자습서의 경우 이 데이터 탐색에서 보고서 자동 만들기를 선택합니다. 다음 자습서에서는 처음부터 보고서를 만듭니다.

    보고서 만들기를 선택할 위치를 보여 주는 의미 체계 모델 세부 정보 페이지의 스크린샷.

  5. 테이블은 차원이고 측정값이 없으므로 Power BI는 행 개수에 대한 측정값을 만들고 여러 열에 걸쳐 집계하고 다음 이미지와 같이 다른 차트를 만듭니다. 위쪽 리본에서 저장을 선택하여 나중에 이 보고서를 저장할 수 있습니다. 다른 테이블이나 열을 포함하거나 제외하여 요구 사항을 충족하기 위해 이 보고서를 더 많이 변경할 수 있습니다.

    네 개의 가로 막대형 차트를 표시하는 빠른 요약 페이지의 스크린샷.

다음 단계