다음을 통해 공유


환경 및 작업 영역에서 데이터 흐름 재사용 모범 사례

이 문서에서는 데이터 흐름을 효과적이고 효율적으로 재사용하기 위한 모범 사례 컬렉션을 설명합니다. 재사용을 위한 데이터 흐름을 개발할 때 디자인 문제 및 잠재적 성능 문제를 방지하려면 이 문서를 읽어보세요.

스테이징/추출 데이터 흐름에서 데이터 변환 데이터 흐름 분리

데이터 흐름이 모든 작업을 수행하는 경우 다른 데이터 흐름이나 다른 용도로 테이블을 다시 사용하는 것은 어렵습니다. 재사용하기에 가장 좋은 데이터 흐름은 몇 가지 작업만 수행하는 데이터 흐름입니다. 하나의 특정 작업을 전문으로 하는 데이터 흐름을 만드는 것이 데이터 흐름을 다시 사용하는 가장 좋은 방법 중 하나입니다. 준비 데이터 흐름으로 사용하는 데이터 흐름 집합이 있는 경우 유일한 작업은 원본 시스템에서 있는 그대로 데이터를 추출하는 것입니다. 이러한 데이터 흐름은 다른 여러 데이터 흐름에서 다시 사용할 수 있습니다.

데이터 변환 데이터 흐름이 있는 경우 공통 변환을 수행하는 데이터 흐름으로 분할할 수 있습니다. 각 데이터 흐름은 몇 가지 작업만 수행할 수 있습니다. 데이터 흐름당 이러한 몇 가지 작업을 수행하면 해당 데이터 흐름의 출력을 다른 데이터 흐름에서 다시 사용할 수 있습니다.

Dataflow doing only a few actions.

데이터 원본에서 스테이징 데이터 흐름으로 추출되는 데이터가 있는 이미지로, 테이블이 Dataverse 또는 Azure Data Lake Storage에 저장됩니다. 그런 다음, 데이터가 변환되고 데이터 웨어하우스 구조로 변환되는 변환 데이터 흐름으로 데이터가 이동됩니다. 마지막으로 데이터가 Power BI 의미 체계 모델에 로드됩니다.

여러 작업 영역 사용

각 작업 영역(또는 환경)은 해당 작업 영역의 멤버에 대해서만 사용할 수 있습니다. 하나의 작업 영역에서 모든 데이터 흐름을 빌드하는 경우 데이터 흐름 재사용을 최소화합니다. 회사 전체 테이블을 처리하는 데이터 흐름에 대한 몇 가지 일반 작업 영역을 가질 수 있습니다. 여러 부서에서 테이블을 처리하기 위해 데이터 흐름에 대한 일부 작업 영역을 가질 수도 있습니다. 또한 데이터 흐름에 대한 일부 작업 영역을 특정 부서에서만 사용할 수 있습니다.

Image showing the separate workspaces.

작업 영역에서 올바른 액세스 수준 설정

작업 영역의 데이터 흐름 출력을 사용하기 위해 다른 작업 영역의 데이터 흐름에 대한 액세스 권한을 부여하려면 작업 영역에서 보기 액세스 권한을 부여하기만 하면 됩니다. Power BI 작업 영역의 다른 역할에 대해 자세히 알아보려면 새 작업 영역의 역할로 이동합니다.

Screenshot showing how to access to the Power BI workspace.

Power BI의 데이터 흐름에 대한 보증

테넌트 조직에서 만든 많은 데이터 흐름이 있을 수 있으며 사용자가 가장 신뢰할 수 있는 데이터 흐름을 알기 어려울 수 있습니다. 데이터 흐름의 작성자 또는 데이터 흐름에 대한 편집 액세스 권한이 있는 사용자는 인증, 승격 또는 인증되지 않은 세 가지 수준에서 데이터 흐름을 보증할 수 있습니다.

이러한 수준의 인증을 통해 사용자는 신뢰할 수 있는 데이터 흐름을 더 쉽고 빠르게 찾을 수 있습니다. 인증 수준이 더 높은 데이터 흐름이 먼저 나타납니다. Power BI 관리자는 인증된 수준으로 데이터 흐름을 보증하는 기능을 다른 사람에게 위임할 수 있습니다. 추가 정보: 인증 - Power BI 콘텐츠 홍보 및 인증

Screenshot of the Power Query Navigator showing the promoted and certified endorsement labels on specific dataflows.

여러 데이터 흐름의 테이블 구분

하나의 데이터 흐름에 여러 테이블을 가질 수 있습니다. 여러 데이터 흐름에서 테이블을 분할할 수 있는 이유 중 하나는 이 문서의 앞부분에서 데이터 수집 및 데이터 변환 데이터 흐름을 분리하는 방법에 대해 알아보았습니다. 여러 데이터 흐름에 테이블을 두는 또 다른 좋은 이유는 다른 테이블과 다른 새로 고침 일정을 원하는 경우입니다.

다음 이미지에 표시된 예제에서는 영업 테이블을 4시간마다 새로 고쳐야 합니다. 현재 날짜 레코드를 업데이트된 상태로 유지하려면 날짜 테이블을 하루에 한 번만 새로 고쳐야 합니다. 그리고 제품 매핑 테이블은 일주일에 한 번만 새로 고쳐야 합니다. 이러한 테이블이 모두 하나의 데이터 흐름에 있는 경우 모두에 대해 하나의 새로 고침 옵션만 있습니다. 그러나 이러한 테이블을 여러 데이터 흐름으로 분할하는 경우 각 데이터 흐름의 새로 고침을 별도로 예약할 수 있습니다.

Image showing dataflows with different schedules for the refresh.

데이터 흐름 테이블에 적합한 테이블 후보

데스크톱 도구에서 파워 쿼리를 사용하여 솔루션을 개발할 때 스스로에게 질문할 수 있습니다. 이러한 테이블 중 데이터 흐름으로 이동할 수 있는 좋은 후보 테이블은 무엇입니까? 데이터 흐름으로 이동하는 가장 좋은 테이블은 둘 이상의 솔루션 또는 둘 이상의 환경 또는 서비스에서 사용해야 하는 테이블입니다. 예를 들어 다음 이미지에 표시된 날짜 테이블은 두 개의 별도 Power BI 파일에서 사용해야 합니다. 각 파일에서 해당 테이블을 복제하는 대신 데이터 흐름에서 테이블을 테이블로 빌드하고 해당 Power BI 파일에서 다시 사용할 수 있습니다.

Image showing a shared table used in a dataflow.