Power BI에서 Microsoft Purview로 계보를 가져오는 방법

이 문서에서는 Microsoft Purview의 Power BI 원본에 대한 데이터 계보를 자세히 설명합니다.

필수 구성 요소

Power BI용 Microsoft Purview에서 데이터 계보를 보려면 먼저 Power BI 원본을 등록하고 검사해야 합니다.

일반적인 시나리오

Power BI 원본을 검사한 후 현재 데이터 자산에 대한 계보 정보와 Power BI에서 참조하는 데이터 자산이 Microsoft Purview 데이터 카탈로그 자동으로 추가됩니다.

  1. 데이터 소비자는 Microsoft Purview에서 보고서 또는 dashboard 근본 원인 분석을 수행할 수 있습니다. 보고서의 데이터 불일치에 대해 사용자는 업스트림 데이터 세트를 쉽게 식별하고 필요한 경우 소유자에게 문의할 수 있습니다.

  2. 데이터 생산자는 데이터 세트를 사용하는 다운스트림 보고서 또는 대시보드를 볼 수 있습니다. 데이터 세트를 변경하기 전에 데이터 소유자는 정보에 입각한 결정을 내릴 수 있습니다.

  3. 사용자는 이름, 보증 상태, 민감도 레이블, 소유자, 설명 및 기타 비즈니스 패싯으로 검색하여 관련 Power BI 아티팩트를 반환할 수 있습니다.

Microsoft Purview의 Power BI 아티팩트

Power BI 검사가 완료되면 다음 Power BI 아티팩트가 Microsoft Purview에 인벤토리됩니다.

  • 작업 영역
  • 대시보드
  • 보고서
  • 데이터 집합
  • 데이터 흐름
  • 데이터마트

Power BI 자산에 대해 개요 탭이 렌더링되는 방법을 보여 주는 스크린샷

Microsoft Purview의 Power BI 아티팩트 계보

사용자는 이름, 설명 또는 기타 세부 정보별로 Power BI 아티팩트 를 검색하여 관련 결과를 볼 수 있습니다. 자산 개요 및 속성 탭 아래에 설명, 분류와 같은 기본 세부 정보가 표시됩니다. 계보 탭에서 자산 관계는 업스트림 및 다운스트림 종속성과 함께 표시됩니다.

Microsoft Purview는 Power BI 아티팩트(예: 데이터 흐름 - 데이터 세트 -> 보고서 ->> 대시보드) 및 외부 데이터 자산 간의 계보를 캡처합니다.

참고

Power BI 아티팩트와 외부 데이터 자산 간의 계보의 경우 현재 지원되는 원본 유형은 다음과 같습니다.

  • Azure SQL 데이터베이스
  • Azure Blob 저장소
  • Azure Data Lake Store Gen1
  • Azure Data Lake Store Gen2

Power BI에 대해 계보가 렌더링되는 방법을 보여 주는 스크린샷

또한 Azure SQL Database를 원본으로 사용할 때 열 수준 계보(Power BI 하위 계보) 및 Power BI 데이터 세트 내의 변환이 캡처됩니다. 측정값의 경우 열 -> 속성 -> 식을 추가로 선택하여 변환 세부 정보를 볼 수 있습니다.

참고

Azure SQL Database를 원본으로 사용할 때 열 수준 계보 및 변환이 지원됩니다. 다른 원본은 현재 지원되지 않습니다.

Power BI 하위 계보가 렌더링되는 방법을 보여 주는 스크린샷

알려진 제한

  • Microsoft Purview는 스캐너 API를 활용하여 메타데이터 및 계보를 검색합니다. 메타데이터 검사의 일부 API 제한 사항 - 고려 사항 및 제한 사항에 대해 알아봅니다.
  • 데이터 세트 테이블이 다른 데이터 세트 테이블에 연결된 경우 중간 데이터 세트가 Power BI 데스크톱 내에서 "로드 사용" 옵션을 사용하지 않도록 설정하고 계보를 추출할 수 없는 경우
  • Power BI 아티팩트와 외부 데이터 자산 간의 계보:
    • 현재 지원되는 원본 유형은 Azure SQL Database, Azure Blob Storage, Azure Data Lake Store Gen1 및 Azure Data Lake Store Gen2입니다.
    • 열 수준 계보 및 변환은 Azure SQL Database를 원본으로 사용하는 경우에만 지원됩니다. 다른 원본은 현재 지원되지 않습니다.
    • 현재 Power BI 데이터 흐름이 만들어지는 데이터 원본에 대해 제한된 정보가 표시됩니다. 예를 들어 Power BI 데이터 세트의 SQL Server 원본의 경우 서버/데이터베이스 이름만 캡처됩니다.
    • 다음과 같은 제한 사항으로 인해 이러한 시나리오가 있고 Power BI 아티팩트가 연결하는 Power BI 및 데이터 원본을 모두 검사하는 경우 현재 카탈로그에 중복 자산이 표시되어 있을 수 있습니다.
      • 자산의 원본 개체 이름과 정규화된 이름은 Power BI 설정/쿼리에 사용되는 사례를 따르며, 원래 데이터 원본의 개체 사례와 일치하지 않을 수 있습니다.
      • Power BI에서 SQL 보기를 참조하는 경우 현재 SQL 테이블 자산으로 캡처됩니다.
      • Power BI가 Azure Dedicated SQL 풀(이전의 SQL DW) 원본을 참조하는 경우 현재 Azure SQL Database 자산으로 캡처됩니다.
  • Power BI 하위 분류 계보의 경우:
    • 일부 측정값은 하위 계보(예 COUNTROWS: )에 표시되지 않습니다.
    • 계보 그래프에서 COUNT 함수를 사용하여 열에서 파생된 측정값을 선택할 때 기본 열은 자동으로 선택되지 않습니다. 열 속성 탭에서 측정값 식을 확인하여 기본 열을 식별합니다.
    • 하위 계보가 지원되기 전에 Power BI 원본을 스캔한 경우 계보 그래프에 새 테이블 자산과 함께 데이터베이스 자산이 표시될 수 있습니다. 이 자산은 제거되지 않습니다.

다음 단계