영어로 읽기

다음을 통해 공유


Azure Databricks에 Power BI 연결

Microsoft Power BI 셀프 서비스 비즈니스 인텔리전스 기능을 통해 대화형 시각화를 제공하는 비즈니스 분석 서비스로, 최종 사용자가 정보 기술 담당자 또는 데이터베이스 관리자에 의존하지 않고도 having 보고서 및 대시보드를 직접 만들 수 있습니다.

Azure Databricks를 Power BI와 함께 데이터 원본으로 사용하는 경우 데이터 과학자 및 데이터 엔지니어를 넘어 모든 비즈니스 사용자가 Azure Databricks 성능 및 기술 장점을 활용할 수 있습니다.

Azure Databricks에서 Power BI Online에 게시

Power BI Online에서 Azure Databricks를 데이터 원본으로 사용하는 경우 Databricks UI에서 직접 tables 또는 스키마에서 Power BI 데이터 세트를 만들 수 있습니다.

요구 사항

  • 데이터는 Unity Catalog에 있어야 하며, 컴퓨팅 클러스터는 Unity Catalog이 사용되도록 설정해야 합니다. Hive 메타스토어는 현재 지원되지 않습니다.

  • 프리미엄(프리미엄 용량 또는 사용자 단위 Premium 라이선스) Power BI 라이선스가 있어야 합니다.

  • Databricks에서 Power BI로 데이터셋을 게시하기 위해 사용하는 등록된 Entra ID 앱인 Databricks 데이터세트 게시 통합에 다음 권한을 반드시 grant하여야 합니다.

    • Content.Create

    • Dataset.ReadWrite.All

    • Workspace.Read.All

      Entra ID 앱

    자세한 내용은 Microsoft Entra 권한을 참조하세요.

    참고

    Entra 관리자 동의는 일반적으로 이러한 권한, 특히 Power BI의 작업 영역 및 데이터 세트 수준 액세스에 필요합니다. 지침은 관리자 동의 요청 검토를 참조하세요.

  • Power BI 작업 영역 설정에서 사용자가 Power BI 서비스(미리 보기)에서 데이터 모델을 편집하여 의미 체계 모델을 게시한 후 편집할 수 있도록 설정해야 합니다. XMLA 엔드포인트를 사용하여 연결을 만들어 테이블 형식 편집기를 사용하여 의미 체계 모델을 편집할 수도 있습니다.

  • Power BI 작업 영역에서 XML 쓰기를 사용하도록 설정해야 하는 경우 이 링크를 따라 지침을 확인하세요.

  • Power BI 작업 영역에서 프라이빗 링크를 사용하는 경우, Power BI에서 데이터 세트의 데이터 원본을 수동으로 update 하여 credentials 해야 합니다.

Power BI 데이터 세트에 Azure Databricks tables 게시

  1. Databricks 작업 영역에 로그인하고 사이드바에서 Catalog 아이콘Catalog 클릭하여 Catalog 탐색기를 엽니다.

  2. 오른쪽 위에 있는 드롭다운에서 Select 컴퓨팅 리소스를 list로 선택하세요.

  3. catalog과 select을 열고 schema 또는 tables을 게시할 준비를 하십시오. hive 메타스토어에서 select하지 말고 샘플 catalog하지 마세요.

  4. 오른쪽 위에서 BI 도구 사용 또는 대시보드 열기를 클릭합니다.

  5. Select Power BI 작업 영역에 게시합니다.

  6. 파트너에 연결 대화 상자에서 Microsoft Entra ID에 연결을 클릭하여 인증합니다.

  7. Power BI 작업 영역에서, select Power BI 작업 영역.

  8. 데이터 세트 모드에서는 DirectQuery select 또는 가져오기 select를 사용할 수 있습니다.

  9. Power BI에서 인증 방법의 로 OAuth 또는 PAT(개인용 액세스 토큰) 사용.

    Databricks는 세분화된 액세스 제어 및 사용자 수준 감사를 허용하기 때문에 OAuth를 사용하는 것이 좋습니다. OAuth credentials는 Power BI 데이터 세트 설정 페이지에서 데이터 원본 credentials로 구성해야 할 수 있습니다. 개인용 액세스 토큰(PAT)을 select으로 지정하면 Power BI가 의미 체계 모델에 액세스할 수 있도록 사용자를 대신하여 PAT가 생성됩니다.

  10. 데이터 세트 이름, 새 데이터로 게시하거나, 기존 데이터 사용하기 .

    기존 데이터 세트 사용을 선택하는 경우 다음이 true입니다.

    • 데이터 세트가 존재하는 경우 덮어쓰지 않습니다. 업데이트는 지정된 schema에 새 레코드만 추가됩니다.
      • 선택한 table 기존 데이터 세트의 일부가 아닌 경우 추가됩니다.
      • 이미 table가 데이터 세트에 있으며, 마지막 update이후에 새로운 columns이 추가되면, 해당 columns가 자동으로 추가됩니다.
      • 새로운 table를 위해 다른 스토리지 모델을 선택하여 복합 의미 모델를 만들 수 있습니다.

    기존 의미 체계 모델이 있는 경우, 기존 데이터 을 유지하면서 , 기존 데이터 세트을 선택합니다. 새로운 의미 체계 모델을 사용하여 새 데이터 세트를 만들려면 새 데이터로 게시 set항목을 선택하세요.

  11. Power BI에 게시를 클릭합니다.

  12. 데이터 세트가 게시된 후 10~20초 후에 Power BI 열기를 클릭하여 새 탭에서 Power BI 데이터 세트를 엽니다.

역할 및 메모

  • 여러 tables을 포함하는 schema를 게시할 때, columns이 포함된 모든 tables가 게시됩니다. columns 없는 Tables는 게시되지 않습니다.
  • Azure Databricks의 tablecolumns에 달린 댓글이 Power BI의 해당 columns 설명으로 복사됩니다.
  • 외래 키 관계는 게시된 데이터 세트에서 유지됩니다. 그러나 Power BI는 두 tables간에 하나의 활성 관계 경로만 지원합니다. Azure Databricks의 schema 여러 경로가 있는 경우 Power BI의 해당 관계 중 일부는 비활성 상태로 set. 나중에 Power BI의 데이터 모델 보기에서 활성 또는 비활성 관계를 변경할 수 있습니다.
  • OAuth 또는 온-프레미스 데이터 게이트웨이를 사용하는 경우 Power BI 데이터 세트 설정 페이지의 "데이터 원본 credentials" 아래에서 credentials 구성해야 할 수 있습니다.
  • 현재 사용자는 홈 테넌트에서 Power BI 작업 영역에만 직접 게시할 수 있습니다. 테넌트 where에서 게스트 사용자로 게시하는 것은 지원되지 않습니다.

문제 해결

Error 주의
Power BI에 게시를 처음 시작할 때 "승인 필요" 이 메시지가 표시되면, 이 통합 기능에 대한 권한을 grant하기 전에 Entra 관리자의 승인이 필요합니다. 요청을 승인하려면 Entra 관리자에게 문의하세요. 이 링크에 따라 지침을 확인하세요.
PowerBINotLicensedException Power BI Premium 라이선스가 있는지 확인합니다.
이 데이터 세트를 배포할 수 없습니다. 용량 관리자에게 문의하여 Power BI Premium 용량의 용량 설정에서 XMLA 읽기/쓰기 지원을 사용하도록 설정한 다음 다시 시도하세요. 자세한 내용은 제품 설명서의 'XMLA 읽기/쓰기 지원'을 참조하세요. 용량 설정의 XMLA 엔드포인트에서 읽기 및 쓰기 기능을 사용하도록 설정하려면 Power BI 용량 관리자에게 문의하세요. 이 링크에 따라 지침을 확인하세요.
XMLA 엔드포인트 기능이 비활성화되었습니다. 이 기능을 사용하려면 PowerBI.com에서 Excel에서 분석 기능을 활성화합니다. 용량 설정의 XMLA 엔드포인트에서 읽기 및 쓰기 기능을 사용하도록 설정하려면 Power BI 용량 관리자에게 문의하세요. 이 링크에 따라 지침을 확인하세요.
CapacityNotActive 용량이 일시 중지될 수 있습니다. 용량 상태를 확인하려면 용량 관리자에게 문의하세요.
이름이 ‘<ccon>***</ccon>’인 데이터베이스가 이미 ‘<ccon>작업 영역 </ccon>’ ***에 있습니다. 의미 체계 모델을 만들 수 있는 권한이 있는지 확인합니다. 그런 다음 Power BI에 게시를 다시 시도하여 버전 번호가 증분된 의미 체계 모델을 게시합니다.
Direct Lake 모드를 동일한 모델의 다른 스토리지 모드와 함께 사용할 수 없습니다. 복합 모델은 Direct Lake 모드를 지원하지 않습니다. 지원되지 않는 Remove을 변경하거나 Direct Lake 모드로 tables을 전환합니다. Power BI에 게시는 가져오기 또는 DirectQuery 모드를 사용하여 의미 체계 모델을 생성하므로 Direct Lake 모드를 사용하는 기존 데이터 세트에 게시하는 데 사용할 수 없습니다. 자세히 알아보려면 이 링크를 클릭합니다.
'<euii> *</euii>' 사용자에게 Discover 메서드를 호출할 수 있는 권한이 없습니다. 프리미엄 라이선스 모드를 사용하여 Power BI 작업 영역에 게시하고 있는지 확인합니다. 프로 라이선스 모드를 사용하여 작업 영역에 게시할 수 없습니다.
<euii> </euii>’ 사용자에게 ‘**에 새 개체를 만들 수 있는 권한이 없거나 개체가 없습니다. Power BI 작업 영역에서 뷰어 역할이 있을 수 있습니다. 의미 체계 모델을 만들 수 있는 권한이 있는지 확인합니다. 자세한 내용은 이 링크를 따라가세요.
데이터 원본 credentials에 update 실패했습니다. [Microsoft][ThriftExtension](14) HTTP 연결 중 서버에서 예기치 않은 응답: 권한 없음/금지된 오류 응답이 반환되었으나 토큰 만료 메시지가 수신되지 않았습니다. Power BI에서 데이터 원본 credentials 편집할 때 Databricks 작업 영역에 공개적으로 액세스할 수 있는지 확인합니다. 작업 영역에서 프라이빗 링크 또는 IP 액세스 목록을 사용하는 경우 Power BI 온-프레미스 게이트웨이를 구성해야 할 수 있습니다.

Azure Databricks에 Power BI Desktop 연결

Power BI Desktop울 Azure Databricks 클러스터 및 Databricks SQL 웨어하우스에 연결할 수 있습니다. Power BI 서비스에 Power BI 보고서를 게시하고 사용자가 SSO(Single Sign-On)를 사용하여 기본 Azure Databricks 데이터에 액세스할 수 있도록 하여 보고서에 액세스하는 데 사용하는 동일한 Microsoft Entra ID credentials 전달할 수도 있습니다.

요구 사항

  • Power BI Desktop 2.85.681.0 이상. Power BI에서 Unity Catalog 관리하는 데이터를 사용하려면 Power BI Desktop 2.98.683.0 이상(2021년 10월 릴리스)을 사용해야 합니다.

    참고

    Power BI Desktop(Windows 필수). 다른 운영 체제의 대안은 물리적 호스트 또는 Windows 기반 가상 머신에서 Power BI Desktop 실행한 다음 운영 체제에서 연결하는 것입니다.

    2.85.681.0 이전 버전의 Power BI Desktop을 사용하는 경우 Power BI Desktop 동일한 환경에서 Databricks ODBC 드라이버도 설치해야 합니다.

  • Azure Databricks 의 개인용 액세스 토큰 또는 Microsoft Entra ID 계정 credentials.

    참고

    보안 모범 사례로, 개인용 액세스 토큰을 사용하여 인증할 때 Databricks는 작업 영역 사용자 대신 서비스 주체에 속한 개인용 액세스 토큰을 사용할 것을 권장합니다. 서비스 주체에 대한 토큰을 만들려면 서비스 주체에 대한 토큰 관리를 참조하세요.

  • Azure Databricks 클러스터 또는 Databricks SQL 웨어하우스.

Partner Connect를 사용하여 Power BI Desktop을 Azure Databricks에 연결

Partner Connect를 사용하여 몇 번의 클릭만으로 Power BI Desktop에서 클러스터 또는 SQL 웨어하우스에 연결할 수 있습니다.

  1. Azure Databricks 계정, 작업 영역 및 로그인한 사용자가 Partner Connect에 대한 요구 사항을 충족하는지 확인합니다.

  2. 사이드바에서 파트너 연결 버튼파트너 연결을 클릭합니다.

  3. Power BI 타일을 클릭합니다.

  4. 파트너에 연결 대화 상자에서 컴퓨팅의 경우 연결하려는 Azure Databricks 컴퓨팅 리소스의 이름을 선택합니다.

  5. 연결 파일 다운로드를 선택합니다.

  6. 다운로드한 연결 파일을 열고 Power BI Desktop을 시작합니다.

  7. Power BI Desktop에서 인증 정보를 입력하세요: credentials.

    • 개인용 액세스 토큰: Azure Databricks 개인용 액세스 토큰을 입력합니다.
    • Microsoft Entra ID: 로그인을 클릭한 다음 화면의 지침을 따릅니다.
  8. 연결을 클릭합니다.

  9. Azure Databricks 데이터를 Select Power BI Navigator쿼리합니다.

    Power BI 탐색기

Power BI Desktop을 Azure Databricks에 수동으로 연결

다음 지침을 참조하여 선택한 인증 방법에 따라 Power BI Desktop을 사용하여 클러스터 또는 SQL 웨어하우스에 연결합니다. DirectQuery 모드에서 Power BI를 사용하는 경우 Databricks SQL 웨어하우스를 사용하는 것이 좋습니다.

참고

Power BI Desktop을 사용하여 더 빠르게 연결하려면 Partner Connect를 사용합니다.

  1. Get 서버 호스트 이름 및 HTTP 경로.

  2. Power BI Desktop을 시작합니다.

  3. Get 데이터를 클릭하거나 파일 >Get 데이터.

  4. Get 데이터를 클릭하여 get 시작.

  5. Databricks를 검색한 다음 커넥터를 클릭합니다.

    • Azure Databricks
  6. 연결을 클릭합니다.

  7. 서버 호스트 이름HTTP 경로를 입력합니다.

  8. Select 데이터 연결 모드. 가져오기DirectQuery의 차이점에 대한 자세한 내용은 Power BI Desktop에서 DirectQuery 사용을 참조하세요.

  9. 확인을 클릭합니다.

  10. 인증 방법을 클릭합니다.

    • 개인용 액세스 토큰: Azure Databricks 개인용 액세스 토큰을 입력합니다.
    • Microsoft Entra ID: 로그인을 클릭한 다음 화면의 지침을 따릅니다.
  11. 연결을 클릭합니다.

  12. Azure Databricks 데이터를 Select Power BI Navigator쿼리합니다. 작업 영역에 Unity Catalog가 사용하도록 설정된 경우, schema 및 table를 select하기 전에 catalog에서 select하세요.

    Power BI 탐색기

사용자 지정 SQL 쿼리 사용

Databricks 커넥터는 사용자가 사용자 지정 SQL 쿼리를 제공할 수 있는 Databricks.Query 데이터 원본을 제공합니다.

  1. Power BI Desktop을 사용하여 연결에서 설명된 단계에 따라 데이터 연결 모드로 가져오기를 사용하여 연결을 만듭니다.

  2. 탐색기에서 선택한 호스트 이름과 HTTP 경로가 포함된 최상위 항목을 마우스 오른쪽 단추로 클릭하고 데이터 변환을 클릭하여 Power Query 편집기를 엽니다.

    탐색기에서 Transform 데이터 변환

  3. 함수 표시줄에서 함수 이름 Databricks.Catalogs을(를) Databricks.Query(으)로 바꾸고 변경 내용을 적용합니다. 이렇게 하면 SQL 쿼리를 매개 변수로 사용하는 Power Query 함수가 만들어집니다.

  4. 매개 변수 필드에 SQL 쿼리를 입력하고 호출을 클릭합니다. 그러면 쿼리가 실행되고, 쿼리 결과가 내용으로 포함된 새 table이 만들어집니다.

Power BI 서비스를 사용하여 Azure Databricks 데이터 원본에 액세스

Power BI 서비스에 보고서를 게시할 때 개인용 액세스 토큰을 사용하여 Azure Databricks에 연결합니다. Power BI 서비스에서 SSO(단일 사인 온)를 활성화하여 사용자가 Microsoft Entra ID credentials를 Azure Databricks에 전달함으로써 DirectQuery 저장소 모드를 사용하여 구축된 보고서에 액세스할 수 있도록 설정할 수 있습니다.

  1. Power BI Desktop에서 Power BI 서비스로 Power BI 보고서를 게시합니다.

  2. 보고서 및 기본 데이터 원본에 대한 SSO(Single Sign-On) 액세스를 사용하도록 설정합니다.

    1. Power BI 서비스에서 보고서의 기본 Azure Databricks 데이터 세트로 이동한 다음, 데이터 원본 credentials를 확장하고 편집 credentials을 클릭합니다.
    2. 구성 대화 상자에서 select보고서 뷰어는 Direct Query를 사용하여 자신의 Power BI ID로만 이 데이터 원본에 액세스할 수 있으며, 로그인를 클릭합니다.

    Databricks 데이터 액세스용 SSO 사용

    이 옵션을 선택하면 DirectQuery를 사용하여 데이터 원본에 대한 액세스가 처리되고 보고서에 액세스하는 사용자의 Microsoft Entra ID를 사용하여 관리됩니다. 이 옵션을 select로 설정하지 않으면 보고서를 게시한 사용자인 사용자만 Azure Databricks 데이터 원본에 액세스할 수 있습니다.

자동 HTTP 프록시 검색

Power BI Desktop 버전 2.104.941.0 이상(2022년 5월 릴리스)에는 Windows 시스템 차원의 HTTP 프록시 구성을 검색하기 위한 기본 제공 지원이 있습니다.

Power BI Desktop은 Windows 시스템 차원의 HTTP 프록시 구성을 자동으로 검색하고 사용할 수 있습니다.

프록시 서버가 CDP(CRL 배포 지점)를 제공하지 않는 경우 Power BI에서 다음과 같은 오류 메시지를 표시할 수 있습니다.

Details: "ODBC: ERROR [HY000] [Microsoft][DriverSupport] (1200)
-The revocation status of the certificate or one of the certificates in the certificate chain is unknown."

이 오류를 해결하려면 다음 단계를 완료합니다.

  1. C:\Program Files\Microsoft Power BI Desktop\bin\ODBC Drivers\Simba Spark ODBC Driver\microsoft.sparkodbc.ini 파일이 없으면 만듭니다.

  2. microsoft.sparkodbc.ini 파일에 다음 구성을 추가합니다.

    [Driver]
    CheckCertRevocation=0
    

Power BI Delta Sharing 커넥터

Power BI Delta Sharing 커넥터를 사용하면 Delta Sharing 개방형 프로토콜을 통해 공유된 데이터 세트를 검색, 분석 및 시각화할 수 있습니다. 이 프로토콜을 사용하면 REST 및 클라우드 스토리지를 활용하여 제품 및 플랫폼에서 데이터 세트를 안전하게 교환할 수 있습니다.

연결 지침은 Power BI: 공유 데이터 읽기를 참조하세요.

제한 사항

  • Azure Databricks 커넥터는 웹 프록시를 지원합니다. 그러나 .pac 파일에 정의된 자동 프록시 설정은 지원되지 않습니다.
  • Azure Databricks 커넥터에서 Databricks.Query 데이터 원본은 DirectQuery 모드와 함께 지원되지 않습니다.
  • Delta Sharing 커넥터가 로드하는 데이터는 머신의 메모리에 맞아야 합니다. 이를 위해 커넥터는 가져온 행 수를 이전에 set행 Limit 제한합니다.

추가 리소스

지원