Verbinden von Power BI mit Azure Databricks

Bei Microsoft Power BI handelt es sich um einen Business Analytics-Dienst, der interaktive Visualisierungen mit Self-Service-Business Intelligence-Funktionen bereitstellt. Damit können Benutzer eigenständig Berichte und Dashboards erstellen, ohne auf die Unterstützung durch IT-Mitarbeiter oder Datenbankadministratoren angewiesen zu sein.

Wenn Sie Azure Databricks als Datenquelle für Power BI verwenden, profitieren nicht nur Data Scientists und technische Fachkräfte für Daten, sondern alle Geschäftsbenutzer von den Vorteilen der Leistung und Technologie von Azure Databricks.

Sie können Power BI Desktop mit Ihren Azure Databricks-Clustern und Databricks SQL-Warehouses verbinden. Sie können außerdem Power BI-Berichte im Power BI-Dienst veröffentlichen und Benutzern über das einmalige Anmelden (Single Sign-On, SSO) den Zugriff auf die zugrunde liegenden Azure Databricks-Daten ermöglichen. Dabei werden die gleichen Microsoft Entra ID (früher Azure Active Directory)-Anmeldeinformationen wie für den Zugriff auf den Bericht verwendet.

Anforderungen

  • Power BI Desktop 2.85.681.0 oder höher. Die aktuelle Version können Sie hier herunterladen. Um von Unity Catalog verwaltete Daten mit Power BI zu verwenden, müssen Sie Power BI Desktop 2.98.683.0 oder höher (Release vom Oktober 2021) verwenden.

    Hinweis

    Für Power BI Desktop benötigen Sie Windows als Betriebssystem. Alternativ können Sie Power BI Desktop auf einem physischen Host oder einem Windows-basierten virtuellen Computer ausführen und anschließend eine Verbindung von Ihrem Betriebssystem aus herstellen.

    Wenn Sie eine niedrigere Power BI Desktop-Version als 2.85.681.0 verwenden, müssen Sie zudem den Databricks-ODBC-Treiber in derselben Umgebung wie Power BI Desktop installieren.

  • Ein persönliches Azure Databricks-Zugriffstoken oder Ihre Microsoft Entra ID-Kontoanmeldeinformationen.

    Hinweis

    Als bewährte Methode für die Sicherheit empfiehlt Databricks, dass Sie bei der Authentifizierung mit persönlichen Zugriffstoken persönliche Zugriffstoken verwenden, die zu Dienstprinzipalen und nicht zu Arbeitsbereichsbenutzern gehören. Informationen zum Erstellen von Token für Dienstprinzipale finden Sie unter Verwalten von Token für einen Dienstprinzipal.

  • Ein Azure Databricks-Cluster oder Databricks SQL-Warehouse

Herstellen einer Verbindung von Power BI Desktop mit Azure Databricks mithilfe von Partner Connect

Sie können Partner Connect verwenden, um von Power BI Desktop aus mit nur wenigen Klicks eine Verbindung mit einem Cluster oder SQL-Warehouse herzustellen.

  1. Stellen Sie sicher, dass Ihr Konto und Arbeitsbereich von Azure Databricks sowie der angemeldete Benutzer die Anforderungen für Partner Connect erfüllen.

  2. Klicken Sie in der Seitenleiste auf Partner Connect buttonPartner Connect.

  3. Klicken Sie auf die Kachel Power BI.

  4. Wählen Sie im Dialogfeld Connect to partner (Verbindung mit dem Partner herstellen) für Compute den Namen der Azure Databricks-Computeressource aus, für die Sie eine Verbindung herstellen möchten.

  5. Wählen Sie Download connection file (Verbindungsdatei herunterladen) aus.

  6. Öffnen Sie die heruntergeladene Verbindungsdatei, um Power BI Desktop zu starten.

  7. Geben Sie in Power BI Desktop Ihre Anmeldeinformationen für die Authentifizierung ein:

    • Persönliches Zugriffstoken: Geben Sie Ihr persönliches Azure Databricks-Zugriffstoken ein.
    • Microsoft Entra ID: Klicken Sie auf Anmelden, und befolgen Sie die Anweisungen auf dem Bildschirm.
    • Benutzername/Kennwort: Nicht anwendbar.
  8. Klicken Sie auf Verbinden.

  9. Wählen Sie im Navigator von Power BI die Azure Databricks-Daten aus, die Sie abfragen möchten.

    Power BI Navigator

Manuelles Verbinden von Power BI Desktop mit Azure Databricks

Befolgen Sie je nach gewählter Authentifizierungsmethode diese Anweisungen, um mit Power BI Desktop eine Verbindung mit einem Cluster oder SQL-Warehouse herzustellen. Databricks SQL Warehouses werden empfohlen, wenn Sie Power BI im DirectQuery Modus verwenden.

Hinweis

Schneller geht dies, wenn Sie die Verbindung mit Power BI Desktop über Partner Connect herstellen.

  1. Rufen Sie den Hostnamen des Servers und den HTTP-Pfad ab.

  2. Starten Sie Power BI Desktop.

  3. Klicken Sie auf Daten abrufen oder auf Datei > Daten abrufen.

  4. Klicken Sie auf Daten für den Einstieg abrufen.

  5. Suchen Sie nach Databricks, und klicken Sie dann auf den Connector:

    • Azure Databricks
  6. Klicken Sie auf Verbinden.

  7. Geben Sie den Hostnamen des Servers und den HTTP-Pfad ein.

  8. Wählen Sie den gewünschten Datenkonnektivitätsmodus aus. Informationen zu den Unterschieden zwischen Import und DirectQuery finden Sie unter Verwenden von DirectQuery in Power BI Desktop.

  9. Klicken Sie auf OK.

  10. Klicken Sie auf Ihre Authentifizierungsmethode:

    • Persönliches Zugriffstoken: Geben Sie Ihr persönliches Azure Databricks-Zugriffstoken ein.
    • Microsoft Entra ID: Klicken Sie auf Anmelden, und befolgen Sie die Anweisungen auf dem Bildschirm.
    • Benutzername/Kennwort: Nicht anwendbar.
  11. Klicken Sie auf Verbinden.

  12. Wählen Sie im Navigator von Power BI die Azure Databricks-Daten aus, die Sie abfragen möchten. Wenn Unity Catalog für Ihren Arbeitsbereich aktiviert ist, wählen Sie einen Katalog aus, bevor Sie ein Schema und eine Tabelle auswählen.

    Power BI Navigator

Verwenden einer benutzerdefinierten SQL Abfrage

Der Databricks-Connector stellt die Datenquelle bereit, mit der Databricks.Query ein Benutzer eine benutzerdefinierte SQL Abfrage bereitstellen kann.

  1. Führen Sie die in Verbinden beschriebenen Schritte mit Power BI Desktop aus, um eine Verbindung mithilfe von Import als Datenkonnektivitätsmodus zu erstellen.

  2. Klicken Sie im Navigator mit der rechten Maustaste auf das oberste Element, das den ausgewählten Hostnamen und den HTTP-Pfad enthält, und klicken Sie auf Daten transformieren, um die Power Query-Editor zu öffnen.

    Click Transform Data in the Navigator

  3. Ersetzen Sie in der Funktionsleiste den Funktionsnamen Databricks.Catalogs durch Databricks.Query und wenden Sie die Änderung an. Dadurch wird eine Power Query Funktion erstellt, die eine SQL Abfrage als Parameter verwendet.

  4. Geben Sie die gewünschte SQL Abfrage im Parameterfeld ein, und klicken Sie auf Aufrufen. Dadurch wird die Abfrage ausgeführt, und eine neue Tabelle wird mit den Abfrageergebnissen als Inhalt erstellt.

Zugreifen auf die Azure Databricks-Datenquelle mithilfe des Power BI-Diensts

Wenn Sie einen Bericht im Power BI-Dienst veröffentlichen, stellen Sie mithilfe eines persönlichen Zugriffstokens eine Verbindung mit Azure Databricks her. Im Power BI-Dienst können Sie auch einmaliges Anmelden (Single Sign On, SSO) aktivieren, damit Benutzer*innen auf Berichte zugreifen können, die im DirectQuery-Speichermodus erstellt wurden, indem sie ihre Microsoft Entra ID-Anmeldeinformationen an Azure Databricks übergeben.

  1. Veröffentlichen Sie Ihren Power BI-Bericht von Power BI Desktop aus im Power BI-Dienst.

  2. Aktivieren Sie den SSO-Zugriff (einmaliges Anmelden) für den Bericht und die zugrunde liegende Datenquelle.

    1. Wechseln Sie zum Azure Databricks-Dataset, das dem Bericht im Power BI-Dienst zugrunde liegt. Erweitern Sie die Option Anmeldeinformationen für die Datenquelle, und klicken Sie auf Anmeldeinformationen bearbeiten.
    2. Aktivieren Sie im Dialogfeld für die Konfiguration das Kontrollkästchen Berichts-Viewer können mit ihrer eigenen Power BI-Identität nur über DirectQuery auf diese Datenquelle zugreifen, und klicken Sie auf Anmelden.

    Enable SSO for Databricks data access

    Wenn diese Option aktiviert ist, wird der Zugriff auf die Datenquelle über DirectQuery verarbeitet und mithilfe der Microsoft Entra ID-Identität der Benutzer*innen verwaltet, die auf den Bericht zugreifen. Ist diese Option nicht aktiviert, können nur Sie als Herausgeber des Berichts auf die Azure Databricks-Datenquelle zugreifen.

Automatisierte HTTP-Proxyerkennung

Power BI Desktop Version 2.104.941.0 und höher (Release vom Mai 2022) verfügt über integrierte Unterstützung für die Erkennung systemweiten HTTP-Proxykonfigurationen unter Windows. Die aktuelle Version können Sie hier herunterladen.

Power BI Desktop kann Ihre systemweite HTTP-Proxykonfiguration unter Windows automatisch erkennen und verwenden.

Wenn der Proxyserver keinen CRL-Verteilungspunkt (CRL Distribution Point, CDP) bereitstellt, zeigt Power BI möglicherweise die folgende Fehlermeldung an:

Details: "ODBC: ERROR [HY000] [Microsoft][DriverSupport] (1200)
-The revocation status of the certificate or one of the certificates in the certificate chain is unknown."

Führen Sie zum Beheben dieses Fehlers die folgenden Schritte aus:

  1. Erstellen Sie die Datei C:\Program Files\Microsoft Power BI Desktop\bin\ODBC Drivers\Simba Spark ODBC Driver\microsoft.sparkodbc.ini, wenn sie noch nicht vorhanden ist.

  2. Fügen Sie in der Datei microsoft.sparkodbc.ini die folgende Konfiguration hinzu:

    [Driver]
    CheckCertRevocation=0
    

Delta Sharing-Connector für Power BI

Mit dem Delta Sharing-Connector für Power BI können Benutzer über das offene Delta Sharing-Protokoll Datasets, die für sie freigegeben wurden, entdecken, analysieren und visualisieren. Das Protokoll ermöglicht den sicheren produkt- und plattformübergreifenden Austausch von Datasets mithilfe von REST und Cloudspeicher.

Verbindungsanweisungen finden Sie unter Power BI: Lesen freigegebener Daten.

Einschränkungen

  • Der Azure Databricks-Connector unterstützt Webproxy. Automatische Proxyeinstellungen, die in .pac-Dateien definiert sind, werden jedoch nicht unterstützt.
  • Im Azure Databricks-Connector wird die Databricks.Query Datenquelle nicht in Kombination mit dem DirectQuery-Modus unterstützt.
  • Die Daten, die der Delta Sharing-Connector lädt, müssen in den Arbeitsspeicher Ihres Computers passen. Daher begrenzt der Connector die Anzahl der importierten Zeilen auf den zuvor unter Zeilenlimit festgelegten Wert.

Zusätzliche Ressourcen

Unterstützung