Konfigurieren der Verwendung von Azure Data Lake Gen 2 für Dataflowspeicher

Mit Power BI verwendete Daten werden standardmäßig im internen Speicher von Power BI gespeichert. Mit der Integration von Dataflows und Azure Data Lake Storage Gen2 (ADLS Gen2) können Sie Ihre Dataflows im Azure Data Lake Storage Gen2-Konto Ihrer Organisation speichern. Dies ermöglicht es Ihnen im Wesentlichen, einen eigenen Speicher zu Power BI Dataflows zu bringen und eine Verbindung auf Mandanten-oder Arbeitsbereichs Ebene herzustellen.

Gründe für die Verwendung des ADLS Gen 2-Arbeitsbereichs oder der Mandanten Verbindung

Nachdem Sie den Datenfluss angefügt haben, konfiguriert und speichert Power BI einen Verweis, damit Sie nun Daten in Ihren eigenen ADLS Gen 2 lesen und schreiben können. Power BI speichert die Daten im CDM-Format, das zusätzlich zu den tatsächlichen Daten, die vom Datenfluss generiert werden, Metadaten zu Ihren Daten erfasst. Dadurch werden viele leistungsstarke Funktionen entsperrt, und Ihre Daten und die zugehörigen Metadaten im CDM-Format können jetzt Erweiterbarkeits-, Automatisierungs-, Überwachungs-und sicherungsszenarios bereitstellen. Wenn Sie diese Daten verfügbar und in ihrer eigenen Umgebung weit verbreitet sind, können Sie die in der Organisation erstellten Erkenntnisse und Daten demokratisieren. Es ermöglicht Ihnen auch, weitere Lösungen mit einem breiten Spektrum an Komplexität zu erstellen. Ihre Lösungen können CDM-fähige benutzerdefinierte Anwendungen und Lösungen in Power Platform, Azure und solche sein, die über Partner- und ISV-Ökosysteme (Independent Software Vendor) verfügbar sind. Sie können auch eine Anwendung erstellen, um eine CSV-Datei zu lesen. Ihre Data Engineers, Data Scientists und Analysten können nun mit einem allgemeinen, in ADLS Gen 2 zusammengestellten Satz von Daten arbeiten, ihn verwenden und wiederverwenden.

Es gibt zwei Möglichkeiten, zu konfigurieren, welcher ADLS Gen 2-Speicher verwendet werden soll: Sie können ein einem Mandanten zugewiesenes ADLS Gen 2-Konto verwenden oder Ihren eigenen ADLS Gen 2-Speicher auf Arbeitsbereichsebene einbringen.

Voraussetzungen

  • Wenn Sie Ihr eigenes ADLS Gen2-Konto verwenden möchten, müssen Sie über Berechtigung Besitzer auf Speicherkontoebene verfügen. Berechtigungen auf Ressourcengruppen-oder Abonnement Ebene können nicht verwendet werden. Wenn Sie Administrator sind, müssen Sie sich dennoch Besitzerberechtigungen zuweisen. ADLS Gen2-Speicherkonten hinter einer Firewall werden derzeit nicht unterstützt.

  • Das Speicherkonto muss mit aktiviertem hierarchischem Namespace (HNS) erstellt werden.

  • Das Speicherkonto muss im selben Microsoft Entra-Mandanten erstellt werden wie der Power BI-Mandant.

  • Der Benutzer oder die Benutzerin muss die Rolle „Besitzer von Speicherblobdaten“, „Storage-Blobdatenleser“ und „Besitzer“ auf Speicherkontoebene innehaben (der Geltungsbereich sollte diese Ressource sein und nicht vererbt werden). Die Synchronisierung der vorgenommenen Rollenänderungen kann einige Minuten dauern und muss erfolgen, ehe die folgenden Schritte im Power BI-Dienst abgeschlossen werden können.

  • Die Mandantenregion des Power BI-Arbeitsbereichs sollte mit der Region des Speicherkontos identisch sein.

  • Zum Sichern Ihrer Endpunkte ist TLS (Transport Layer Security) Version 1.2 (oder höher) erforderlich. Webbrowser und andere Clientanwendungen, die TLS-Versionen vor TLS 1.2 verwenden, können keine Verbindung herstellen.

  • Das Anfügen eines Dataflows mit ADLS Gen 2 nach einer MFA (mehrstufigen Authentifizierung) wird nicht unterstützt.

  • Schließlich können Sie über das Verwaltungsportal eine Verbindung mit jeder beliebigen ADLS Gen2-Instanz herstellen. Wenn Sie jedoch eine direkte Verbindung mit einem Arbeitsbereich herstellen, müssen Sie davor erst sicherstellen, dass sich dort keine Dataflows befinden.

Hinweis

Bring Your Own Storage (Azure Data Lake Gen2) ist im Power BI-Dienst für GCC-Kunden der US-Behörden nicht verfügbar. Weitere Informationen dazu, welche Features verfügbar sind, finden Sie unter Power BI-Featureverfügbarkeit.

In der folgenden Tabelle werden die Berechtigungen für ADLS und für Power BI beschrieben, die für ADLS Gen 2 und Power BI erforderlich sind:

Aktion ADLS-Berechtigungen Minimum Power BI-Berechtigungen
Herstellen einer Verbindung von ADLS Gen 2 mit einem Power BI-Mandanten Besitzer Power BI-Administrator
Verbinden von ADLS Gen 2 mit dem Arbeitsbereich Besitzer Arbeitsbereichsadministrator
Erstellen Power BI Datenflüsse, die an ein verbundenes ADLS-Konto zurückgeschrieben werden Nicht verfügbar Mitwirkender im Arbeitsbereich
Power BI-Dataflow Verbrauch Nicht verfügbar Betrachter im Arbeitsbereich

Herstellen einer Verbindung mit einer Azure Data Lake Gen2-Instanz in einem Arbeitsbereich

Navigieren Sie zu einem Arbeitsbereich, der über keine Dataflows verfügt. Wählen Sie Arbeitsbereichseinstellungen aus. Klicken Sie auf die Registerkarte Azure Connections und dann auf den Bereich Speicher.

Screenshot of the Workspace settings pane on the Azure connections tab.

Die Option Use the default Azure connection (Azure-Standardverbindung verwenden) wird angezeigt, wenn ein Administrator bereits ein einem Mandanten zugewiesenes ADLS Gen 2-Konto konfiguriert hat. Sie haben zwei Möglichkeiten:

  • Entweder Sie verwenden das für den Mandanten konfigurierte ADLS Gen 2-Konto, indem Sie das Kontrollkästchen Azure-Standardverbindung verwenden aktivieren, oder
  • Sie wählen Mit Azure verbinden aus, um auf ein neues Azure Storage Konto zu verweisen.

Wenn Sie auf Connect to Azure klicken, ruft Power BI eine Liste der Azure-Abonnements ab, auf die Sie Zugriff haben. Füllen Sie die Dropdownlisten aus. Wählen Sie dann ein gültiges Azure-Abonnement, eine Ressourcengruppe und ein Speicherkonto, bei denen die Option für hierarchische Namensräume aktiviert ist, d.h. das ADLS Gen2-Flag. Das persönliche Konto, das zum Herstellen einer Verbindung mit Azure verwendet wird, wird nur einmal verwendet, um die anfängliche Verbindung festzulegen und dem Power BI-Dienstkonto Rechte zum Lesen und Schreiben von Daten zu gewähren. Danach wird das ursprüngliche Benutzerkonto nicht mehr benötigt, um die Verbindung aktiv zu halten.

Screenshot of the Settings window after choosing Connecting to Azure.

Klicken Sie nach dem Auswählen auf Speichern. Der Arbeitsbereich wurde nun erfolgreich mit Ihrem eigenen ADLS Gen2-Konto verknüpft. Power BI konfiguriert automatisch das Speicherkonto mit den erforderlichen Berechtigungen und richtet das Power BI-Dateisystem ein, in das die Daten geschrieben werden. Nun werden alle Daten von Dataflows in diesem Arbeitsbereich direkt in dieses Dateisystem geschrieben, das mit anderen Azure-Diensten verwendet werden kann. Sie verfügen jetzt über eine zentrale Quelle für alle Ihre Organisations- oder Abteilungsdaten.

Konfiguration von Azure-Verbindungen

Das Konfigurieren von Azure-Verbindungen ist eine optionale Einstellung mit zusätzlichen Eigenschaften, die optional festgelegt werden können:

  • Speicher auf Mandantenebene, mit der Sie einen Standardwert festlegen können, und/oder
  • Speicher auf Arbeitsbereichsebene, mit der Sie die Verbindung pro Arbeitsbereich angeben können

Sie können optional Speicher auf Mandantenebene konfigurieren, wenn Sie nur einen zentralen Data Lake verwenden möchten oder dies die Standardoption sein soll. Wir beginnen nicht automatisch mit festgelegter Standardeinstellung, um Ihnen Flexibilität in Ihrer Konfiguration zu ermöglichen, damit Sie die Beweglichkeit haben, die Verwendung dieser Verbindung in Arbeitsbereichen nach Bedarf zu konfigurieren. Wenn Sie ein vom Mandanten zugewiesenes ADLS Gen 2-Konto konfigurieren, müssen Sie trotzdem jeden Arbeitsbereich für die Verwendung dieser Standardoption konfigurieren.

Sie können optional oder zusätzlich Speicherberechtigungen auf Arbeitsbereichsebene als separate Option konfigurieren, was völlige Flexibilität beim Festlegen eines bestimmten ADLS Gen 2-Kontos je Arbeitsbereich bietet.

Zusammengefasst: Wenn Speicherberechtigungen auf Mandantenebene und Speicherberechtigungen auf Arbeitsbereichsebene zulässig sind, können Arbeitsbereichsadministratoren optional die ADLS-Standardverbindung verwenden oder ein anderes Speicherkonto getrennt vom Standardkonto konfigurieren. Wenn der Mandantenspeicher nicht festgelegt ist, können Arbeitsbereichsadministratoren optional ADLS-Konten je Arbeitsbereich konfigurieren. Wenn schließlich Speicher auf Mandantenebene ausgewählt und Speicher auf Arbeitsbereichsebene nicht zulässig ist, können Arbeitsbereichsadministratoren ihre Dataflows optional für die Verwendung dieser Verbindung konfigurieren.

Grundlegendes zur Struktur und zum Format von ADLS Gen 2-Arbeitsbereichs Verbindungen

Im Speicherkonto von ADLS Gen 2 werden alle Datenflüsse im powerbi-Container des Dateisystems gespeichert.

Die Struktur des powerbi-Containers sieht wie folgt aus: <workspace name>/<dataflow name>/model.json, <workspace name>/<dataflow name>/model.json.snapshots/<all snapshots> und <workspace name>/<dataflow name>/<table name>/<tablesnapshots>

Der Speicherort, an dem Dataflows Daten in der Ordnerhierarchie für ADLS Gen 2 speichern, ist identisch unabhängig davon, ob sich der Arbeitsbereich in gemeinsam genutzter Kapazität oder Premium-Kapazität befindet.

Nachfolgend sehen Sie ein Beispiel anhand der Tabelle "Order" des Northwind Odata-Beispiels.

Screenshot of the file explorer showing an example using the Orders table of the Northwind Odata sample.

In der obigen Abbildung:

  • model.json ist die aktuellste Version des Datenflusses.
  • model.json.snapshots sind alle früheren Versionen des Datenflusses. Dies ist hilfreich, wenn Sie eine frühere Version von Mashup oder inkrementelle Einstellungen benötigen.
  • tablename ist der Ordner, der die resultierenden Daten enthält, nachdem eine Dataflowaktualisierung abgeschlossen wurde.

Wir schreiben nur in dieses Speicherkonto und löschen die Daten derzeit nicht. Dies bedeutet, dass wir selbst nach dem Trennen nicht aus dem ADLS-Konto löschen, sodass alle oben aufgeführten Dateien weiterhin gespeichert sind.

Hinweis

Dataflows ermöglichen das Verknüpfen oder Verweisen auf Tabellen in anderen Dataflows. In solchen Dataflows kann die Datei model.json auf eine andere model.json-Datei eines anderen Dataflows im selben oder einem anderen Arbeitsbereich verweisen.

Verschieben von Dateien zwischen/innerhalb von ADLS Gen2-Speicherkonten

Wenn Sie einen Dataflow von einem ADLS Gen2-Speicherkonto in ein anderes verschieben, müssen Sie sicherstellen, dass die Pfade in der Datei model.json aktualisiert werden, um den neuen Speicherort widerzuspiegeln. Dies liegt daran, dass die Datei model.json den Pfad zum Dataflow und den Pfad zu den Daten enthält. Wenn Sie die Pfade nicht aktualisieren, kann der Dataflow die Daten nicht finden und verursacht Berechtigungsfehler. Um die Pfade zu aktualisieren, können Sie die folgenden Schritte ausführen:

  • Öffnen Sie die model.json-Datei in einem Text-Editor.
  • Suchen Sie die Speicherkonto-URL, und ersetzen Sie sie durch die neue Speicherkonto-URL.
  • Speichern Sie die Datei .
  • Überschreiben Sie die vorhandene model.json-Datei im ADLS Gen2-Speicherkonto.

Erweiterbarkeit für ADLS Gen 2-Arbeitsbereichs Verbindungen

Wenn Sie die Verbindung von ADLS Gen 2 mit Power BI herstellen, können Sie dies auf der Arbeitsbereichs-oder Mandanten Ebene durchführen. Vergewissern Sie sich, dass Sie über die richtige Zugriffsebene verfügen. Weitere Informationen finden Sie unter Voraussetzungen.

Die Speicherstruktur entspricht dem Common Data Model-Format. Weitere Informationen zur Speicherstruktur und zu CDM finden Sie unter Was ist die Speicherstruktur für analytische Daten Flüsse und Allgemeine Datenmodelle und Azure Data Lake Storage Gen2.

Nach der ordnungsgemäßen Konfiguration befinden sich die Daten und Metadaten in Ihrem Steuerelement. Viele Anwendungen kennen das CDM, und die Daten können mithilfe von Azure, PowerApps und PowerAutomate erweitert werden. Sie können auch Ökosysteme von Drittanbietern verwenden, indem Sie entweder dem Format entsprechen oder die Rohdaten lesen.

Trennen von Azure Data Lake Gen2 von einem Arbeitsbereich oder Mandanten

Wenn Sie eine Verbindung auf Arbeitsbereichsebene entfernen möchten, müssen Sie zunächst sicherstellen, dass alle Dataflows im betreffenden Arbeitsbereich gelöscht werden. Klicken Sie nach dem Entfernen aller Dataflows in den Arbeitsbereichseinstellungen auf Verbindung trennen. Dasselbe gilt für Mandanten. In diesem Fall müssen Sie jedoch zunächst sicherstellen, dass alle Arbeitsbereiche auch vom Mandantenspeicherkonto getrennt wurden, bevor Sie die Verbindung auf Mandantenebene trennen können.

Azure Data Lake Gen2 erstellen

Im Verwaltungsportal können Sie unter Dataflows den Zugriff auf dieses Feature für Benutzer deaktivieren und einstellen, dass Arbeitsbereichsadministratoren keine eigenen Azure Storage-Instanzen verwenden können.

Deaktivieren von Azure Data Lake Gen2

Nachdem der Datenfluss Speicher für die Verwendung von Azure Data Lake Gen 2 konfiguriert wurde, gibt es keine Möglichkeit, automatisch eine Wiederherstellung durchführen. Der Vorgang zum Zurückkehren zum verwalteten Power BI-Speicher erfolgt manuell.

Zum Zurücksetzen der Migration, die Sie auf Generation 2 vorgenommen haben, müssen Sie die Datenflüsse löschen und im selben Arbeitsbereich neu erstellen. Da wir dann keine Daten aus ADLS Gen 2 löschen, wechseln Sie zur Ressource selbst, und bereinigen Sie die Daten. Dies umfasst die folgenden Schritte:

  1. Exportieren Sie eine Kopie des Datenflusses aus Power BI. Oder kopieren Sie den model.jsfür die Datei. Der model.jsfür die Datei wird in ADLS gespeichert.

  2. Löschen Sie die Datenflüsse.

  3. Trennen von ADLS.

  4. Erstellen Sie den Datenflüsse mithilfe des Imports neu. Beachten Sie, dass inkrementelle Aktualisierungsdaten (falls zutreffend) vor dem Importieren gelöscht werden müssen. Dies können Sie erreichen, indem Sie die relevanten Partitionen in der model.jsDatei löschen.

  5. Konfigurieren Sie die Richtlinien für die inkrementelle Aktualisierung

Herstellen einer Verbindung mit den Daten mithilfe des ADLS Gen 2-Connector

Im Rahmen dieses Dokuments werden ADLS Gen 2-Datenfluss Verbindungen und nicht der Power BI ADLS Gen 2-Connector beschrieben. Das Arbeiten mit dem ADLS Gen 2-Connector ist ein separates, möglicherweise Additiv Szenario. Der ADLS-Connector verwendet einfach ADLS als Datenquelle. Dies bedeutet, dass die Verwendung von PQO zum Abfragen dieser Daten nicht im CDM-Format vorliegen muss. es kann sich dabei um das vom Kunden gewünschte Datenformat handeln. Weitere Informationen finden Sie unter Azure Data Lake Storage Gen2.

In den folgenden Artikeln finden Sie weitere Informationen zu Dataflows und Power BI: