Verwenden von R im Power Query-Editor

R ist eine leistungsfähige Programmiersprache, die von vielen Statistikern, Data Scientists und Data Analysts verwendet wird. Mit R können Sie im Power Query-Editor von Power BI Desktop folgende Aufgaben durchführen:

  • Vorbereiten von Datenmodellen

  • Erstellen von Berichten

  • Bereinigen von Daten, Strukturieren von Daten mit modernen Methoden und Analysieren von Datasets, was auch die Vervollständigung fehlender Daten, Vorhersagen, Clustering und vieles mehr einschließt

Installieren von R

Sie können R kostenlos über die Downloadseite von Revolution Open und aus dem CRAN-Repository herunterladen.

Installieren von „mice“

Als Voraussetzung müssen Sie die mice-Bibliothek in Ihrer R-Umgebung herunterladen. Ohne mice wird der Code im Beispielskript nicht richtig ausgeführt. Im mice-Paket ist eine Methode zum Umgang mit fehlenden Daten implementiert.

So installieren Sie die mice-Bibliothek:

  1. Starten Sie das Programm „R. exe“ (z. B. unter C:\Programme\Microsoft\R Open\R-3.5.3\bin\R.exe).

  2. Führen Sie in der R-Eingabeaufforderung den install-Befehl aus:

    install.packages('mice') 
    

Verwenden von R im Power Query-Editor

Im Folgenden wird demonstriert, wie Sie R im Power Query-Editor verwenden können. Dazu nutzen Sie ein Beispieldataset, das sich in einer CSV-Datei befindet und Börsendaten enthält, und führen die folgenden Schritte aus:

  1. Laden Sie die Datei EuStockMarkets_NA.csv herunter. Merken Sie sich, wo Sie sie gespeichert haben.

  2. Laden Sie Daten in Power BI Desktop. Klicken Sie auf der Registerkarte Start auf Daten abrufen>Text/CSV.

    Klicken auf „Text/CSV“

  3. Wählen Sie die Datei EuStockMarkets_NA.csv aus, und klicken Sie dann auf Öffnen. Die CSV-Daten werden im Dialogfeld Text/CSV file (Text/CSV-Datei) angezeigt.

    Auswählen der CSV-Datei

  4. Klicken Sie auf Laden, um die Daten aus der Datei zu laden. Nachdem die Daten in Power BI geladen wurden, wird im Bereich Felder eine neue Tabelle angezeigt.

    Daten im Bereich „Felder“

  5. Klicken Sie im Menüband Start auf Daten transformieren, um den Power Query-Editor zu öffnen.

    „Daten transformieren“ auswählen

  6. Klicken Sie auf der Registerkarte Transformieren auf R-Skript ausführen. Der Editor R-Skript ausführen wird angezeigt. In den Zeilen 15 und 20 sowie in weiteren Zeilen, die nicht auf dem Screenshot zu sehen sind, fehlen Daten. Die unten aufgeführten Schritte verdeutlichen, wie R diese Zeilen automatisch vervollständigt.

    Klicken auf „R-Skript ausführen“

  7. Geben Sie für dieses Beispiel den folgenden Skriptcode im Fenster R-Skript ausführen in das Feld Skript ein. Ersetzen Sie <Your File Path> durch den Pfad zu EuStockMarkets_NA.csv auf Ihrem lokalen Dateisystem. Dieser könnte z. B. wie folgt aussehen: C:/Benutzer/John Doe/Dokumente/Microsoft/EuStockMarkets_NA.csv.

       dataset <- read.csv(file="<Your File Path>/EuStockMarkets_NA.csv", header=TRUE, sep=",")
       library(mice)
       tempData <- mice(dataset,m=1,maxit=50,meth='pmm',seed=100)
       completedData <- complete(tempData,1)
       output <- dataset
       output$completedValues <- completedData$"SMI missing values"
    

    Hinweis

    Möglicherweise müssen Sie eine Variable mit dem Namen output überschreiben, damit das neue Dataset mit den angewendeten Filtern ordnungsgemäß erstellt wird.

  8. Klicken Sie auf OK. Im Power Query-Editor wird dann ein Hinweis zum Datenschutz angezeigt.

    Datenschutzwarnung

  9. Klicken Sie neben der Warnung auf Fortsetzen. Legen Sie im angezeigten Dialogfeld Datenschutzebenen für alle Datenquellen für R-Skripts Öffentlich fest, damit sie im Power BI-Dienst ordnungsgemäß funktionieren.

    Dialogfeld „Datenschutzebenen“

    Weitere Informationen zu den Datenschutzeinstellungen und deren Bedeutung finden Sie unter Power BI Desktop – Datenschutzebenen.

  10. Klicken Sie auf Erstellen, um das Skript auszuführen.

Im Bereich Felder wird eine neue Spalte mit dem Namen completedValues angezeigt. In dieser Spalte fehlen einige Datenelemente, z. B. in Zeile 15 und 18. Im nächsten Abschnitt sehen Sie, wie dies von R behandelt wird.

Mit einigen wenigen Zeilen R-Skript konnte der Power Query-Editor die fehlenden Werte anhand eines Vorhersagemodells einfügen.

Erstellen von Visuals aus Daten in R-Skripts

Sie können nun ein Visual erstellen, um zu zeigen, wie der R-Skriptcode zusammen mit der mice-Bibliothek die fehlenden Werte vervollständigt.

R-Skript-Visual

Sie können die vollständigen Visuals in einer Power BI Desktop-Datei im PBIX-Format speichern und das Datenmodell sowie die zugehörigen R-Skripts im Power BI-Dienst verwenden.

Hinweis

Sie können eine PBIX-Datei herunterladen, in der diese Schritte bereits ausgeführt wurden.

Nachdem Sie die PBIX-Datei in den Power BI-Dienst hochgeladen haben, müssen Sie zusätzliche Schritte ausführen, um die Aktualisierung der Dienstdaten und die aktualisierten Visuals zu aktivieren:

  • Aktivieren der zeitgesteuerten Aktualisierung für das Dataset : Um die zeitgesteuerte Aktualisierung für die Arbeitsmappe, die Ihr Dataset enthält, mit R-Skripten zu aktivieren, sehen Sie unter Konfigurieren der zeitgesteuerten Aktualisierung nach. Dieser Artikel enthält auch Informationen zu lokalen Datengateways.

  • Installieren eines Gateways: Auf dem Computer mit der Datei und R muss ein lokales Datengateway (persönlicher Modus) installiert sein. Der Power BI-Dienst greift auf diese Arbeitsmappe zu und rendert alle aktualisierten Visuals neu. Weitere Informationen finden Sie unter Verwenden persönlicher Gateways in Power BI.

Überlegungen und Einschränkungen

Für Abfragen, die im Power Query-Editor erstellte R-Skripts enthalten, gelten einige Einschränkungen:

  • Für alle R-Datenquellen muss die Einstellung Öffentlich festgelegt werden. Dasselbe gilt auch für alle anderen Schritte einer Abfrage im Power Query-Editor.

    Klicken Sie in Power BI Desktop auf Datei >Optionen und Einstellungen >Datenquelleneinstellungen.

    Auswählen der Option „Datenquelleneinstellungen“

    Wählen Sie im Dialogfeld Datenquelleneinstellungen eine oder mehrere Datenquellen aus, und klicken Sie dann auf Berechtigungen bearbeiten. Legen Sie für Datenschutzebene die Einstellung Öffentlich fest.

    Dialogfeld „Datenquelleneinstellungen“

  • Wenn Sie geplante Aktualisierungen der R-Visuals oder des Datasets zulassen möchten, müssen Sie geplante Aktualisierungen aktivieren. Auf dem Computer, auf dem sich die Arbeitsmappe und die R-Installation befinden, muss außerdem ein lokales Datengateway (persönlicher Modus) installiert sein.

Für R und benutzerdefinierte Abfragen gibt es viele verschiedene Verwendungsmöglichkeiten. Analysieren Sie Ihre Daten, und stellen Sie sie in genau der Form dar, die für Sie am geeignetsten ist.

Nächste Schritte