Tutorial: Erstellen eines Machine Learning-Modells in Power BI

In diesem Tutorial verwenden Sie automatisiertes maschinelles Lernen zum Erstellen und Anwenden eines binären Vorhersagemodells in Power BI. Sie erstellen einen Power BI-Dataflow und verwenden die im Dataflow definierten Entitäten, um ein Machine Learning-Modell direkt in Power BI zu trainieren und zu überprüfen. Anschließend verwenden Sie dieses Modell, um neue Daten zu bewerten und Vorhersagen zu generieren.

Zunächst erstellen Sie ein Machine Learning-Modell für die binäre Vorhersage der Kaufabsichten von Onlinekunden auf Basis ihrer Onlinesitzungsattribute. Für diese Übung verwenden Sie ein Benchmark-Machine Learning-Semantikmodell. Nachdem Sie ein Modell trainiert haben, generiert Power BI automatisch einen Überprüfungsbericht, in dem die Modellergebnisse erläutert werden. Sie können dann den Überprüfungsbericht auswerten und das Modell zur Bewertung auf die Daten anwenden.

Dieses Tutorial besteht aus den folgenden Schritten:

  • Erstellen eines Dataflows mit den Eingabedaten
  • Erstellen und Trainieren eines Machine Learning-Modells
  • Auswerten des Modellüberprüfungsberichts
  • Anwenden des Modells auf eine Dataflowentität
  • Verwenden der bewerteten Ausgabe des Modells in einem Power BI-Bericht

Erstellen eines Dataflows mit den Eingabedaten

Erstellen Sie einen Dataflow mit Eingabedaten, indem Sie die folgenden Schritte ausführen.

Daten abrufen

Der erste Schritt beim Erstellen eines Dataflows besteht darin, dass Sie Ihre Datenquellen bereithalten. In diesem Fall verwenden Sie ein Machine Learning-Semantikmodell aus einer Reihe von Onlinesitzungen, die teilweise zum Kaufabschluss führten. Das Semantikmodell enthält eine Reihe von Attributen zu diesen Sitzungen, die Sie zum Trainieren Ihres Modells verwenden.

Sie können das Semantikmodell von der UC Irvine-Website abrufen oder die Datei online_shoppers_intention.csv herunterladen. Weiter unten in diesem Tutorial stellen Sie eine Verbindung mit dem Semantikmodell her, indem Sie dessen URL angeben.

Erstellen der Tabellen

Um die Entitäten in Ihrem Dataflow zu erstellen, melden Sie sich beim Power BI-Dienst an, und navigieren Sie zu einem Arbeitsbereich.

  1. Wenn Sie über keinen Arbeitsbereich verfügen, erstellen Sie einen Arbeitsbereich, indem Sie im linken Navigationsbereich von Power BI Arbeitsbereiche und dann Arbeitsbereich erstellen auswählen. Geben Sie im Bereich Arbeitsbereich erstellen einen Arbeitsbereichsnamen ein, und wählen Sie Speichern aus.

    Screenshot of how to create a workspace.

  2. Wählen Sie oben im neuen Arbeitsbereich Neu und dann Dataflow aus.

    Screenshot of how to create a dataflow.

  3. Wählen Sie Neue Tabellen hinzufügen aus, um einen Power Query-Editor im Browser zu starten.

    Screenshot of selecting Add new tables.

  4. Wählen Sie im Bildschirm Datenquelle auswählen die Option Text/CSV als Datenquelle aus.

    Screenshot of selecting Text/CSV in Choose data source.

  5. Fügen Sie auf der Seite Mit einer Datenquelle verbinden den folgenden Link zur Datei online_shoppers_intention.csv in das Feld Dateipfad oder URL ein, und wählen Sie dann Weiter aus.

    https://raw.githubusercontent.com/santoshc1/PowerBI-AI-samples/master/Tutorial_AutomatedML/online_shoppers_intention.csv

    Screenshot that shows pasting in the file path.

  6. Der Power Query-Editor zeigt eine Vorschau der Daten aus der CSV-Datei an. Um vor dem Laden Änderungen an den Daten vorzunehmen, wählen Sie Daten transformieren aus.

    Screenshot of selecting Transform data on the Preview file data screen.

  7. Power Query leitet automatisch die Datentypen der Spalten ab. Sie können die Datentypen ändern, indem Sie oben in den Spaltenheadern das Attributtypsymbol auswählen. In diesem Beispiel ändern wir den Typ der Spalte Revenue (Umsatz) in TRUE/FALSE.

    Sie können die Abfrage in einen benutzerfreundlicheren Namen umbenennen, indem Sie den Wert im Feld Name im rechten Bereich ändern. Ändern Sie den Abfragenamen in Online visitors (Onlinebesucher).

    Screenshot of changing the query name and Revenue column data type.

  8. Wählen Sie Speichern und schließen aus, geben Sie im Dialogfeld einen Namen für den Dataflow an, und wählen Sie dann Speichern aus.

    Screenshot of saving the dataflow.

Erstellen und Trainieren eines Machine Learning-Modells

So fügen Sie ein Machine Learning-Modell hinzu

  1. Wählen Sie das Symbol ML-Modell anwenden in der Liste Aktionen für die Tabelle aus, die Ihre Trainingsdaten und Beschriftungsinformationen enthält, und wählen Sie dann Machine Learning-Modell hinzufügen aus.

    Screenshot that shows adding a machine learning model.

  2. Der erste Schritt beim Erstellen Ihres Machine Learning-Modells besteht darin, die Verlaufsdaten zu identifizieren, einschließlich des Ergebnisfelds, das Sie vorhersagen möchten. Das Modell wird erstellt, indem es aus diesen Daten lernt. In diesem Fall möchten Sie vorhersagen, ob Besucher einen Kauf tätigen oder nicht. Das Ergebnis, das Sie vorhersagen möchten, befindet sich im Feld Revenue (Umsatz). Wählen Sie Revenue (Umsatz) als Wert für Ergebnisspalte aus, und wählen Sie dann Weiter aus.

    Screenshot that shows selecting a historical data field.

  3. Als Nächstes müssen Sie den Typ des zu erstellenden Machine Learning-Modells auswählen. Power BI analysiert die Werte in dem von Ihnen angegeben Ergebnisfeld und schlägt die Machine Learning-Modelltypen vor, die zur Vorhersage dieses Felds erstellt werden können.

    Da Sie in diesem Fall ein binäres Ergebnis vorhersagen möchten, d. h. ob ein Besucher einen Kauf tätigen wird oder nicht, empfiehlt Power BI die binäre Vorhersage. Da Sie Besucher vorhersagen möchten, die einen Kauf tätigen, wählen Sie unter Zielergebnis auswählen die Option TRUE aus. Sie können auch verschiedene Beschriftungen für die Ergebnisse im automatisch generierten Bericht angeben, der die Ergebnisse der Modellüberprüfung zusammenfasst. Wählen Sie Weiteraus.

    Screenshot that shows the Binary prediction screen.

  4. Power BI führt eine vorläufige Überprüfung einer Stichprobe Ihrer Daten durch und schlägt Eingaben vor, die möglicherweise genauere Vorhersagen liefern. Wenn Power BI eine Spalte nicht empfiehlt, werden die Gründe dafür neben der Spalte erläutert. Sie können die Auswahl so ändern, dass sie nur die Felder enthält, die das Modell untersuchen soll, indem Sie die Kontrollkästchen neben Spaltennamen aktivieren oder deaktivieren. Wählen Sie Weiter aus, um die Eingaben zu akzeptieren.

    Screenshot that shows the column selections.

  5. Benennen Sie das Modell im letzten Schritt als Purchase intent prediction (Kaufabsichtsvorhersage), und wählen Sie den Zeitraum aus, der für das Training aufwendet werden soll. Sie können die Trainingszeit verkürzen, um schnelle Ergebnisse zu erzielen, oder die Trainingszeit verlängern, um das beste Modell zu erhalten. Wählen Sie dann Speichern und trainieren aus, um mit dem Training des Modells zu beginnen.

    Screenshot that shows naming the model and choosing the training time.

Wenn Sie einen Fehler wie Keine Anmeldeinformationen für die Datenquelle gefunden erhalten, müssen Sie Ihre Anmeldeinformationen aktualisieren, damit Power BI die Daten bewerten kann. Um Ihre Anmeldeinformationen zu aktualisieren, wählen Sie in der Kopfzeile Weitere Optionen und dann Einstellungen>Einstellungen aus.

Screenshot that shows selecting Settings.

Wählen Sie unter Dataflows Ihren Dataflow aus, erweitern Sie Datenquellen-Anmeldeinformationen, und wählen Sie dann Anmeldeinformationen bearbeiten aus.

Screenshot that shows editing Dataflow credentials.

Nachverfolgen des Trainingsstatus

Der Trainingsprozess beginnt mit der Stichprobenentnahme und Normalisierung ihrer Verlaufsdaten sowie dem Aufteilen Ihres Semantikmodells in zwei neue Entitäten: Purchase Intent Prediction Training Data (Trainingsdaten für Kaufabsichtsvorhersage) und Purchase Intent Prediction Test Data (Testdaten für Kaufabsichtsvorhersage).

Abhängig von der Größe des Semantikmodells kann der Trainingsprozess einige Minuten bis zu der ausgewählten Trainingszeit dauern. Sie können über den Status des Dataflows feststellen, ob das Modell trainiert und überprüft wird. Der Status wird als laufende Datenaktualisierung auf der Registerkarte Semantikmodelle und Dataflows des Arbeitsbereichs angezeigt.

Screenshot that shows the model under training.

Sie können das Modell auf der Registerkarte Machine Learning-Modelle des Dataflows sehen. Der Status zeigt an, ob das Modell in eine Warteschlange eingereiht wurde, gerade trainiert wird oder bereits trainiert wurde. Nach Abschluss des Modelltrainings zeigt der Dataflow die aktualisierte Zeit für Zuletzt trainiert und den Status Trainiert an.

Screenshot that shows the Trained status and Last trained time.

Auswerten des Modellüberprüfungsberichts

Um den Modellüberprüfungsbericht anzuzeigen, wählen Sie in der Registerkarte Machine Learning-Modelle die Schaltfläche Trainingsbericht anzeigen unter Aktionen aus. In diesem Bericht wird beschrieben, wie das Machine Learning-Modell wahrscheinlich durchgeführt wird.

Wählen Sie auf der Seite Modellleistung des Berichts die Option Beste Prädiktoren anzeigen aus, um die wichtigsten Prädiktoren für das Modell anzuzeigen. Sie können eine der Vorhersagen auswählen, um zu sehen, wie die Ergebnisverteilung mit dieser Vorhersage verknüpft ist.

Screenshot that shows the Model performance page.

Sie können den Slicer Wahrscheinlichkeitsschwellenwert auf der Seite Modellleistung verwenden, um die Auswirkung von Genauigkeit und Abruf auf das Modell zu untersuchen.

Screenshot that shows the Probability Threshold slicer.

Die anderen Seiten des Berichts beschreiben die statistischen Leistungsmetriken für das Modell.

Der Bericht enthält auch eine Seite Trainingsdetails, auf der die ausgeführten Iterationen, die Extraktion von Features aus den Eingaben und die Hyperparameter für das endgültige Modell beschrieben werden.

Anwenden des Modells auf eine Dataflowentität

Wählen Sie oben im Bericht die Schaltfläche Modell anwenden aus, um dieses Modell aufzurufen. Im Dialogfeld Anwenden können Sie die Zielentität mit den Quelldaten angeben, auf die das Modell angewendet werden soll. Wählen Sie dann Speichern und anwenden aus.

Screenshot that shows applying the model.

Durch Anwenden des Modells werden zwei neue Entitäten mit dem Suffix angereichert <Modellname> und angereichert <Modellname> Erklärungen erstellt. In diesem Fall wird durch Anwenden des Modells auf die Tabelle Online visitors (Onlinebesucher) Folgendes erstellt:

  • Online visitors enriched Purchase intent prediction (angereicherte Kaufabsichtsvorhersage für Onlinebesucher), die die vorhergesagte Ausgabe des Modells enthält.
  • Online visitors enriched Purchase intent prediction explanations (Erklärungen zur angereicherten Kaufabsichtsvorhersage für Onlinebesucher), die die wichtigsten datensatzspezifischen Einflussfaktoren für die Vorhersage enthält.

Beim Anwenden des binären Vorhersagemodells werden vier Spalten hinzugefügt: Outcome, PredictionScore, PredictionExplanation und ExplanationIndex, die jeweils mit einem Präfix Purchase intent prediction (Kaufabsichtsvorhersage) versehen sind.

Screenshot that shows the four new columns.

Sobald die Dataflowaktualisierung abgeschlossen ist, können Sie die Tabelle Online visitors enriched Purchase intent prediction (angereicherte Kaufabsichtsvorhersage für Onlinebesucher) auswählen, um die Ergebnisse anzuzeigen.

Screenshot that shows viewing the results in the Online visitors enriched Purchase intent prediction table.

Sie können auch ein beliebiges Modell des automatisierten maschinellen Lernens im Arbeitsbereich direkt aus dem Power Query-Editor im Dataflow aufrufen. Um auf die Modelle des automatisierten maschinellen Lernens zuzugreifen, wählen Sie Bearbeiten für die Tabelle aus, die Sie mit Erkenntnissen aus Ihrem Modell des automatisierten maschinellen Lernens anreichern möchten.

Screenshot that shows selecting Edit for the table.

Wählen Sie im Power Query-Editor im Menüband KI-Erkenntnisse aus.

Screenshot that shows selecting AI insights.

Wählen Sie im Bildschirm KI-Erkenntnisse im Navigationsbereich den Ordner Power BI Machine Learning-Modelle aus. In der Liste werden alle Machine Learning-Modelle, auf die Sie zugreifen können, als Power Query-Funktionen angezeigt. Die Eingabeparameter für das Modell des maschinellen Lernens werden automatisch als Parameter der entsprechenden Power Query-Funktion zugeordnet. Die automatische Parameterzuordnung erfolgt nur, wenn die Namen und Datentypen des Parameters identisch sind.

Um ein Machine Learning-Modell aufzurufen, können Sie eine der Spalten des ausgewählten Modells als Eingabe in der Dropdownliste auswählen. Sie können auch einen konstanten Wert angeben, der als Eingabe verwendet werden soll, indem Sie das Spaltensymbol neben der Eingabezeile umschalten.

Screenshot that shows the Power Query functions browser.

Klicken Sie auf Anwenden, um die Vorschau der Ausgabe des Machine Learning-Modells als neue Spalten in der Tabelle anzuzeigen. Der Modellaufruf wird auch unter Angewendete Schritte für die Abfrage angezeigt.

Screenshot that shows viewing preview results in Power Query Editor.

Nach dem Speichern Ihres Dataflows wird das Modell automatisch aufgerufen, wenn der Dataflow aktualisiert wird, um etwaige neue oder aktualisierte Zeilen in der Entitätstabelle zu berücksichtigen.

Verwenden der bewerteten Ausgabe des Modells in einem Power BI-Bericht

Wenn Sie die bewertete Ausgabe Ihres Machine Learning-Modells verwenden möchten, können Sie über Power BI Desktop mithilfe des Connectors Dataflows eine Verbindung mit Ihrem Dataflow herstellen. Sie können jetzt die Entität Online visitors enriched Purchase intent prediction (angereicherte Kaufabsichtsvorhersage für Onlinebesucher) verwenden, um die Vorhersagen aus Ihrem Modell in Power BI-Berichte einzubinden.

Einschränkungen

Es gibt einige bekannte Probleme bei der Verwendung von Gateways mit automatisiertem maschinellem Lernen. Wenn ein Gateway erforderlich ist, sollte am besten ein Dataflow erstellt werden, der die erforderlichen Daten zuerst über das Gateway importiert. Erstellen Sie dann einen anderen Dataflow, der auf den ersten Dataflow verweist, um diese Modelle zu erstellen oder anzuwenden.

Wenn Ihre KI mit Dataflows fehlschlägt, müssen Sie möglicherweise Fast Combine aktivieren, wenn Sie KI mit Dataflows verwenden. Nachdem Sie Ihre Tabelle importiert haben und bevor Sie mit dem Hinzufügen von KI-Features beginnen, wählen Sie im Menüband Start die Optionen aus, und aktivieren Sie im daraufhin angezeigten Fenster das Kontrollkästchen neben Kombination von Daten aus mehreren Quellen zulassen, um das Feature zu aktivieren, und wählen Sie dann OK aus, um Ihre Auswahl zu speichern. Anschließend können Sie Ihrem Dataflow KI-Features hinzufügen.

In diesem Tutorial haben Sie mithilfe der folgenden Schritte ein binäres Vorhersagemodell in Power BI erstellt und angewendet:

  • Erstellen eines Dataflows mit den Eingabedaten
  • Erstellen und Trainieren eines Machine Learning-Modells
  • Auswerten des Modellüberprüfungsberichts
  • Anwenden des Modells auf eine Dataflowentität
  • Verwenden der bewerteten Ausgabe des Modells in einem Power BI-Bericht

Weitere Informationen zur Machine Learning-Automatisierung in Power BI finden Sie unter Automatisiertes maschinelles Lernen in Power BI.