Übung – Daten konsolidieren

14 Minuten

Ihre Aufgabe für diese Übung besteht darin, aus zwei Datasets ein neues Prozess-Mining-Projekt zu erstellen.

In dieser Übung überprüfen Sie die Daten, stellen sicher, dass die erforderlichen Felder in den Datasets enthalten sind, ermitteln die übereinstimmenden Spalten zwischen den Datasets, laden Sie Datasets hoch, und führen die Datasets anschließend basierend auf den übereinstimmenden Spalten zusammen.

Ziele

Ihre Lernziele für diese Übung sind:

Daten überprüfen und vorbereiten
Erstellen Sie den Prozess und laden Sie Daten aus mehreren Quellen.
Datasets basierend auf übereinstimmenden Spalten zusammenführen
Attribute zuordnen

Erforderliche Felder

Damit Prozess-Mining Ihre Ereignisprotokolle analysieren kann, benötigen Sie die folgenden Felder: Case ID, Activity und Event Start.

Daten vorbereiten und laden

Sie erhalten zwei Datasets im XLSX-Format. Sie möchten die Daten überprüfen, sicherstellen, dass alle erforderlichen Felder in den Datasets enthalten sind, die übereinstimmenden Spalten identifizieren und dann den Prozess erstellen.

Wesentliche Schritte: Daten vorbereiten und laden

Versuchen Sie, die folgenden wesentlichen Schritte auszuführen, um diese Übung abzuschließen. Wenn Sie nicht weiterkommen, gehen Sie zum Abschnitt mit der schrittweisen Anleitung, und folgen Sie stattdessen diesen Anweisungen.

Öffnen Sie die Dateien, und überprüfen Sie das Dataset.
Konvertieren Sie die Daten bei Bedarf in ein leicht lesbares Format.
Überprüfen Sie, ob alle erforderlichen Spalten in den Datasets enthalten sind.
Identifizieren Sie die übereinstimmenden Spalten zwischen den Datasets.
Speichern Sie Datasets als CSV-Dateien.
Erstellen Sie den Prozess, und laden Sie die Datasets hoch.

Schrittweise Anleitung: Daten vorbereiten und laden

Dieser Abschnitt enthält ausführlichere Anleitungen zu den vorhergehenden wesentlichen Schritten.

Aufgabe: Datasets überprüfen und übereinstimmende Spalten identifizieren

Ihre erste Aufgabe besteht darin, Datasets zu überprüfen und übereinstimmende Spalten zu identifizieren, indem Sie die folgenden Schritte ausführen:

Suchen und öffnen Sie die Datei AP_EV_LAB_Combine_log.xlsx.

Die Daten in der Datei sollten dem nächsten Bild ähneln.

Hinweis

Die Daten sind durch einen senkrechten Strich (|) getrennt, was das Lesen erschwert. Verwenden Sie die Excel-Funktion Text in Spalten, um das Lesen der Daten einfacher zu gestalten.
Wählen Sie die Registerkarte Daten aus.
Alle Daten für jede Zeile befinden sich in einer Zelle. Wählen Sie alle Zeilen, einschließlich der Kopfzeile, und dann die Schaltfläche Text in Spalten aus.
Wählen Sie Getrennt und dann Weiter aus.
Wählen Sie Andere aus, geben Sie ein vertikales Strichzeichen (|) ein, und wählen Sie dann Weiter aus.
Wählen Sie Fertig stellen aus.

Die Daten sollten nun leichter zu lesen sein.
Überprüfen Sie, ob die erforderlichen Felder vorhanden sind.
Identifizieren Sie andere Felder, die Sie möglicherweise für das Prozess-Mining zuordnen möchten. Wählen Sie Fertig stellen aus.
Sie können sich Notizen zu den Feldern machen, die Sie verwenden möchten. Wählen Sie Datei > Speichern unter aus, nachdem Sie die Daten überprüft haben.
Speichern Sie die Datei als Standard-CSV, und geben Sie ihr anschließend einen aussagekräftigen Namen.
Schließen Sie die Datei.
Bereiten Sie das zweite Dataset vor, indem Sie die Datei „AP_EV_LAB_Combine_attr.xlsx“ suchen und öffnen.

Die Daten in der Datei sollten dem nächsten Bild ähneln.

Hinweis

Die Daten sind durch einen senkrechten Strich (|) getrennt, was das Lesen erschwert. Verwenden Sie die Excel-Funktion Text in Spalten, um das Lesen der Daten einfacher zu gestalten.
Wählen Sie die Registerkarte Daten aus.
Alle Daten für jede Zeile befinden sich in einer Zelle. Wählen Sie alle Zeilen, einschließlich der Kopfzeile, und dann die Schaltfläche Text in Spalten aus.
Wählen Sie Getrennt und dann Weiter aus.
Wählen Sie Andere aus, geben Sie ein vertikales Strichzeichen (|) ein, und wählen Sie dann Weiter aus.
Wählen Sie Fertig stellen aus.

Die Daten sollten nun leichter zu lesen sein.
Alle erforderlichen Felder sind bereits in der ersten Datei vorhanden. Suchen Sie die Spalten, die beide Datasets gemeinsam haben.
Beachten Sie, dass InvoiceID und Case ID aus dem ersten Dataset übereinstimmen. Verwenden Sie diese Spalten als übereinstimmende Spalten.
Identifizieren Sie andere Felder, die Sie für das Prozess-Mining zuordnen möchten.
Sie können sich Notizen zu den Feldern machen, die Sie verwenden möchten. Wählen Sie Datei > Speichern unter aus, nachdem Sie die Daten überprüft haben.
Speichern Sie die Datei als CSV, und geben Sie ihr anschließend einen aussagekräftigen Namen.
Schließen Sie die Datei.

Aufgabe: Prozess erstellen und Daten laden

Führen Sie die folgenden Schritte aus, um den Prozess zu erstellen und die Daten zu laden:

Navigieren Sie zu Microsoft Power Automate, und wählen Sie die richtige Umgebung aus.
Wählen Sie im linken Bereich Prozess-Mining und dann + Hier beginnen aus.
Geben Sie Zusammengeführte Datasets als Prozessname ein, wählen Sie Daten importieren als Datenquelle, wählen Sie Datenfluss und dann Weiter aus.
Wählen Sie Überspringen aus, wenn das System Sie auffordert, einen Power BI-Arbeitsbereich hinzuzufügen.
Wählen Sie Text/CSV als Datenquelle aus.
Wählen Sie Datei hochladen und dann die Schaltfläche Durchsuchen aus.
Wählen Sie die erste CSV-Datei, die Sie erstellt haben, und dann Öffnen aus.
Wenn Sie nicht angemeldet sind, wählen Sie die Schaltfläche Anmelden aus, und geben Sie Ihre Anmeldeinformationen ein.
Wählen Sie Weiter aus.
Es sollte nun eine Vorschau der Daten angezeigt werden. Wählen Sie Weiter aus.

Das System sollte Sie zur Transformationsphase weiterleiten.
Wählen Sie zum laden des zweiten Datasets die Option Daten abrufen und dann Text/CSV aus.
Wählen Sie Datei hochladen und dann die Schaltfläche Durchsuchen aus.
Wählen Sie die zweite CSV-Datei, die Sie erstellt haben, und dann Öffnen aus.
Wählen Sie Weiter aus.
Es sollte nun eine Vorschau der Daten angezeigt werden. Wählen Sie Erstellen aus.

Es sollten nun zwei Tabellen geladen sein.

Datasets zusammenführen

Nachdem Sie alle Datasets erfolgreich geladen haben, können Sie sie nun zu einer neuen, konsolidierten Tabelle zusammenführen. In diese neue Tabelle sind Daten aus beiden geladenen Datasets integriert.

Wesentliche Schritte: Datasets zusammenführen

Verwenden Sie die Funktion Abfragen als neue Abfrage zusammenführen von Power Query, um die beiden Datasets in einer neuen Tabelle zusammenzuführen.
Wählen Sie die linke und rechte Zusammenführungstabelle aus.
Wählen Sie die richtigen übereinstimmenden Spalten zwischen den beiden Tabellen aus.
Stellen Sie sicher, dass Sie die Daten mit einem linken äußeren Join zusammenführen.
Klappen Sie die Tabelle auf.
Schließen Sie doppelte Spalten aus.
Benennen Sie die Tabelle um.
Aktivieren Sie die Ladefunktionen für die Tabelle, die Sie laden möchten, und deaktivieren Sie anschließend die Ladefunktionen für die anderen beiden Tabellen.
Ordnen Sie die Daten zu.
Speichern Sie den Prozess.

Schrittweise: Datasets zusammenführen

Dieser Abschnitt enthält ausführlichere Anleitungen zu den vorhergehenden wesentlichen Schritten.

Aufgabe: Datensätze und Karte zusammenführen

Führen Sie die folgenden Schritte aus, um die Datensätze und die Karte zusammenzuführen:

Wählen Sie das Dropdownmenü Abfragen zusammenführen und dann Abfragen als neue Abfrage zusammenführen aus.
Wählen Sie die erste Tabelle, die Sie für Linke Tabelle zum Zusammenführen erstellt haben, und dann Case ID als übereinstimmende Spalte.
Wählen Sie die zweite Tabelle, die Sie für Rechte Tabelle zum Zusammenführen erstellt haben, und dann InvoiceID als übereinstimmende Spalte aus.
Wählen Sie Linker äußerer Join als Art des Joins und dann OK aus.
Es sollte die folgende Fehlermeldung angezeigt werden: „Die Auswertung wurde abgebrochen, da beim Kombinieren von Daten aus mehreren Quellen Daten von einer Quelle zur anderen weitergegeben werden können.“ Klicken Sie auf „Weiter“, wenn Sie mit der Möglichkeit der Offenlegung von Daten einverstanden sind.“ Wählen Sie Weiter aus.
Die zweite Tabelle sollte jetzt als eine Spalte angezeigt werden. Erweitern Sie die Tabelle, und wählen Sie die Spalten aus, die Sie hinzufügen möchten. Suchen Sie die zweite Tabellenspalte, und wählen Sie dann das Symbol Erweitern aus.

Hinweis

Wählen Sie nun die Spalten aus, die Sie einbeziehen möchten. Da die Zusammenführungstabelle nicht mehrere Spalten mit den Werten enthalten soll, sollten Sie Spalten auswählen, die für diese Tabelle eindeutig sind.
Deaktivieren Sie das Kontrollkästchen InvoiceID, und wählen Sie OK aus.

Die Tabelle „Merge“ sollte nun der folgenden Abbildung ähneln.
Klicken Sie mit der rechten Maustaste auf die Tabelle Merge, und wählen Sie dann Umbenennen aus.
Benennen Sie die Tabelle in Merged_log_attr um.
Die Ladefunktion ist standardmäßig in allen drei Tabellen aktiviert. Da Sie nur die Tabelle „Merge“ laden möchten, klicken Sie mit der rechten Maustaste auf die erste Tabelle, und wählen Sie dann Laden aktivieren aus. Diese Aktion deaktiviert die Ladefunktion für die erste Tabelle.
Klicken Sie mit der rechten Maustaste auf die zweite Tabelle, und wählen Sie dann Laden aktivieren aus. Diese Aktion deaktiviert die Ladefunktion für die zweite Tabelle.
Der Name der Tabellen mit deaktivierter Ladefunktion sollte in Kursivschrift angezeigt werden.
Wählen Sie Weiter aus.
Das System sollte Sie zur Zuordnungsphase weiterleiten. Zunächst ordnen Sie die erforderlichen Felder zu, wie in der folgenden Tabelle gezeigt.

Attributname Attributtyp Attributdatentyp

Case ID Case ID Text

Activity Activity Text

Timestamp Event Start Datum/Uhrzeit
Ordnen Sie alle anderen Felder zu, die Sie einbeziehen möchten. Ordnen Sie für diese Übung alle Felder zu.

Attributname	Attributtyp	Attributdatentyp
Case ID	Case ID	Text
Activity	Activity	Text
Timestamp	Event Start	Datum/Uhrzeit

Ordnen Sie die restlichen Felder zu, wie in der folgenden Tabelle gezeigt.

Attributname	Attributtyp	Attributdatentyp
Resource	Resource	Text
Resource Name	Event Level Attribute	Text
Vendor	Case Level Attribute (first event)	Text
Automation	Case Level Attribute (first event)	Text
Paid on Time	Case Level Attribute (first event)	Text
Reason for Rejection	Case Level Attribute (first event)	Text
Cash Discount %	Case Level Attribute (first event)	Numerisch
Cash Discount Value	Financial per Case (first event)	Numerisch
Invoice Value	Financial per Case (first event)	Numerisch
Business Unit	Case Level Attribute (first event)	Text
Region	Case Level Attribute (first event)	Text

Wählen Sie Speichern und analysieren aus, nachdem Sie die Felder zugeordnet haben.
Warten, bis Analyse abgeschlossen ist. Dieser Prozess kann einige Minuten dauern.

Nach Abschluss der Analyse sollte die Prozessübersicht der folgenden Abbildung ähneln.

Feedback

War diese Seite hilfreich?