Übung – Daten konsolidieren

Abgeschlossen

Ihre Aufgabe für diese Übung besteht darin, aus zwei Datasets ein neues Prozess-Mining-Projekt zu erstellen.

In dieser Übung überprüfen Sie die Daten, stellen sicher, dass die erforderlichen Felder in den Datasets enthalten sind, ermitteln die übereinstimmenden Spalten zwischen den Datasets, laden Sie Datasets hoch, und führen die Datasets anschließend basierend auf den übereinstimmenden Spalten zusammen.

Ziele

Ihre Lernziele für diese Übung sind:

  • Daten überprüfen und vorbereiten

  • Erstellen Sie den Prozess und laden Sie Daten aus mehreren Quellen.

  • Datasets basierend auf übereinstimmenden Spalten zusammenführen

  • Attribute zuordnen

Erforderliche Felder

Damit Prozess-Mining Ihre Ereignisprotokolle analysieren kann, benötigen Sie die folgenden Felder: Case ID, Activity und Event Start.

Daten vorbereiten und laden

Sie erhalten zwei Datasets im XLSX-Format. Sie möchten die Daten überprüfen, sicherstellen, dass alle erforderlichen Felder in den Datasets enthalten sind, die übereinstimmenden Spalten identifizieren und dann den Prozess erstellen.

Wesentliche Schritte: Daten vorbereiten und laden

Versuchen Sie, die folgenden wesentlichen Schritte auszuführen, um diese Übung abzuschließen. Wenn Sie nicht weiterkommen, gehen Sie zum Abschnitt mit der schrittweisen Anleitung, und folgen Sie stattdessen diesen Anweisungen.

  1. Öffnen Sie die Dateien, und überprüfen Sie das Dataset.

  2. Konvertieren Sie die Daten bei Bedarf in ein leicht lesbares Format.

  3. Überprüfen Sie, ob alle erforderlichen Spalten in den Datasets enthalten sind.

  4. Identifizieren Sie die übereinstimmenden Spalten zwischen den Datasets.

  5. Speichern Sie Datasets als CSV-Dateien.

  6. Erstellen Sie den Prozess, und laden Sie die Datasets hoch.

Schrittweise Anleitung: Daten vorbereiten und laden

Dieser Abschnitt enthält ausführlichere Anleitungen zu den vorhergehenden wesentlichen Schritten.

Aufgabe: Datasets überprüfen und übereinstimmende Spalten identifizieren

Ihre erste Aufgabe besteht darin, Datasets zu überprüfen und übereinstimmende Spalten zu identifizieren, indem Sie die folgenden Schritte ausführen:

  1. Suchen und öffnen Sie die Datei AP_EV_LAB_Combine_log.xlsx.

    Die Daten in der Datei sollten dem nächsten Bild ähneln.

    Screenshot der Darstellung der Daten in den ursprünglichen CSV-Daten

    Hinweis

    Die Daten sind durch einen senkrechten Strich (|) getrennt, was das Lesen erschwert. Verwenden Sie die Excel-Funktion Text in Spalten, um das Lesen der Daten einfacher zu gestalten.

  2. Wählen Sie die Registerkarte Daten aus.

  3. Alle Daten für jede Zeile befinden sich in einer Zelle. Wählen Sie alle Zeilen, einschließlich der Kopfzeile, und dann die Schaltfläche Text in Spalten aus.

    Screenshot der Registerkarte „Daten“ mit allen ausgewählten Zeilen und der hervorgehobenen Schaltfläche „Text in Spalten“

  4. Wählen Sie Getrennt und dann Weiter aus.

    Screenshot des ersten von drei Schritten des Assistenten „Text in Spalten konvertieren“, wobei die Option „Getrennt“ und die Schaltfläche „Weiter“ hervorgehoben sind

  5. Wählen Sie Andere aus, geben Sie ein vertikales Strichzeichen (|) ein, und wählen Sie dann Weiter aus.

    Screenshot des zweiten von drei Schritten des Assistenten „Text in Spalten konvertieren“ mit eingegebenen vertikalen Strich und der Schaltfläche „Weiter“

  6. Wählen Sie Fertig stellen aus.

    Die Daten sollten nun leichter zu lesen sein.

  7. Überprüfen Sie, ob die erforderlichen Felder vorhanden sind.

    Screenshot der hervorgehobenen erforderlichen Felder „Case I D“, „Activity“ und „Timestamp“

  8. Identifizieren Sie andere Felder, die Sie möglicherweise für das Prozess-Mining zuordnen möchten. Wählen Sie Fertig stellen aus.

  9. Sie können sich Notizen zu den Feldern machen, die Sie verwenden möchten. Wählen Sie Datei > Speichern unter aus, nachdem Sie die Daten überprüft haben.

  10. Speichern Sie die Datei als Standard-CSV, und geben Sie ihr anschließend einen aussagekräftigen Namen.

    Screenshot der im CSV-Format gespeicherten Datei mit aussagekräftigem Namen

  11. Schließen Sie die Datei.

  12. Bereiten Sie das zweite Dataset vor, indem Sie die Datei „AP_EV_LAB_Combine_attr.xlsx“ suchen und öffnen.

    Die Daten in der Datei sollten dem nächsten Bild ähneln.

    Screenshot des Dateiinhalts für das zweite Dataset

    Hinweis

    Die Daten sind durch einen senkrechten Strich (|) getrennt, was das Lesen erschwert. Verwenden Sie die Excel-Funktion Text in Spalten, um das Lesen der Daten einfacher zu gestalten.

  13. Wählen Sie die Registerkarte Daten aus.

  14. Alle Daten für jede Zeile befinden sich in einer Zelle. Wählen Sie alle Zeilen, einschließlich der Kopfzeile, und dann die Schaltfläche Text in Spalten aus.

    Screenshot der Registerkarte „Daten“ und der Schaltfläche „Text in Spalten konvertieren“, um das Lesen der Daten zu erleichtern

  15. Wählen Sie Getrennt und dann Weiter aus.

  16. Wählen Sie Andere aus, geben Sie ein vertikales Strichzeichen (|) ein, und wählen Sie dann Weiter aus.

  17. Wählen Sie Fertig stellen aus.

    Die Daten sollten nun leichter zu lesen sein.

  18. Alle erforderlichen Felder sind bereits in der ersten Datei vorhanden. Suchen Sie die Spalten, die beide Datasets gemeinsam haben.

  19. Beachten Sie, dass InvoiceID und Case ID aus dem ersten Dataset übereinstimmen. Verwenden Sie diese Spalten als übereinstimmende Spalten.

    Screenshot der übereinstimmenden Spalte

  20. Identifizieren Sie andere Felder, die Sie für das Prozess-Mining zuordnen möchten.

  21. Sie können sich Notizen zu den Feldern machen, die Sie verwenden möchten. Wählen Sie Datei > Speichern unter aus, nachdem Sie die Daten überprüft haben.

  22. Speichern Sie die Datei als CSV, und geben Sie ihr anschließend einen aussagekräftigen Namen.

    Screenshot des Dateinamens, der in die als CSV gespeicherte Datei eingegeben wird.

  23. Schließen Sie die Datei.

Aufgabe: Prozess erstellen und Daten laden

Führen Sie die folgenden Schritte aus, um den Prozess zu erstellen und die Daten zu laden:

  1. Navigieren Sie zu Microsoft Power Automate, und wählen Sie die richtige Umgebung aus.

    Screenshot der ausgewählten Umgebung in Power Automate

  2. Wählen Sie im linken Bereich Prozess-Mining und dann + Hier beginnen aus.

    Screenshot von Prozess-Mining, das im linken Bereich und mit hervorgehobener Schaltfläche „Hier starten“ ausgewählt wird

  3. Geben Sie Zusammengeführte Datasets als Prozessname ein, wählen Sie Daten importieren als Datenquelle, wählen Sie Datenfluss und dann Weiter aus.

    Screenshot des Assistenten „Neuen Prozess erstellen“, der den ausgefüllten Namen mit den ausgewählten Optionen „Daten importieren“ und „Datenfluss“ zeigt

  4. Wählen Sie Überspringen aus, wenn das System Sie auffordert, einen Power BI-Arbeitsbereich hinzuzufügen.

  5. Wählen Sie Text/CSV als Datenquelle aus.

    Screenshot der Text-CSV, die als Datenquelle ausgewählt ist

  6. Wählen Sie Datei hochladen und dann die Schaltfläche Durchsuchen aus.

    Screenshot der ausgewählten Optionen „Datei hochladen“ und „Durchsuchen“

  7. Wählen Sie die erste CSV-Datei, die Sie erstellt haben, und dann Öffnen aus.

    Screenshot der CSV-Datei und der ausgewählten Schaltfläche „Öffnen“

  8. Wenn Sie nicht angemeldet sind, wählen Sie die Schaltfläche Anmelden aus, und geben Sie Ihre Anmeldeinformationen ein.

  9. Wählen Sie Weiter aus.

    Screenshot der Verbindungseinstellungen mit der Schaltfläche „Weiter“

  10. Es sollte nun eine Vorschau der Daten angezeigt werden. Wählen Sie Weiter aus.

    Screenshot der Vorschaudaten und der ausgewählten Schaltfläche „Weiter“

    Das System sollte Sie zur Transformationsphase weiterleiten.

    Screenshot von Schritt drei von vier der Phase „Daten transformieren“

  11. Wählen Sie zum laden des zweiten Datasets die Option Daten abrufen und dann Text/CSV aus.

    Screenshot der Option „Daten abrufen“ und der für das zweite Dataset ausgewählten Text-CSV

  12. Wählen Sie Datei hochladen und dann die Schaltfläche Durchsuchen aus.

  13. Wählen Sie die zweite CSV-Datei, die Sie erstellt haben, und dann Öffnen aus.

    Screenshot der zweiten CSV-Datei und der ausgewählten Schaltfläche „Öffnen“

  14. Wählen Sie Weiter aus.

  15. Es sollte nun eine Vorschau der Daten angezeigt werden. Wählen Sie Erstellen aus.

Es sollten nun zwei Tabellen geladen sein.

Screenshot der zwei geladenen Datasets

Datasets zusammenführen

Nachdem Sie alle Datasets erfolgreich geladen haben, können Sie sie nun zu einer neuen, konsolidierten Tabelle zusammenführen. In diese neue Tabelle sind Daten aus beiden geladenen Datasets integriert.

Wesentliche Schritte: Datasets zusammenführen

Versuchen Sie, die folgenden wesentlichen Schritte auszuführen, um diese Übung abzuschließen. Wenn Sie nicht weiterkommen, gehen Sie zum Abschnitt mit der schrittweisen Anleitung, und folgen Sie stattdessen diesen Anweisungen.

  1. Verwenden Sie die Funktion Abfragen als neue Abfrage zusammenführen von Power Query, um die beiden Datasets in einer neuen Tabelle zusammenzuführen.

  2. Wählen Sie die linke und rechte Zusammenführungstabelle aus.

  3. Wählen Sie die richtigen übereinstimmenden Spalten zwischen den beiden Tabellen aus.

  4. Stellen Sie sicher, dass Sie die Daten mit einem linken äußeren Join zusammenführen.

  5. Klappen Sie die Tabelle auf.

  6. Schließen Sie doppelte Spalten aus.

  7. Benennen Sie die Tabelle um.

  8. Aktivieren Sie die Ladefunktionen für die Tabelle, die Sie laden möchten, und deaktivieren Sie anschließend die Ladefunktionen für die anderen beiden Tabellen.

  9. Ordnen Sie die Daten zu.

  10. Speichern Sie den Prozess.

Schrittweise: Datasets zusammenführen

Dieser Abschnitt enthält ausführlichere Anleitungen zu den vorhergehenden wesentlichen Schritten.

Aufgabe: Datensätze und Karte zusammenführen

Führen Sie die folgenden Schritte aus, um die Datensätze und die Karte zusammenzuführen:

  1. Wählen Sie das Dropdownmenü Abfragen zusammenführen und dann Abfragen als neue Abfrage zusammenführen aus.

    Screenshot von „Abfragen zusammenführen“ als neue Schaltfläche

  2. Wählen Sie die erste Tabelle, die Sie für Linke Tabelle zum Zusammenführen erstellt haben, und dann Case ID als übereinstimmende Spalte.

  3. Wählen Sie die zweite Tabelle, die Sie für Rechte Tabelle zum Zusammenführen erstellt haben, und dann InvoiceID als übereinstimmende Spalte aus.

  4. Wählen Sie Linker äußerer Join als Art des Joins und dann OK aus.

    Screenshot des Assistenten zum Zusammenführen von Abfragen und der ausgewählten Option „Linker äußerer Join“ als Art des Joins

  5. Es sollte die folgende Fehlermeldung angezeigt werden: „Die Auswertung wurde abgebrochen, da beim Kombinieren von Daten aus mehreren Quellen Daten von einer Quelle zur anderen weitergegeben werden können.“ Klicken Sie auf „Weiter“, wenn Sie mit der Möglichkeit der Offenlegung von Daten einverstanden sind.“ Wählen Sie Weiter aus.

    Screenshot einer Fehlermeldung und der Schaltfläche „Weiter“

  6. Die zweite Tabelle sollte jetzt als eine Spalte angezeigt werden. Erweitern Sie die Tabelle, und wählen Sie die Spalten aus, die Sie hinzufügen möchten. Suchen Sie die zweite Tabellenspalte, und wählen Sie dann das Symbol Erweitern aus.

    Screenshot des Symbols „Erweitern“

    Hinweis

    Wählen Sie nun die Spalten aus, die Sie einbeziehen möchten. Da die Zusammenführungstabelle nicht mehrere Spalten mit den Werten enthalten soll, sollten Sie Spalten auswählen, die für diese Tabelle eindeutig sind.

  7. Deaktivieren Sie das Kontrollkästchen InvoiceID, und wählen Sie OK aus.

    Screenshot des Dialogfelds „Erweitern“ mit deaktiviertem Kontrollkästchen „Rechnungs-ID“

    Die Tabelle „Merge“ sollte nun der folgenden Abbildung ähneln.

    Screenshot der Spalten der Zusammenführungstabelle

  8. Klicken Sie mit der rechten Maustaste auf die Tabelle Merge, und wählen Sie dann Umbenennen aus.

  9. Benennen Sie die Tabelle in Merged_log_attr um.

  10. Die Ladefunktion ist standardmäßig in allen drei Tabellen aktiviert. Da Sie nur die Tabelle „Merge“ laden möchten, klicken Sie mit der rechten Maustaste auf die erste Tabelle, und wählen Sie dann Laden aktivieren aus. Diese Aktion deaktiviert die Ladefunktion für die erste Tabelle.

    Screenshot der deaktivierten Option „Laden aktivieren“

  11. Klicken Sie mit der rechten Maustaste auf die zweite Tabelle, und wählen Sie dann Laden aktivieren aus. Diese Aktion deaktiviert die Ladefunktion für die zweite Tabelle.

  12. Der Name der Tabellen mit deaktivierter Ladefunktion sollte in Kursivschrift angezeigt werden.

    Screenshot der Tabellen mit deaktivierter Ladefunktion

  13. Wählen Sie Weiter aus.

  14. Das System sollte Sie zur Zuordnungsphase weiterleiten. Zunächst ordnen Sie die erforderlichen Felder zu, wie in der folgenden Tabelle gezeigt.

    Attributname Attributtyp Attributdatentyp
    Case ID Case ID Text
    Activity Activity Text
    Timestamp Event Start Datum/Uhrzeit

    Screenshot der erforderlichen in Schritt vier „Daten zuordnen“ von fünf zugeordneten Felder

  15. Ordnen Sie alle anderen Felder zu, die Sie einbeziehen möchten. Ordnen Sie für diese Übung alle Felder zu.

  16. Ordnen Sie die restlichen Felder zu, wie in der folgenden Tabelle gezeigt.

    Attributname Attributtyp Attributdatentyp
    Resource Resource Text
    Resource Name Event Level Attribute Text
    Vendor Case Level Attribute (first event) Text
    Automation Case Level Attribute (first event) Text
    Paid on Time Case Level Attribute (first event) Text
    Reason for Rejection Case Level Attribute (first event) Text
    Cash Discount % Case Level Attribute (first event) Numerisch
    Cash Discount Value Financial per Case (first event) Numerisch
    Invoice Value Financial per Case (first event) Numerisch
    Business Unit Case Level Attribute (first event) Text
    Region Case Level Attribute (first event) Text
  17. Wählen Sie Speichern und analysieren aus, nachdem Sie die Felder zugeordnet haben.

    Screenshot aller zugeordneten Felder und der Schaltfläche „Speichern und analysieren“.

  18. Warten, bis Analyse abgeschlossen ist. Dieser Prozess kann einige Minuten dauern.

Nach Abschluss der Analyse sollte die Prozessübersicht der folgenden Abbildung ähneln.

Screenshot der Prozesszuordnung nach Abschluss der Analyse.