Ereignisprotokolldaten normalisieren
Durch die Transformation der Ereignisprotokolldaten können Sie deren Verwendung während der Prozess-Mining-Analyse einfacher gestalten. Wenn Ihre Ereignisprotokolldaten weniger als 1 bis 2 GB umfassen, wird die Verwendung von Power Query empfohlen. Wenn Sie jedoch mit größeren Protokolldatendateien arbeiten, kann es effizienter sein, die Transformationen außerhalb von Prozess-Mining durchzuführen.
In den folgenden Abschnitten werden einige allgemeine Transformationen erläutert, die Sie vornehmen können, bevor Sie Daten in Prozess-Mining erfassen.
Spalten umbenennen
Das System ordnet Spalten aus den Ereignisprotokolldaten in Prozess-Mining zu, die Namen der Spalten werden jedoch weitergegeben und dann vom System bei der Prozessanalyse verwendet. Sprechen Sie mit Ihrem Team, um sich im Voraus auf Namenskonventionen zu einigen, und implementieren Sie diese Namen dann im Rahmen der Transformation. Sie könnten z. B. „c_“ als Präfix für alle Attribute auf Vorgangsebene verwenden. Dieser Ansatz kann Ihnen dabei helfen, Daten auf Vorgangsebene schnell zu erkennen. Normalerweise empfehlen wir, die Camel-Case-Schreibweise zu verwenden und die Verwendung von Unterstrichen (_) in den Namen zu vermeiden (z. B. „ResourceHourlyRate“ statt „resource_hourly_rate“).
Stellen Sie außerdem sicher, dass der Name der Spalte deren Inhalt deutlich macht. Beispielsweise wäre die Benennung einer Spalte als „Timestamp1“ und „Timestamp2“ nicht so eindeutig, als wenn Sie sie in „StartTimestamp“ und „EndTimestamp“ umbenennen würden.
In Power Query können Sie Ihr neues Benennungsschema implementieren, indem Sie auf die Kopfzeile doppelklicken und den Spaltennamen ändern.
Wenn Sie klare und einheitliche Spaltennamen implementieren, können die Daten in der Analysephase effizienter genutzt werden.
Spaltentyp ändern
Stellen Sie sicher, dass Sie den Datentyp und das Gebietsschema für jede Spalte im Ereignisprotokoll überprüfen, um sicherzustellen, dass sie korrekt sind. Oftmals lässt das Ereignisprotokoll Rückschlüsse auf den Datentyp zu und stellt ihn nicht richtig dar. Sie können den Datentyp ändern und ggf. das Gebietsschema angeben.
Werte ersetzen
Die aus dem Aufzeichnungssystem extrahierten Daten enthalten möglicherweise Codefelder, die zwar für die Speicherung effizient sind, für die menschliche Verwendung bei der Prozessanalyse jedoch weniger. So könnte z. B. eine Spalte mit dem Bestellstatus den Wert „2277333“ enthalten, den das System als Versendet erkennt. Mit der Funktion Werte ersetzen von Power Query können Sie diese Spalten aktualisieren, um aussagekräftige Daten zu erhalten.
Weitere gängige Transformationen
Power Query ist eine leistungsstarke Transformations-Engine, mit der Sie viele Herausforderungen bewältigen können, denen Sie im Zusammenhang mit Ereignisprotokolldaten begegnen. Weitere Informationen finden Sie in der Referenz zu Power Query, in der die verfügbaren Operationen zur Datentransformation beschrieben werden.
Hier einige weitere häufige Ereignisprotokolltransformationen, die Sie möglicherweise durchführen:
Daten in mehrere Spalten aufteilen: Wenn Sie z. B. eine Firmennummer haben, die das Büro und eine eindeutige Kennung enthält, möchten Sie möglicherweise die Büro-ID aufteilen.
Daten aus mehreren Spalten kombinieren: Vielleicht möchten Sie den Aktivitätsnamen mit dem Quellsystemnamen kombinieren.
Verwenden Sie die Funktion Werte füllen, um eine Spalte, die einige Nullwerte enthält, zu füllen, und wenden Sie dann einen Standardwert auf diese Zeilen an.
Die Transformation der Ereignisprotokolldaten ist ein wichtiger Schritt, um möglichst saubere Daten für die Erfassung in Prozess-Mining zu erhalten. Ein ordnungsgemäß vorbereitetes Ereignisprotokoll kann die Datenanalyse beschleunigen.


