Daten bereinigen, transformieren und laden

Abgeschlossen

Wenn Sie Power Query zum Einlesen von Daten in Customer Insights - Data verwenden, können Sie die verfügbaren Datenumwandlungsfunktionen nutzen, um Ihre Daten so zu gestalten, dass sie in der Anwendung optimal genutzt werden können. Nachdem Sie den Power Query-Konnektor ausgewählt, die zu verwendende Datenquelle identifiziert und eine Verbindung zu ihr hergestellt haben, können Sie mit der Gestaltung Ihrer Daten beginnen. Wählen Sie die Option „Daten transformieren“ am unteren Rand des Bildschirms aus, um den Power Query Designer zu öffnen.

Screenshot der Schaltfläche „Daten transformieren“.

Wichtig

Das Menüband von Power Query-Editor enthält viele Schaltflächen, mit denen Sie Ihre Daten auswählen, anzeigen und gestalten können. Weitere Informationen zu den verfügbaren Funktionen finden Sie unter dem Abfragemenüband.

Spaltenüberschriften und -namen identifizieren

Der erste Schritt bei der Gestaltung Ihrer Ausgangsdaten besteht darin, die Spaltenüberschriften und -namen in den Daten zu identifizieren und dann zu bewerten, wo sie sich befinden, um sicherzustellen, dass sie an der richtigen Stelle sind. Wenn die Daten eingegeben werden, geht Power Query-Editor davon aus, dass alle Daten in Tabellenzeilen gehören. Eine Datenquelle kann jedoch eine erste Zeile haben, die Spaltennamen enthält. Zur Korrektur dieser Ungenauigkeit müssen Sie die erste Tabellenzeile in Spaltenüberschriften umwandeln.

Sie können Kopfzeilen auf zwei Arten umwandeln:

  • Wählen Sie auf der Registerkarte „Start“ die Option Erste Zeile als Überschrift verwenden aus.

  • Wählen Sie die Dropdownschaltfläche neben Column1 und anschließend Erste Zeile als Überschrift verwenden aus.

Screenshot der Optionen zum Umwandeln von Kopfzeilen

Spalten umbenennen

Wenn Ihre Daten eingehen, stellen Sie vielleicht fest, dass eine oder mehrere Spalten den falschen Namen haben, einen Rechtschreibfehler enthalten oder einfach nicht benutzerfreundlich sind. In diesen Fällen können Sie Spalten nach Bedarf umbenennen.  

Spalten können auf zwei Arten umbenannt werden:

  • Klicken Sie mit der rechten Maustaste auf die Spaltenüberschrift und wählen Sie „Umbenennen“ aus.

  • Doppelklicken Sie auf die Spaltenüberschrift und überschreiben Sie den Namen mit dem richtigen Namen.

Spalten entfernen

Ein wichtiger Schritt bei der Datengestaltung besteht darin, unnötige Spalten zu entfernen. Es ist am besten, Spalten möglichst früh im Prozess zu entfernen, insbesondere wenn Sie Beziehungen zwischen Ihren Tabellen hergestellt haben.  

Sie können Spalten auf zwei Arten entfernen:

  • Wählen Sie die Spalten aus, die Sie entfernen möchten.

    • Wählen Sie auf der Registerkarte „Start“ die Option „Spalten entfernen“ aus.
  • Wählen Sie die Spalten aus, die Sie behalten möchten.

    • Wählen Sie auf der Registerkarte „Start“ die Option „Spalten entfernen“ und dann „Andere Spalten entfernen“ aus.

Screenshot der Optionen zum Entfernen von Spalten

Spaltendatentyp ändern

Die Arten von Daten, die in Ihren Spalten gespeichert sind, können sich auf verschiedene Aspekte dessen auswirken, was Sie mit den Daten in Customer Insights - Data tun können. Wenn Sie z. B. ein Segment erstellen, das Kunden in einem bestimmten Altersbereich identifizieren soll, ist es wichtig, dass die Spalte mit dem Geburtsdatum als Datum formatiert ist. Ist dies nicht der Fall, kann das System keine Datenausdrücke verwenden, um das Alter von Kunden zu überprüfen. Dies ist auch wichtig, wenn Sie Berechnungen durchführen wollen, z. B. um festzustellen, wie viel jemand ausgegeben haben könnte.

Es ist nicht ungewöhnlich, dass den Daten zunächst der falsche Datentyp zugeordnet wird. Wenn Sie zum Beispiel eine Verbindung zu einer CSV/Text-Datei herstellen, wird allen geladenen Spalten wahrscheinlich ein Textdatentyp zugewiesen. Wenn wir nicht sicherstellen, dass jede Spalte den richtigen Datentyp hat, könnten wir später Probleme bekommen.

Betrachten Sie das folgende Beispiel. Die Tabelle stellt ein Beispiel dafür dar, wie eine Transaktionstabelle aussieht, die Daten enthält, die auf einer Unternehmenswebsite getätigte Einkäufe repräsentieren. Sie enthält die ID des Kunden, der den Kauf getätigt hat, das Einkaufsdatum und den Gesamtpreis des Kaufs.

Kunden-ID Einkaufsdatum Gesamtpreis
1005 1.11.2023 259,95
1006 5.11.2023 350,00
1007 10.11.2023 425,99

Um sicherzustellen, dass wir die Daten aus dieser Tabelle sinnvoll nutzen können, müssen wir dafür sorgen, dass den entsprechenden Feldern der richtige Datentyp zugeordnet wird:

In diesem Beispiel können wir die Datentypen für die Felder wie folgt festlegen:

  • Kunden-ID – Da dieser Typ ein textbasierter Wert ist, können wir ihn als Textfeld belassen.

  • Einkaufsdatum – Dieser Typ wird wahrscheinlich zur Darstellung von Zeiträumen verwendet werden. Wir möchten also, dass dieses Feld auf einen datumsbezogenen Datentyp festgelegt wird.

    • Datum – Speichert nur das Datum, an dem die Transaktion stattgefunden hat.

    • Datum/Uhrzeit – Speichert das Datum und die Uhrzeit des Kaufs.

    • Datum/Uhrzeit/Zone – Speichert Datum, Uhrzeit und Zeitzonendetails.

      In unserem Beispiel kann es auf ein Datum gesetzt werden, da wir es nur als Datum speichern müssen und keine zeitbezogenen Daten erforderlich sind.

  • Gesamtpreis – Dieser Datentyp wird wahrscheinlich als „Währung“ festgelegt, um einen Währungsbetrag darzustellen.

Datentypen können auf zwei Arten geändert werden.

Die erste Möglichkeit besteht darin, die Spalte auszuwählen, der das Problem zugeordnet ist. Wählen Sie im Menüband Start die Dropdownliste Datentyp auf der Registerkarte Transformieren aus, und wählen Sie dann den richtigen Datentyp aus der Liste aus.

Screenshot der Liste „Datentyp“

Die zweite Möglichkeit zum Ändern von Datentypen besteht darin, das Datentypsymbol neben der Spaltenüberschrift auszuwählen und anschließend den richtigen Datentyp aus der Liste auszuwählen.

Screenshot des Datentypsymbols mit angezeigtem Menu.

Einer der Vorteile von Power Query ist, dass alle Änderungen, die Sie an den Daten vornehmen, als sogenannte angewandte Schritte gespeichert werden. Bei jeder Verbindung mit der Abfrage werden die während der Transformation vorgenommenen Änderungen übernommen. Dadurch wird sichergestellt, dass Ihre Abfrage jedes Mal gleich ist. Alle anderen Änderungen, die Sie an Elementen vornehmen, z. B. Spaltendatentypen, werden als programmierter Schritt gespeichert. Wenn Sie jemals feststellen, dass Sie einen angewendeten Schritt entfernen müssen, können Sie die Option Löschen neben dem Schritt im Feld für die angewendeten Schritte auswählen.

Screenshot des „x“ zum Entfernen eines angewendeten Schritts

Eine Abfrage umbenennen

Wenn Sie Ihre Abfrage erstellen, wird sie zunächst wahrscheinlich einen generischen Namen haben. Es empfiehlt sich, ungewöhnliche oder nicht hilfreiche Abfragenamen in Namen zu ändern, die offensichtlicher sind oder mit denen der Benutzer vertrauter ist. Wenn Sie beispielsweise Käufe aus einer Verkaufsstellensystem importieren, möchten Sie der Abfrage möglicherweise einen Namen wie „POS-Käufe“ geben.

Screenshot des verwendeten Namensfelds zum Umbenennen einer Abfrage

Sobald Sie die gewünschten Daten geformt haben, können Sie auf die Schaltfläche „Weiter“ klicken, um die Abfrage zu speichern und mit dem Einlesen zu beginnen.