Gängige Datenherausforderungen und Power Query-Transformationen

Abgeschlossen

Ein gängiges Beispiel für exportierte Daten, die bereinigt werden müssen, sind Dateien, in denen Daten mit leeren Zeilen zusammengefasst werden.

Leere Zeilen

Wenn Sie diese Art von Dataset in Power Query eingeben, werden die Werte für diese leeren Zellen als NULL-Werte angezeigt.

Screenshot eines Excel-Arbeitsblatts mit Spalten für Region und Bezirk mit leeren Zeilen.

Wenn Sie den Mauszeiger über die Statusleiste unter der Spaltenüberschrift bewegen, zeigt die Statusleiste zu Spaltenprofilerstellung Informationen an, die sich auf die Daten der Spalte beziehen. Im folgenden Beispiel enthält die Tabelle 22 leere Werte, die angeben, dass 43 % der Datensätze leere Werte für die Spalte Region enthalten. Der Benutzer kann eine Spalte (oder mehrere Spalten gleichzeitig) nach oben oder unten ausfüllen, je nachdem, wo die Zwischensummen gezeigt werden.

Screenshot des Fensters „Spaltenprofilerstellung“ für die Spalte „Region“, das zeigt, dass 43 % der Zeilen leer sind, und ein Fenster mit dem Bereich „Vorschau“, in dem die Werte für leere Zeilen für Region und Bezirk angezeigt werden.

Wenn Sie diese Aktion auf mehrere Spalten anwenden möchten, müssen Sie zunächst die Spaltenüberschriften auswählen, die Sie aktualisieren möchten, indem Sie die STRG-TASTE drücken und gleichzeitig mit der linken Maustaste auf die gewünschte Spalte klicken. Klicken Sie bei ausgewählten Spalten mit der rechten Maustaste auf die Kopfzeilen, um die Bearbeitungsoptionen für das Spaltenmenü anzuzeigen. Wählen Sie Ausfüllen und dann aus, ob der Wert nach unten oder nach oben angewendet werden soll. Das Auswählen der Option Nach unten ist gleichbedeutend mit der Suche nach einem nicht leeren Wert und dem anschließenden Kopieren dieses Werts in jede leere Zelle, bis ein neuer Wert gefunden wird. Das Auswählen der Option Nach oben bewirkt das Gegenteil.

Screenshot des Fensters „Power Query-Editor“ mit ausgewählter Option „Region und Bezirk“ mit den Spaltenmenüoptionen für „Auffüllen > Nach unten/Nach oben“ und den mit Werten aufgefüllten leeren Zeilen „Region und Bezirk“.

Hinweis

Die Optionen Auffüllen > Nach unten/Nach oben basieren auf der Reihenfolge der Daten. Einige Datenbankimportfunktionen streamen Daten asynchron, was bedeutet, dass die Reihenfolge der Daten möglicherweise nicht konsistent ist.

Kreuztabellenformatierung

Tabellen mit Kreuztabellenformaten (z. B. Zeilenüberschriften für Region oder Produkt und Spaltenüberschriften für das Datum) sind für Tabellen und Berichte üblich. Bei Kreuztabellenformaten werden die Daten visuell so organisiert, dass die meisten Personen die Informationen leichter verstehen und erfassen können. Obwohl dieses Format für Benutzer von Vorteil sein kann, ist es für die Datenmodellierung nicht ideal. Power Query verfügt über Tools zum Entpivotieren von Daten, um sie von einer kurzen und breiten Tabelle in eine lange und schmale umzuwandeln. Lange und schmale Datasets sind besser für die Erstellung von Measures für ein Datenmodell.

Die Funktionalität zum Entpivotieren stellt ein Schlüsselkonzept innerhalb der Power Query-Funktionen dar, wie Spalten ausgewählt werden können, auf die ein Vorgang angewendet werden soll, unabhängig davon, ob es sich nur um die ausgewählten Spalten oder um nicht ausgewählte Spalten handelt. Der Autor muss entscheiden, welche Methode für das Dataset und die Situation am besten geeignet ist. Nachdem Sie Ihr Dataset importiert haben, wählen Sie die Spalten mit Zeilenüberschriften aus. Wechseln Sie im Menüband zur Registerkarte Transformieren. Wählen Sie die Dropdownliste Spalten entpivotieren und dann Andere Spalten entpivotieren aus. Dieser Prozess generiert eine Attribut- und eine Wertspalte, die Sie durch Doppelklicken auf die Spaltenüberschrift umbenennen können.

Screesnshot: Zustand vor und nach dem Vorgang „Spalten entpivotieren“

Bereinigen und Formatieren von Daten

Das Startmenü enthält Benutzeroberflächenschaltflächen für die gängigen Datenbereinigungstechniken, wie im folgenden Screenshot gezeigt.

Screenshot der ausgewählten Registerkarte „Start“ mit den hervorgehobenen Schaltflächen „Zeilen entfernen“ und „Spalte teilen“.

Die folgende Abbildung ist ein Beispiel der Funktion Spalte teilen (ähnlich wie Text in Spalten in Excel).

Führen Sie die folgenden Schritte aus, um Spalten zu teilen:

  1. Wählen Sie die Spalte aus, die Sie teilen möchten.

  2. Wählen Sie die Dropdownliste Spalte teilen aus.

  3. Wählen Sie Nach Trennzeichen > Benutzerdefiniert aus, und geben Sie dann einen Schrägstrich (/) ein.

  4. Klicken Sie auf OK.

Screenshot: Durch Schrägstriche getrennten Daten, die Registerkarte „Transformieren“, das Fenster „Spalte nach Trennzeichen teilen“ und das Fenster „Power Query-Editor“ mit Vorschau.

Anreichern Ihrer Daten

In Power Query können Sie zusätzliche Felder hinzufügen, um eine umfassendere Analyse zu ermöglichen. Das Menü Spalte hinzufügen bietet verschiedene Möglichkeiten zur Erweiterung Ihres aktuellen Datasets. Wenn Sie die Schaltflächenvorgänge im Menü Spalte hinzufügen verwenden, werden die Ergebnisse des Vorgangs als neue Spalte im Datenbereich Vorschau des Fensters Power Query-Editor hinzugefügt.

Screenshot des Fensters „Power Query-Editor“ mit ausgewählter Registerkarte „Spalte hinzufügen“, um Schaltflächen anzuzeigen.

Mit dem Feature Spalte aus Beispielen können Sie Ihrem Datenmodell neue Spalten hinzufügen, indem Sie einen oder mehrere Beispielwerte für die neuen Spalten bereitstellen. Sie können die neuen Spaltenbeispiele anhand einer Auswahl erstellen oder Eingaben basierend auf allen vorhandenen Spalten in der Tabelle bereitstellen.

Praktische Gründe für die Auswahl dieses Features sind u. a.:

  • Benutzerfreundlich: Sie müssen nur ein paar Beispiele für das gewünschte Ergebnis eingeben, woraufhin Power Query die restliche Arbeit für Sie erledigt.

  • Schnell: Auch wenn Sie wissen, wie die Transformationen geschrieben werden, ist das Eingeben einiger Beispielen schneller als das Entwickeln und Testen der Logik für Ihre Textbearbeitungen.

Mit dem Feature Bedingte Spalte hinzufügen können Sie IF-THEN-ELSE-Bedingungen definieren, um Werte für eine bestimmte Spalte auf Grundlage einer Reihe logischer Prüfungen mit einem benutzerfreundlichen Assistenten anzuzeigen, ohne dass eine Klammerverwaltung erforderlich ist.

Screenshot des Fensters „Bedingte Spalte hinzufügen“.

Mit dem Feature Benutzerdefinierte Spalte können Sie direkt einen M-Ausdruck schreiben, um eine neue Spalte zu erstellen. Diese Option ist vorteilhaft für komplexere Ergänzungen, die über die Textbearbeitung in einer Spalte aus Beispielen oder einer einfachen bedingten Spalte hinausgehen. Mit diesem Feature können Sie auf M-Funktionen zugreifen, die nicht über das Menüband zugänglich sind, die Vorteile umfangreicher intelligenter Funktionen nutzen und Ihrer Kreativität freien Lauf lassen.

Screenshot der Benutzeroberfläche für „Benutzerdefinierte Spalte“.

Hinweis

Jede Schaltflächenauswahl im Power Query-Editor erstellt im Bereich Abfrageeinstellungen unter „Angewendeter Schritt“ einen M-Ausdruck als Schritt. M ist die Formelsprache im Power Query-Editor. Es ist zwar nicht erforderlich, die Formelsprache M zu erlernen, um Power Query zu verwenden, aber es kann sehr hilfreich sein.