Häufige Datenherausforderungen und Power Query-Transformationen

Abgeschlossen

Ein gängiges Beispiel für exportierte Daten, die bereinigt werden müssen, sind Dateien, in denen Daten mit leeren Zeilen zusammengefasst werden.

Leere Zeilen

Wenn Sie diesen Datensatztyp in Power Query importieren, werden die Werte für diese leeren Zellen als Nullwerte angezeigt.

Screenshot eines Excel-Arbeitsblatts mit den Spalten „Region“ und „District“ mit leeren Zeilen

Wenn Sie den Mauszeiger über die Statusleiste unter Ihrer Spaltenüberschrift bewegen, werden in der Statusleiste Spaltenprofilierung Details angezeigt, die sich auf die Daten der Spalte beziehen. Im folgenden Beispiel enthält die Spalte 45 leere Werte, was darauf hinweist, dass 90 Prozent der Datensätze leere Werte für die Spalte Region umfassen. Der Benutzer kann eine Spalte (oder mehrere Spalten gleichzeitig) nach oben oder unten ausfüllen, je nachdem, wo die Zwischensummen gezeigt werden.

Screenshot des Fensters „Spaltenprofilerstellung“ für die Spalte „Region“, das zeigt, dass 90 % der Zeilen leer sind, und ein Fenster mit dem Bereich „Vorschau“, in dem die Werte für leere Zeilen für „Region“ und „District“ angezeigt werden.

Wenn Sie diese Aktion auf mehrere Spalten anwenden möchten, müssen Sie zunächst die Spaltenüberschriften auswählen, die Sie aktualisieren möchten, indem Sie die STRG-Taste drücken und gleichzeitig mit der linken Maustaste auf die gewünschte Spalte klicken. Klicken Sie bei ausgewählten Spalten mit der rechten Maustaste auf die Kopfzeilen, um die Bearbeitungsoptionen für das Spaltenmenü anzuzeigen. Wählen Sie Ausfüllen und dann aus, ob der Wert nach unten oder nach oben angewendet werden soll. Das Auswählen der Option Nach unten ist gleichbedeutend mit der Suche nach einem nicht leeren Wert und dem anschließenden Kopieren dieses Werts in jede leere Zelle, bis ein neuer Wert gefunden wird. Das Auswählen der Option Nach oben bewirkt das Gegenteil.

Screenshot des Fensters des Power Query-Editors, wobei „Region“ und „District“ ausgewählt sind, mit den Menüoptionen „Spalte“ für „Ausfüllen > Abwärts/aufwärts“ und mit leeren Zeilen bei „Region“ und „District“, die jetzt mit Werten gefüllt sind

Hinweis

Die Optionen Auffüllen > Nach unten/Nach oben basieren auf der Reihenfolge der Daten. Einige Datenbankimportfunktionen streamen Daten asynchron, was bedeutet, dass die Reihenfolge der Daten möglicherweise nicht konsistent ist.

Kreuztabellenformatierung

Tabellen mit Kreuztabellenformaten (z. B. Zeilenüberschriften für Region oder Produkt und Spaltenüberschriften für das Datum) sind für Tabellen und Berichte üblich. Bei Kreuztabellenformaten werden die Daten visuell so organisiert, dass die meisten Personen die Informationen leichter verstehen und erfassen können. Obwohl dieses Format für Benutzer von Vorteil sein kann, ist es für die Datenmodellierung nicht ideal. Power Query umfasst über Tools zum Entpivotieren von Daten, um sie von einer kurzen und breiten Tabelle in eine lange und schmale Tabelle zu übertragen. Lange und schmale Datasets sind besser für die Erstellung von Measures für ein Datenmodell.

Die Funktion Entpivotieren führt innerhalb von Power Query-Funktionen ein Schlüsselkonzept ein, wie Auswählen die Spalten bestimmt, an denen eine Operation ausgeführt werden soll, unabhängig davon, ob dies nur für die ausgewählten Spalten oder für nicht ausgewählte Spalten gilt. Der Autor muss entscheiden, welche Methode für das Dataset und die Situation am besten geeignet ist. Nachdem Sie Ihr Dataset importiert haben, wählen Sie die Spalten mit Zeilenüberschriften aus. Wechseln Sie zur Registerkarte Transformieren auf dem Menüband, und wählen Sie die Dropdownliste Spalten entpivotieren aus. Klicken Sie dann auf die Option Andere Spalten entpivotieren. Dieser Prozess generiert eine attribute‑ und eine value-Spalte, die Sie durch Doppelklicken auf die Spaltenüberschrift umbenennen können.

Screenshot des Vorher‑ und Nachher-Vorgangs zur Operation Spalten entpivotieren

Daten bereinigen und formatieren

Das Startmenü enthält Benutzeroberflächenschaltflächen für die gängigen Datenbereinigungstechniken, wie im folgenden Screenshot gezeigt.

Screenshot der ausgewählten Registerkarte „Start“ mit den hervorgehobenen Schaltflächen „Zeilen entfernen“ und „Spalte teilen“

Die folgende Abbildung ist ein Beispiel der Funktion Spalte teilen (ähnlich wie Text in Spalten in Excel).

Führen Sie die folgenden Schritte aus, um Spalten zu teilen:

  1. Wählen Sie die Spalte aus, die Sie teilen möchten.

  2. Wählen Sie die Dropdownliste Spalte teilen aus.

  3. Wählen Sie Nach Trennzeichen > Benutzerdefiniert aus, und geben Sie dann einen Schrägstrich (/) ein.

  4. Wählen Sie OK aus.

Screenshot von Excel-Daten, die durch umgekehrte Schrägstriche getrennt sind, der Registerkarte Transformieren, dem Fenster Spalten nach Trennzeichen aufteilen und dem Power Query-Editor-Fenster mit Vorschauversion

Ihre Daten anreichern

Power Query ermöglicht Ihnen das Hinzufügen zusätzlicher Felder, um eine tiefergehende Analyse möglich zu machen. Das Menü Spalte hinzufügen bietet verschiedene Möglichkeiten zur Erweiterung Ihres aktuellen Datasets. Wenn Sie die Tastenbedienung auf dem Menü Spalte hinzufügen verwenden, werden die Ergebnisse der Operation als neue Spalte im Datenbereich Vorschauversion des Fensters Power Query-Editor hinzugefügt.

Screenshot des Power Query-Editor-Fensters mit ausgewählter Registerkarte „Spalte hinzufügen“, um Schaltflächen anzuzeigen

Mit der Funktion Spalte von Beispielen können Sie Ihrem Datenmodell neue Spalten hinzufügen, indem Sie einfach mindestens einen Beispielwert für die neuen Spalten angeben. Sie können die neuen Spaltenbeispiele aus einer Auswahl erstellen oder Eingaben basierend auf allen vorhandenen Spalten in der Tabelle bereitstellen.

Diese Funktion ist aus praktischen Gründen besonders hilfreich:

  • Benutzerfreundlich: Sie müssen nur einige Beispiele für das gewünschte Ergebnis eingeben und Power Query führt den Rest der Arbeit für Sie aus.

  • Schnell: Auch wenn Sie wissen, wie die Transformationen geschrieben werden, ist das Eingeben einiger Beispielen schneller als das Entwickeln und Testen der Logik für Ihre Textbearbeitungen.

Mit der Funktion Bedingte Spalte hinzufügen können Sie IF-THEN-ELSE-Bedingungen definieren, um Werte für eine bestimmte Spalte auf Grundlage einer Reihe logischer Prüfungen mit einem benutzerfreundlichen Assistenten anzuzeigen, ohne dass eine Klammerverwaltung erforderlich ist.

Screenshot des Fensters „Bedingte Spalte hinzufügen“

Mit dem Feature Benutzerdefinierte Spalte können Sie direkt einen M-Ausdruck schreiben, um eine neue Spalte zu erstellen. Diese Option ist vorteilhaft für komplexere Ergänzungen, die über die Textbearbeitung in einer Spalte aus Beispielen oder einer einfachen bedingten Spalte hinausgehen. Mit diesem Feature können Sie auf M-Funktionen zugreifen, die nicht über das Menüband zugänglich sind, die Vorteile umfangreicher intelligenter Funktionen nutzen und Ihrer Kreativität freien Lauf lassen.

Screenshot der Benutzeroberfläche für die benutzerdefinierte Spalte

Hinweis

Jede Tastenauswahl im Power Query-Editor erstellt einen M-Ausdruck als Schritt im angewandten Schritt im Feld Abfrageeinstellungen. M ist die Formelsprache des Power Query-Editors. Es ist nicht erforderlich, die Formelsprache M zu erlernen, um Power Query zu verwenden, es kann wirkungsvoll und hilfreich sein, zu lernen.