Gängige Datenherausforderungen und Power Query-Transformationen
Ein gängiges Beispiel für exportierte Daten, die bereinigt werden müssen, sind Dateien, in denen Daten mit leeren Zeilen zusammengefasst werden.
Leere Zeilen
Wenn Sie diese Art von Dataset in Power Query eingeben, werden die Werte für diese leeren Zellen als NULL-Werte angezeigt.
Wenn Sie den Mauszeiger über die Statusleiste unter der Spaltenüberschrift bewegen, zeigt die Statusleiste zu Spaltenprofilerstellung Informationen an, die sich auf die Daten der Spalte beziehen. Im folgenden Beispiel enthält die Tabelle 22 leere Werte, die angeben, dass 43 % der Datensätze leere Werte für die Spalte Region enthalten. Der Benutzer kann eine Spalte (oder mehrere Spalten gleichzeitig) nach oben oder unten ausfüllen, je nachdem, wo die Zwischensummen gezeigt werden.
Wenn Sie diese Aktion auf mehrere Spalten anwenden möchten, müssen Sie zunächst die Spaltenüberschriften auswählen, die Sie aktualisieren möchten, indem Sie die STRG-TASTE drücken und gleichzeitig mit der linken Maustaste auf die gewünschte Spalte klicken. Klicken Sie bei ausgewählten Spalten mit der rechten Maustaste auf die Kopfzeilen, um die Bearbeitungsoptionen für das Spaltenmenü anzuzeigen. Wählen Sie Ausfüllen und dann aus, ob der Wert nach unten oder nach oben angewendet werden soll. Das Auswählen der Option Nach unten ist gleichbedeutend mit der Suche nach einem nicht leeren Wert und dem anschließenden Kopieren dieses Werts in jede leere Zelle, bis ein neuer Wert gefunden wird. Das Auswählen der Option Nach oben bewirkt das Gegenteil.
Hinweis
Die Optionen Auffüllen > Nach unten/Nach oben basieren auf der Reihenfolge der Daten. Einige Datenbankimportfunktionen streamen Daten asynchron, was bedeutet, dass die Reihenfolge der Daten möglicherweise nicht konsistent ist.
Kreuztabellenformatierung
Tabellen mit Kreuztabellenformaten (z. B. Zeilenüberschriften für Region oder Produkt und Spaltenüberschriften für das Datum) sind für Tabellen und Berichte üblich. Bei Kreuztabellenformaten werden die Daten visuell so organisiert, dass die meisten Personen die Informationen leichter verstehen und erfassen können. Obwohl dieses Format für Benutzer von Vorteil sein kann, ist es für die Datenmodellierung nicht ideal. Power Query verfügt über Tools zum Entpivotieren von Daten, um sie von einer kurzen und breiten Tabelle in eine lange und schmale umzuwandeln. Lange und schmale Datasets sind besser für die Erstellung von Measures für ein Datenmodell.
Die Funktionalität zum Entpivotieren stellt ein Schlüsselkonzept innerhalb der Power Query-Funktionen dar, wie Spalten ausgewählt werden können, auf die ein Vorgang angewendet werden soll, unabhängig davon, ob es sich nur um die ausgewählten Spalten oder um nicht ausgewählte Spalten handelt. Der Autor muss entscheiden, welche Methode für das Dataset und die Situation am besten geeignet ist. Nachdem Sie Ihr Dataset importiert haben, wählen Sie die Spalten mit Zeilenüberschriften aus. Wechseln Sie im Menüband zur Registerkarte Transformieren. Wählen Sie die Dropdownliste Spalten entpivotieren und dann Andere Spalten entpivotieren aus. Dieser Prozess generiert eine Attribut- und eine Wertspalte, die Sie durch Doppelklicken auf die Spaltenüberschrift umbenennen können.
Bereinigen und Formatieren von Daten
Das Startmenü enthält Benutzeroberflächenschaltflächen für die gängigen Datenbereinigungstechniken, wie im folgenden Screenshot gezeigt.
Die folgende Abbildung ist ein Beispiel der Funktion Spalte teilen (ähnlich wie Text in Spalten in Excel).
Führen Sie die folgenden Schritte aus, um Spalten zu teilen:
Wählen Sie die Spalte aus, die Sie teilen möchten.
Wählen Sie die Dropdownliste Spalte teilen aus.
Wählen Sie Nach Trennzeichen > Benutzerdefiniert aus, und geben Sie dann einen Schrägstrich (/) ein.
Klicken Sie auf OK.
Anreichern Ihrer Daten
In Power Query können Sie zusätzliche Felder hinzufügen, um eine umfassendere Analyse zu ermöglichen. Das Menü Spalte hinzufügen bietet verschiedene Möglichkeiten zur Erweiterung Ihres aktuellen Datasets. Wenn Sie die Schaltflächenvorgänge im Menü Spalte hinzufügen verwenden, werden die Ergebnisse des Vorgangs als neue Spalte im Datenbereich Vorschau des Fensters Power Query-Editor hinzugefügt.
Mit dem Feature Spalte aus Beispielen können Sie Ihrem Datenmodell neue Spalten hinzufügen, indem Sie einen oder mehrere Beispielwerte für die neuen Spalten bereitstellen. Sie können die neuen Spaltenbeispiele anhand einer Auswahl erstellen oder Eingaben basierend auf allen vorhandenen Spalten in der Tabelle bereitstellen.
Praktische Gründe für die Auswahl dieses Features sind u. a.:
Benutzerfreundlich: Sie müssen nur ein paar Beispiele für das gewünschte Ergebnis eingeben, woraufhin Power Query die restliche Arbeit für Sie erledigt.
Schnell: Auch wenn Sie wissen, wie die Transformationen geschrieben werden, ist das Eingeben einiger Beispielen schneller als das Entwickeln und Testen der Logik für Ihre Textbearbeitungen.
Mit dem Feature Bedingte Spalte hinzufügen können Sie IF-THEN-ELSE-Bedingungen definieren, um Werte für eine bestimmte Spalte auf Grundlage einer Reihe logischer Prüfungen mit einem benutzerfreundlichen Assistenten anzuzeigen, ohne dass eine Klammerverwaltung erforderlich ist.
Mit dem Feature Benutzerdefinierte Spalte können Sie direkt einen M-Ausdruck schreiben, um eine neue Spalte zu erstellen. Diese Option ist vorteilhaft für komplexere Ergänzungen, die über die Textbearbeitung in einer Spalte aus Beispielen oder einer einfachen bedingten Spalte hinausgehen. Mit diesem Feature können Sie auf M-Funktionen zugreifen, die nicht über das Menüband zugänglich sind, die Vorteile umfangreicher intelligenter Funktionen nutzen und Ihrer Kreativität freien Lauf lassen.
Hinweis
Jede Schaltflächenauswahl im Power Query-Editor erstellt im Bereich Abfrageeinstellungen unter „Angewendeter Schritt“ einen M-Ausdruck als Schritt. M ist die Formelsprache im Power Query-Editor. Es ist zwar nicht erforderlich, die Formelsprache M zu erlernen, um Power Query zu verwenden, aber es kann sehr hilfreich sein.