Häufige Datenherausforderungen und Power Query-Transformationen
Ein gängiges Beispiel für exportierte Daten, die bereinigt werden müssen, sind Dateien, in denen Daten mit leeren Zeilen zusammengefasst werden.
Leere Zeilen
Wenn Sie diesen Datensatztyp in Power Query importieren, werden die Werte für diese leeren Zellen als Nullwerte angezeigt.
Wenn Sie den Mauszeiger über die Statusleiste unter Ihrer Spaltenüberschrift bewegen, werden in der Statusleiste Spaltenprofilierung Details angezeigt, die sich auf die Daten der Spalte beziehen. Im folgenden Beispiel enthält die Spalte 45 leere Werte, was darauf hinweist, dass 90 Prozent der Datensätze leere Werte für die Spalte Region umfassen. Der Benutzer kann eine Spalte (oder mehrere Spalten gleichzeitig) nach oben oder unten ausfüllen, je nachdem, wo die Zwischensummen gezeigt werden.
Wenn Sie diese Aktion auf mehrere Spalten anwenden möchten, müssen Sie zunächst die Spaltenüberschriften auswählen, die Sie aktualisieren möchten, indem Sie die STRG-Taste drücken und gleichzeitig mit der linken Maustaste auf die gewünschte Spalte klicken. Klicken Sie bei ausgewählten Spalten mit der rechten Maustaste auf die Kopfzeilen, um die Bearbeitungsoptionen für das Spaltenmenü anzuzeigen. Wählen Sie Ausfüllen und dann aus, ob der Wert nach unten oder nach oben angewendet werden soll. Das Auswählen der Option Nach unten ist gleichbedeutend mit der Suche nach einem nicht leeren Wert und dem anschließenden Kopieren dieses Werts in jede leere Zelle, bis ein neuer Wert gefunden wird. Das Auswählen der Option Nach oben bewirkt das Gegenteil.
Hinweis
Die Optionen Auffüllen > Nach unten/Nach oben basieren auf der Reihenfolge der Daten. Einige Datenbankimportfunktionen streamen Daten asynchron, was bedeutet, dass die Reihenfolge der Daten möglicherweise nicht konsistent ist.
Kreuztabellenformatierung
Tabellen mit Kreuztabellenformaten (z. B. Zeilenüberschriften für Region oder Produkt und Spaltenüberschriften für das Datum) sind für Tabellen und Berichte üblich. Bei Kreuztabellenformaten werden die Daten visuell so organisiert, dass die meisten Personen die Informationen leichter verstehen und erfassen können. Obwohl dieses Format für Benutzer von Vorteil sein kann, ist es für die Datenmodellierung nicht ideal. Power Query umfasst über Tools zum Entpivotieren von Daten, um sie von einer kurzen und breiten Tabelle in eine lange und schmale Tabelle zu übertragen. Lange und schmale Datasets sind besser für die Erstellung von Measures für ein Datenmodell.
Die Funktion Entpivotieren führt innerhalb von Power Query-Funktionen ein Schlüsselkonzept ein, wie Auswählen die Spalten bestimmt, an denen eine Operation ausgeführt werden soll, unabhängig davon, ob dies nur für die ausgewählten Spalten oder für nicht ausgewählte Spalten gilt. Der Autor muss entscheiden, welche Methode für das Dataset und die Situation am besten geeignet ist. Nachdem Sie Ihr Dataset importiert haben, wählen Sie die Spalten mit Zeilenüberschriften aus. Wechseln Sie zur Registerkarte Transformieren auf dem Menüband, und wählen Sie die Dropdownliste Spalten entpivotieren aus. Klicken Sie dann auf die Option Andere Spalten entpivotieren. Dieser Prozess generiert eine attribute‑ und eine value-Spalte, die Sie durch Doppelklicken auf die Spaltenüberschrift umbenennen können.
Daten bereinigen und formatieren
Das Startmenü enthält Benutzeroberflächenschaltflächen für die gängigen Datenbereinigungstechniken, wie im folgenden Screenshot gezeigt.
Die folgende Abbildung ist ein Beispiel der Funktion Spalte teilen (ähnlich wie Text in Spalten in Excel).
Führen Sie die folgenden Schritte aus, um Spalten zu teilen:
Wählen Sie die Spalte aus, die Sie teilen möchten.
Wählen Sie die Dropdownliste Spalte teilen aus.
Wählen Sie Nach Trennzeichen > Benutzerdefiniert aus, und geben Sie dann einen Schrägstrich (/) ein.
Wählen Sie OK aus.
Ihre Daten anreichern
Power Query ermöglicht Ihnen das Hinzufügen zusätzlicher Felder, um eine tiefergehende Analyse möglich zu machen. Das Menü Spalte hinzufügen bietet verschiedene Möglichkeiten zur Erweiterung Ihres aktuellen Datasets. Wenn Sie die Tastenbedienung auf dem Menü Spalte hinzufügen verwenden, werden die Ergebnisse der Operation als neue Spalte im Datenbereich Vorschauversion des Fensters Power Query-Editor hinzugefügt.
Mit der Funktion Spalte von Beispielen können Sie Ihrem Datenmodell neue Spalten hinzufügen, indem Sie einfach mindestens einen Beispielwert für die neuen Spalten angeben. Sie können die neuen Spaltenbeispiele aus einer Auswahl erstellen oder Eingaben basierend auf allen vorhandenen Spalten in der Tabelle bereitstellen.
Diese Funktion ist aus praktischen Gründen besonders hilfreich:
Benutzerfreundlich: Sie müssen nur einige Beispiele für das gewünschte Ergebnis eingeben und Power Query führt den Rest der Arbeit für Sie aus.
Schnell: Auch wenn Sie wissen, wie die Transformationen geschrieben werden, ist das Eingeben einiger Beispielen schneller als das Entwickeln und Testen der Logik für Ihre Textbearbeitungen.
Mit der Funktion Bedingte Spalte hinzufügen können Sie IF-THEN-ELSE-Bedingungen definieren, um Werte für eine bestimmte Spalte auf Grundlage einer Reihe logischer Prüfungen mit einem benutzerfreundlichen Assistenten anzuzeigen, ohne dass eine Klammerverwaltung erforderlich ist.
Mit dem Feature Benutzerdefinierte Spalte können Sie direkt einen M-Ausdruck schreiben, um eine neue Spalte zu erstellen. Diese Option ist vorteilhaft für komplexere Ergänzungen, die über die Textbearbeitung in einer Spalte aus Beispielen oder einer einfachen bedingten Spalte hinausgehen. Mit diesem Feature können Sie auf M-Funktionen zugreifen, die nicht über das Menüband zugänglich sind, die Vorteile umfangreicher intelligenter Funktionen nutzen und Ihrer Kreativität freien Lauf lassen.
Hinweis
Jede Tastenauswahl im Power Query-Editor erstellt einen M-Ausdruck als Schritt im angewandten Schritt im Feld Abfrageeinstellungen. M ist die Formelsprache des Power Query-Editors. Es ist nicht erforderlich, die Formelsprache M zu erlernen, um Power Query zu verwenden, es kann wirkungsvoll und hilfreich sein, zu lernen.