Verwenden der Tools zur Datenprofilerstellung

Die Datenprofilerstellungstools bieten neue und intuitive Möglichkeiten zum Bereinigen, Transformieren und Verstehen von Daten in Power Query-Editor. Dazu gehören:

  • Spaltenqualität

  • Spaltenverteilung

  • Spaltenprofil

Um die Datenprofilerstellungstools zu aktivieren, wechseln Sie im Menüband zur Registerkarte Ansicht. Aktivieren Sie die gewünschten Optionen in der Gruppe Datenvorschau , wie in der folgenden Abbildung dargestellt.

Datenprofilerstellungstools.

Nachdem Sie die Optionen aktiviert haben, wird in Power Query-Editor in etwa die folgende Abbildung angezeigt.

Datenprofilerstellungstools aktiviert.

Hinweis

Standardmäßig führt Power Query diese Datenprofilerstellung über die ersten 1.000 Zeilen Ihrer Daten aus. Damit es über das gesamte Dataset ausgeführt werden kann, überprüfen Sie die linke untere Ecke Ihres Editorfensters, um zu ändern, wie die Spaltenprofilerstellung ausgeführt wird.

Spaltenqualität

Das Spaltenqualitätsfeature bezeichnet Werte in Zeilen in fünf Kategorien:

  • Gültig, grün dargestellt.

  • Fehler, rot angezeigt.

  • Leer, in dunkelgrau dargestellt.

  • Unbekannt, in gestricheltem Grün angezeigt. Gibt an, wenn in einer Spalte Fehler auftreten, die Qualität der verbleibenden Daten unbekannt ist.

  • Unerwarteter Fehler, der in gestricheltem Rot angezeigt wird.

Diese Indikatoren werden direkt unter dem Namen der Spalte als Teil eines kleinen Balkendiagramms angezeigt, wie in der folgenden Abbildung dargestellt.

Verbesserte Ansicht des Balkendiagramms mit Datenqualitätsindikatoren und Beschriftungen über jeder Spalte in der Tabelle.

Die Anzahl der Datensätze in jeder Spaltenqualitätskategorie wird auch als Prozentsatz angezeigt.

Wenn Sie mit dem Mauszeiger auf eine der Spalten zeigen, wird die numerische Verteilung der Qualität der Werte in der gesamten Spalte angezeigt. Darüber hinaus werden durch Auswählen der Schaltfläche mit den Auslassungspunkten (...) einige Schnelle Aktionsschaltflächen für Vorgänge für die Werte geöffnet.

Verteilung der Namensspalte mit 701 gültigen Namen (100 Prozent), null Fehlern und null leer, wobei Quick-Action-Befehle angezeigt werden.

Spaltenverteilung

Dieses Feature stellt eine Reihe von Visuals unter den Namen der Spalten bereit, die die Häufigkeit und Verteilung der Werte in jeder der Spalten veranschaulichen. Die Daten in diesen Visualisierungen werden in absteigender Reihenfolge vom Wert mit der höchsten Häufigkeit sortiert.

Spaltenverteilung.

Wenn Sie mit dem Mauszeiger auf die Verteilungsdaten in einer der Spalten zeigen, erhalten Sie Informationen zu den Gesamtdaten in der Spalte (mit eindeutiger Anzahl und eindeutigen Werten). Sie können auch die Schaltfläche mit den Auslassungspunkten auswählen und aus einem Menü mit verfügbaren Vorgängen auswählen.

Spaltenverteilungsoptionen.

Spaltenprofil

Dieses Feature bietet einen ausführlicheren Einblick in die Daten in einer Spalte. Neben dem Säulenverteilungsdiagramm enthält es ein Säulenstatistikdiagramm. Diese Informationen werden unter dem Datenvorschauabschnitt angezeigt, wie in der folgenden Abbildung dargestellt.

Spaltenprofil.

Filtern nach Wert

Sie können mit dem Wertverteilungsdiagramm auf der rechten Seite interagieren und einen der Balken auswählen, indem Sie auf die Teile des Diagramms zeigen.

Zeigen Sie auf den Balken im Wertverteilungsbalkendiagramm, in dem einzelne Daten für diesen Balken angezeigt werden.

Klicken Sie mit der rechten Maustaste, um eine Reihe verfügbarer Transformationen für diesen Wert anzuzeigen.

Zeigt ein Kontextmenü mit verfügbaren Tranformationen für einen einzelnen Balken im Wertverteilungsbalkendiagramm an. .

Kopieren von Daten

In der oberen rechten Ecke der Spaltenstatistiken und der Werteverteilungsabschnitte können Sie die Schaltfläche mit den Auslassungspunkten (...) auswählen, um ein Kontextmenü kopieren anzuzeigen. Wählen Sie sie aus, um die in beiden Abschnitten angezeigten Daten in die Zwischenablage zu kopieren.

Kopieren von Spaltenstatistiken.

Gruppierung nach Wert

Wenn Sie in der oberen rechten Ecke des Wertverteilungsdiagramms die Schaltfläche mit den Auslassungspunkten (...) auswählen, können Sie zusätzlich zu Kopierengruppieren nach auswählen. Dieses Feature gruppiert die Werte in Ihrem Diagramm nach einer Reihe verfügbarer Optionen.

Gruppierung nach Wertverteilung.

Die folgende Abbildung zeigt eine Spalte mit Produktnamen, die nach Textlänge gruppiert wurden. Nachdem die Werte im Diagramm gruppiert wurden, können Sie mit einzelnen Werten im Diagramm interagieren, wie unter Filtern nach Wert beschrieben.

Neues Balkendiagramm mit der Verteilung der Textlänge von Speichernamen in der Spalte Namen der Tabelle.