Verwenden der Tools zur Datenprofilerstellung

Die Tools zur Datenprofilerstellung bieten neue und intuitive Möglichkeiten zum Bereinigen, Transformieren und Verstehen von Daten im Power Query Editor. Dazu gehören:

  • Spaltenqualität

  • Spaltenverteilung

  • Spaltenprofil

Um die Tools zur Datenprofilerstellung zu aktivieren, gehen Sie auf die Registerkarte Ansicht im Menüband. Aktivieren Sie in Power Query Desktop die gewünschten Optionen in der Gruppe Datenvorschau, wie in der folgenden Abbildung dargestellt.

Tools zur Erstellung von Datenprofilen.

Wählen Sie in Power Query Online Datenansicht, und aktivieren Sie dann die gewünschten Optionen in der Dropdown-Liste.

<Alternativer Text>

Nachdem Sie die Optionen aktiviert haben, sehen Sie im Power Query Editor etwas wie das folgende Bild.

Datenprofilerstellungstools aktiviert.

Hinweis

Standardmäßig führt Power Query dieses Daten-Profiling für die ersten 1.000 Zeilen Ihrer Daten durch. Um den gesamten Datensatz zu bearbeiten, wählen Sie die Meldung Column profiling based on top 1000 rows in der unteren linken Ecke des Editor-Fensters, um die Spaltenprofilierung in Column profiling based on entire dataset zu ändern.

Spaltenqualität

Die Spalte Qualitätsmerkmal kennzeichnet Werte in Zeilen in fünf Kategorien:

  • Gültig, grün dargestellt.

  • Fehler, in rot dargestellt.

  • Leer, in dunkelgrau dargestellt.

  • Unbekannt, in gestricheltem Grün dargestellt. Zeigt an, dass bei Fehlern in einer Spalte die Qualität der übrigen Daten unbekannt ist.

  • Unerwarteter Fehler, in gestricheltem Rot dargestellt.

Diese Indikatoren werden direkt unter dem Namen der Spalte als Teil eines kleinen Balkendiagramms angezeigt, wie in der folgenden Abbildung zu sehen ist.

Erweiterte Ansicht des Balkendiagramms mit Datenqualitätsindikatoren und Bezeichnungen über jeder Spalte in der Tabelle.

Die Anzahl der Datensätze in jeder Spaltenqualitätskategorie wird auch als Prozentsatz angezeigt.

Wenn Sie mit dem Mauszeiger über eine der Spalten fahren, wird Ihnen die numerische Verteilung der Qualität der Werte in der Spalte angezeigt. Zusätzlich können Sie durch Auswahl der Ellipsen-Schaltfläche (...) einige Schnellaktionsschaltflächen für Operationen mit den Werten öffnen.

Spalte Verteilung der Namen mit 701 gültigen Namen (100 Prozent), null Fehlern und null leeren Namen, mit angezeigten Befehlen für schnelle Aktionen.

Spaltenverteilung

Diese Funktion bietet eine Reihe von visuellen Darstellungen unterhalb der Spaltennamen, die die Häufigkeit und Verteilung der Werte in jeder Spalte zeigen. Die Daten in diesen Visualisierungen sind absteigend sortiert, beginnend mit dem Wert mit der höchsten Häufigkeit.

Spaltenverteilung.

Wenn Sie den Mauszeiger über die Verteilungsdaten in einer der Spalten bewegen, erhalten Sie Informationen über die Gesamtdaten in der Spalte (mit eindeutiger Anzahl und eindeutigen Werten). Sie können auch auf die Ellipsen-Schaltfläche klicken und aus einem Menü mit verfügbaren Operationen wählen.

Spaltenverteilungsoptionen.

Spaltenprofil

Diese Funktion ermöglicht eine genauere Betrachtung der Daten in einer Spalte. Neben dem Säulenverteilungsdiagramm enthält es auch ein Säulenstatistikdiagramm. Diese Informationen werden unterhalb des Bereichs der Datenvorschau angezeigt, wie in der folgenden Abbildung dargestellt.

Spaltenprofil.

Nach Wert filtern

Sie können mit dem Wertverteilungsdiagramm auf der rechten Seite interagieren und jeden der Balken auswählen, indem Sie mit dem Mauszeiger über die Teile des Diagramms fahren.

Bewegen Sie den Mauszeiger über einen Balken im Balkendiagramm der Werteverteilung, um einzelne Daten für diesen Balken anzuzeigen.

Klicken Sie mit der rechten Maustaste, um eine Reihe von verfügbaren Transformationen für diesen Wert anzuzeigen.

Zeigt ein Kontextmenü mit den verfügbaren Transformationen für einen einzelnen Balken im Balkendiagramm der Werteverteilung an.

Kopieren von Daten

In der oberen rechten Ecke der Abschnitte Spaltenstatistik und Werteverteilung können Sie die Ellipsenschaltfläche (...) auswählen, um ein Kontextmenü Kopieren anzuzeigen. Wählen Sie diese Option, um die in einem der beiden Bereiche angezeigten Daten in die Zwischenablage zu kopieren.

Kopieren Spaltenstatistiken.

Gruppe nach Wert

Wenn Sie die Ellipsen-Schaltfläche (...) in der oberen rechten Ecke des Werteverteilungsdiagramms wählen, können Sie zusätzlich zu Kopieren auch Gruppieren nach wählen. Diese Funktion gruppiert die Werte in Ihrem Diagramm nach einer Reihe von verfügbaren Optionen.

Gruppieren nach Wertverteilung.

Die folgende Abbildung zeigt eine Spalte mit Produktnamen, die nach Textlänge gruppiert wurden. Nachdem die Werte im Diagramm gruppiert wurden, können Sie mit einzelnen Werten im Diagramm interagieren, wie unter Filter nach Wert beschrieben.

Neues Balkendiagramm, das die Verteilung der Textlänge der Storenamen in der Spalte Tabellenname zeigt.