De hulpprogramma's voor gegevensprofilering gebruiken

De hulpprogramma's voor gegevensprofilering bieden nieuwe en intuïtieve manieren om gegevens in Power Query-editor op te schonen, transformeren en begrijpen. Deze omvatten:

  • Kolomkwaliteit

  • Kolomdistributie

  • Kolomprofiel

Als u de hulpprogramma's voor gegevensprofilering wilt inschakelen, gaat u naar het tabblad Weergave op het lint. Schakel de gewenste opties in de groep Gegevensvoorbeeld in, zoals wordt weergegeven in de volgende afbeelding.

Data profiling tools.

Nadat u de opties hebt ingeschakeld, ziet u iets als de volgende afbeelding in Power Query-editor.

Data profiling tools enabled.

Notitie

Standaard voert Power Query deze gegevensprofilering uit over de eerste 1000 rijen van uw gegevens. Als u deze wilt laten werken over de hele gegevensset, controleert u de linkerbenedenhoek van het editorvenster om te wijzigen hoe kolomprofilering wordt uitgevoerd.

Kolomkwaliteit

De kolomkwaliteitsfunctie labels waarden in rijen in vijf categorieën:

  • Geldig, weergegeven in groen.

  • Fout, rood weergegeven.

  • Leeg, weergegeven in donkergrijs.

  • Onbekend, weergegeven in gestreept groen. Geeft aan wanneer er fouten in een kolom zijn, is de kwaliteit van de resterende gegevens onbekend.

  • Onverwachte fout, weergegeven in onderbroken rood.

Deze indicatoren worden direct onder de naam van de kolom weergegeven als onderdeel van een klein staafdiagram, zoals wordt weergegeven in de volgende afbeelding.

Enhanced view of the bar chart with data quality indicators and labels above each column in the table.

Het aantal records in elke kolomkwaliteitscategorie wordt ook weergegeven als percentage.

Door de muisaanwijzer op een van de kolommen te bewegen, ziet u de numerieke verdeling van de kwaliteit van waarden in de hele kolom. Als u ook de knop met het beletselteken (...) selecteert, worden enkele snelle actieknoppen geopend voor bewerkingen op de waarden.

Distribution of names column with 701 names valid (100 percent), zero errors and zero empty, with quick action commands displayed.

Kolomdistributie

Deze functie biedt een set visuals onder de namen van de kolommen waarin de frequentie en verdeling van de waarden in elk van de kolommen worden weergegeven. De gegevens in deze visualisaties worden gesorteerd in aflopende volgorde van de waarde met de hoogste frequentie.

Column distribution.

Door de muisaanwijzer over de distributiegegevens in een van de kolommen te bewegen, krijgt u informatie over de algemene gegevens in de kolom (met afzonderlijke aantallen en unieke waarden). U kunt ook de knop met het beletselteken selecteren en kiezen uit een menu met beschikbare bewerkingen.

Column distributions options.

Kolomprofiel

Deze functie biedt een uitgebreider overzicht van de gegevens in een kolom. Naast het kolomdistributiediagram bevat het een kolomstatistiekendiagram. Deze informatie wordt weergegeven onder de sectie Gegevensvoorbeeld, zoals wordt weergegeven in de volgende afbeelding.

Column profile.

Filteren op waarde

U kunt het waardedistributiediagram aan de rechterkant gebruiken en een van de balken selecteren door de muisaanwijzer over de delen van de grafiek te bewegen.

Hover over bar in value distribution bar chart, which shows individual data for that bar.

Klik met de rechtermuisknop om een set beschikbare transformaties voor die waarde weer te geven.

Displays shortcut menu with available tranformations for a single bar in the value distribution bar chart.

Gegevens kopiëren

In de rechterbovenhoek van de secties kolomstatistieken en waardedistributie kunt u de knop met het beletselteken (...) selecteren om een snelmenu Kopiëren weer te geven. Selecteer deze optie om de gegevens te kopiëren die in een van beide secties worden weergegeven naar het klembord.

Copy column statistics.

Groeperen op waarde

Wanneer u de knop met het beletselteken (...) selecteert in de rechterbovenhoek van het waardedistributiediagram, kunt u naast Kopiërengroeperen op selecteren. Met deze functie worden de waarden in de grafiek gegroepeerd op basis van een set beschikbare opties.

Group by value distribution.

In de onderstaande afbeelding ziet u een kolom met productnamen die zijn gegroepeerd op tekstlengte. Nadat de waarden in de grafiek zijn gegroepeerd, kunt u communiceren met afzonderlijke waarden in de grafiek, zoals beschreven in Filter op waarde.

New bar chart showing the distribution of the text length of store names in the table's Names column.