Del via


Brug af værktøjerne til dataprofilering

Værktøjerne til dataprofilering giver nye og intuitive måder at rense, transformere og forstå data på i Power Query-editor. De omfatter:

  • Kolonnekvalitet

  • Kolonnedistribution

  • Kolonneprofil

Hvis du vil aktivere værktøjerne til dataprofilering, skal du gå til fanen Vis på båndet. I Power Query Desktop skal du aktivere de ønskede indstillinger i gruppen Forhåndsvisning af data som vist på følgende billede.

Screenshot of the Data profiling tools selected under the Power Query View tab.Skærmbillede af de værktøjer til dataprofilering, der er valgt under fanen Visning af Power-forespørgsel.

I Power Query Online skal du vælge Datavisning og derefter aktivere de ønskede indstillinger på rullelisten.

Screenshot of the data profiling tools selected under Data view in the View tab.Skærmbillede af de værktøjer til dataprofilering, der er valgt under Datavisning under fanen Vis.

Når du har aktiveret indstillingerne, vises oplysningerne om dataprofilering i Power Query-editoren.

Screenshot of the data profiling tools after they're set up.Skærmbillede af værktøjerne til dataprofilering, når de er konfigureret.

Bemærk

Som standard udfører Power Query denne dataprofilering over de første 1.000 rækker af dine data. Hvis den skal fungere over hele datasættet, skal du vælge meddelelsen Kolonneprofilering baseret på de øverste 1000 rækker i nederste venstre hjørne af editorvinduet for at ændre kolonneprofilering til Kolonneprofilering baseret på hele datasættet.

Kolonnekvalitet

Kolonnekvalitetsfunktionen mærkater værdier i rækker i fem kategorier:

  • Gyldig, vist med grønt.

  • Fejl, vist med rødt.

  • Tom, vist i mørke grå.

  • Ukendt, vist i stiplet grøn. Angiver, hvornår der er fejl i en kolonne, og kvaliteten af de resterende data er ukendt.

  • Uventet fejl, vist med stiplet rød.

Disse indikatorer vises direkte under navnet på søjlen som en del af et lille liggende søjlediagram.

Screenshot of the enhanced view of the bar chart with data quality indicators and labels above each column in the table.Skærmbillede af den forbedrede visning af det liggende søjlediagram med datakvalitetsindikatorer og mærkater over hver kolonne i tabellen.

Antallet af poster i hver kolonnekvalitetskategori vises også som en procentdel.

Når du holder markøren over en af kolonnerne, får du vist den numeriske fordeling af værdiernes kvalitet i hele kolonnen. Hvis du vælger ellipseknappen (...) åbnes der desuden nogle hurtig handlingsknapper til handlinger på værdierne.

Screenshot of the distribution of names column with 701 names valid (100 percent), zero errors and zero empty, with quick action commands displayed.Skærmbillede af distributionen af navnekolonnen med 701 gyldige navne (100 procent), nul fejl og nul tom, hvor kommandoer til hurtig handling vises.

Kolonnedistribution

Denne funktion indeholder et sæt visualiseringer under navnene på de kolonner, der viser hyppigheden og fordelingen af værdierne i hver af kolonnerne. Dataene i disse visualiseringer sorteres i faldende rækkefølge fra værdien med den højeste hyppighed.

Screenshot of the data profiling tools with the upper column distribution emphasized.Skærmbillede af værktøjerne til dataprofilering, hvor distributionen af den øverste kolonne er fremhævet.

Når du holder markøren over distributionsdataene i en af kolonnerne, får du oplysninger om de overordnede data i kolonnen (med særskilt antal og entydige værdier). Distinct refererer til det samlede antal forskellige værdier i hver kolonne. Entydige refererer til værdier, der kun har en enkelt forekomst i kolonnen. Du kan også vælge ellipseknappen og vælge fra en menu med tilgængelige handlinger.

Screenshot of the data profiling tools with the column distributions options emphasized.Skærmbillede af værktøjerne til dataprofilering med indstillingerne for kolonnedistribution fremhævet.

Kolonneprofil

Denne funktion giver et mere detaljeret indblik i dataene i en kolonne. Bortset fra søjledistributionsdiagrammet indeholder det et søjlestatistikdiagram. Disse oplysninger vises under afsnittet med forhåndsvisning af data.

Screenshot of the data profiling tool with the column profile emphasized.Skærmbillede af værktøjet til dataprofilering, hvor kolonneprofilen er fremhævet.

Filtrer efter værdi

Du kan interagere med værdifordelingsdiagrammet i højre side og vælge en af søjlerne ved at holde markøren over delene af diagrammet.

Screenshot demonstrating how to hover over the bar in value distribution bar chart, which shows individual data for that bar.Skærmbillede, der viser, hvordan du holder markøren over søjlen i liggende søjlediagram for værdifordeling, som viser individuelle data for den pågældende søjle.

Højreklik for at få vist et sæt tilgængelige transformationer for den pågældende værdi.

Screenshot demonstrating how to display the shortcut menu with available transformations for a single bar in the value distribution bar chart.Skærmbillede, der demonstrerer, hvordan du får vist genvejsmenuen med tilgængelige transformationer for en enkelt søjle i liggende søjlediagram for værdifordeling.

Kopiér data

I øverste højre hjørne af både kolonnestatistik- og værdidistributionsafsnittene kan du vælge ellipseknappen (...) for at få vist en genvejsmenu til kopiering . Markér den for at kopiere de data, der vises i en af sektionerne, til Udklipsholder.

Screenshot of the copy shortcut menu in the column statistics column.Skærmbillede af genvejsmenuen til kopiering i kolonnen med kolonnestatistik.

Gruppér efter værdi

Når du vælger ellipseknappen (...) i øverste højre hjørne af værdifordelingsdiagrammet, kan du ud over Kopiér vælge Gruppér efter. Denne funktion grupperer værdierne i diagrammet efter et sæt tilgængelige indstillinger.

Screenshot of the copy and group by shortcut menu in the value distribution column.Skærmbillede af genvejsmenuen Kopiér og gruppér efter i kolonnen til værdidistribution.

På følgende billede vises en kolonne med produktnavne, der er grupperet efter tekstlængde. Når værdierne er grupperet i diagrammet, kan du interagere med individuelle værdier i diagrammet som beskrevet i Filtrer efter værdi.

Screenshot of the new bar chart showing the distribution of the text length of store names in the table's Names column.Skærmbillede af det nye liggende søjlediagram, der viser fordelingen af tekstlængden af butiksnavne i kolonnen Navne i tabellen.