Gruppere eller oppsummere rader
I Power Query kan du gruppere verdier i forskjellige rader til én enkelt verdi ved å gruppere radene i henhold til verdiene i én eller flere kolonner. Du kan velge mellom to typer grupperingsoperasjoner:
Kolonnegrupperinger.
Radgrupperinger.
For denne opplæringen bruker du følgende eksempeltabell.
Skjermbilde av en tabell med kolonner som viser År (2020), Land (USA, Panama eller Canada), Produkt (Skjorte eller Shorts), Salgskanal (Online eller Forhandler) og Enheter (forskjellige verdier fra 55 til 7500)
Du finner Grupper etter-knappen på tre steder:
I Transformer-gruppen på Hjem-fanen.
I Tabell-gruppen på Fanen Transformer.
Når du høyreklikker på hurtigmenyen, høyreklikker du for å velge kolonner.
I dette eksemplet er målet å oppsummere totalt antall solgte enheter på land- og salgskanalnivå. Du bruker kolonnene Land og Salgskanal til å utføre gruppen etter operasjon.
- Velg Grupper etter på Hjem-fanen .
- Velg avansert-alternativet, slik at du kan velge flere kolonner du vil gruppere etter.
- Velg Land-kolonnen.
- Velg Legg til gruppering.
- Velg Salgskanal-kolonnen.
- I Nytt kolonnenavn skriver du inn Totalt antall enheter, i Operasjon, velger Sum og velger Enheter i kolonne.
- Velg OK
Denne operasjonen gir deg følgende tabell.
Med funksjonen Grupper etter kan de tilgjengelige operasjonene kategoriseres på to måter:
- Operasjon på radnivå
- Operasjon på kolonnenivå
Tabellen nedenfor beskriver hver av disse operasjonene.
Operasjonsnavn | Kategori | Bekrivelse |
---|---|---|
Sum | Kolonneoperasjon | Oppsummerer alle verdier fra en kolonne |
Average | Kolonneoperasjon | Beregner gjennomsnittsverdien fra en kolonne |
Median | Kolonneoperasjon | Beregner medianen fra en kolonne |
Min | Kolonneoperasjon | Beregner minimumsverdien fra en kolonne |
Max | Kolonneoperasjon | Beregner maksimumsverdien fra en kolonne |
Persentil | Kolonneoperasjon | Beregner persentilen ved hjelp av en inndataverdi fra 0 til 100, fra en kolonne |
Telle distinkte verdier | Kolonneoperasjon | Beregner antall distinkte verdier fra en kolonne |
Telle rader | Radoperasjon | Beregner totalt antall rader fra en gitt gruppe |
Telle distinkte rader | Radoperasjon | Beregner antall distinkte rader fra en gitt gruppe |
Alle rader | Radoperasjon | Sender ut alle grupperte rader i en tabellverdi uten aggregasjoner |
Obs!
Antall distinkte verdier og persentiloperasjoner er bare tilgjengelige i Power Query Online.
Fra og med det opprinnelige eksemplet oppretter du i dette eksemplet en kolonne som inneholder totalt antall enheter og to andre kolonner som gir deg navnet og enhetene som selges for produktet med beste ytelse, oppsummert på land- og salgskanalnivå.
Bruk følgende kolonner som Grupper etter kolonner:
- Land
- Salgskanal
Opprett to nye kolonner ved å følge disse trinnene:
- Aggreger Enheter-kolonnen ved hjelp av Sum-operasjonen. Gi navn til denne kolonnen Totalt antall enheter.
- Legg til en ny Produkter-kolonne ved hjelp av Alle rader-operasjonen .
Når operasjonen er fullført, kan du legge merke til hvordan Produkter-kolonnen har [Tabell]-verdier i hver celle. Hver [Tabell]-verdi inneholder alle radene som ble gruppert etter kolonnene Land og Salgskanal fra den opprinnelige tabellen. Du kan velge mellomrom i cellen for å se en forhåndsvisning av innholdet i tabellen nederst i dialogboksen.
Obs!
Forhåndsvisningsruten for detaljer viser kanskje ikke alle radene som ble brukt for gruppe-etter-operasjonen. Du kan velge [Tabell]-verdien for å se alle rader som gjelder den tilsvarende group-by-operasjonen.
Deretter må du trekke ut raden som har den høyeste verdien i Enheter-kolonnen i tabellene i den nye Produkter-kolonnen, og kalle det nye kolonnen Top performer-produktet.
Med den nye Produkter-kolonnen med [Tabell]-verdier oppretter du en ny egendefinert kolonne ved å gå til Fanen Legg til kolonne på båndet og velge Egendefinert kolonne fra Generelt-gruppen .
Gi navn til det nye topartistproduktet for kolonnen. Skriv inn formelen Table.Max([Products], "Units" )
under Egendefinert kolonneformel.
Resultatet av denne formelen oppretter en ny kolonne med [Record]-verdier. Disse postverdiene er i hovedsak en tabell med bare én rad. Disse postene inneholder raden med maksimumsverdien for Enheter-kolonnen for hver [Tabell]-verdi i Produkter-kolonnen .
Med denne nye produktkolonnen for øverste artist som inneholder [Record]-verdier, kan du velge utvid-ikonet, velge feltene Produkt og Enheter og deretter velge OK.
Når du har fjernet Produkter-kolonnen og angitt datatypen for begge nylig utvidede kolonner, vil resultatet ligne på følgende bilde.
Obs!
Følgende funksjon er bare tilgjengelig i Power Query Online.
Hvis du vil demonstrere hvordan du gjør «uklar gruppering», bør du vurdere eksempeltabellen som vises på bildet nedenfor.
Målet med uklar gruppering er å utføre en grupperingsoperasjon som bruker en omtrentlig samsvarsalgoritme for tekststrenger. Power Query bruker algoritmen for jaccard-likhet til å måle likheten mellom forekomstpar. Deretter bruker den agglomerativ hierarkisk klynge på gruppeforekomster sammen. Bildet nedenfor viser utdataene du forventer, der tabellen er gruppert etter Person-kolonnen .
Hvis du vil utføre den uklare grupperingen, utfører du de samme trinnene som tidligere er beskrevet i denne artikkelen. Den eneste forskjellen er at denne gangen merker du av for Bruk uklar gruppering i dialogboksen Grupper etter.
For hver radgruppe velger Power Query den hyppigste forekomsten som den kanoniske forekomsten. Hvis flere forekomster forekommer med samme frekvens, velger Power Query den første. Når du har valgt OK i dialogboksen Grupper etter, får du resultatet du forventet.
Du har imidlertid mer kontroll over den uklare grupperingsoperasjonen ved å utvide alternativene for Fuzzy-gruppen.
Følgende alternativer er tilgjengelige for uklar gruppering:
- Likhetsterskel (valgfritt): Dette alternativet angir hvor lik to verdier må grupperes sammen. Minimumsinnstillingen null (0) fører til at alle verdier grupperes sammen. Den maksimale innstillingen på 1 tillater bare verdier som samsvarer nøyaktig for å grupperes sammen. Standardverdien er 0,8.
- Ignorer store bokstaver: Når tekststrenger sammenlignes, ignoreres saken. Dette alternativet er aktivert som standard.
- Grupper ved å kombinere tekstdeler: Algoritmen prøver å kombinere tekstdeler (for eksempel kombinere mikro og myk inn i Microsoft) til gruppeverdier.
- Vis likhetsresultater: Vis likhetsresultater mellom inndataverdiene og de beregnede representative verdiene etter uklar gruppering. Krever tillegg av en operasjon, for eksempel Alle rader , for å vise denne informasjonen på rad-for-rad-nivå.
- Transformasjonstabell (valgfritt): Du kan velge en transformasjonstabell som tilordner verdier (for eksempel tilordning av MSFT til Microsoft) for å gruppere dem sammen.
I dette eksemplet brukes en transformasjonstabell til å demonstrere hvordan verdier kan tilordnes. Transformasjonstabellen har to kolonner:
- Fra: Tekststrengen du vil se etter i tabellen.
- Til: Tekststrengen som skal brukes til å erstatte tekststrengen i Fra-kolonnen .
Bildet nedenfor viser transformasjonstabellen som brukes i dette eksemplet.
Viktig
Det er viktig at transformasjonstabellen har de samme kolonnene og kolonnenavnene som vist i forrige bilde (de må være merket «Fra» og «Til»). Ellers gjenkjenner ikke Power Query tabellen som en transformasjonstabell.
Gå tilbake til dialogboksen Grupper etter, utvid alternativer for Fuzzy-gruppen, endre operasjonen fra Antall rader til Alle rader, aktiver alternativet Vis likhetsresultater, og velg deretter rullegardinmenyen transformasjonstabell.
Når du har valgt transformasjonstabellen, velger du OK. Resultatet av denne operasjonen gir deg følgende informasjon:
I dette eksemplet ble alternativet Ignorer tilfelle aktivert, slik at verdiene i Fra-kolonnen i transformasjonstabellen brukes til å se etter tekststrengen uten å vurdere tilfellet med strengen. Denne transformasjonsoperasjonen utføres først, og deretter utføres den uklare grupperingsoperasjonen.
Likhetspoengsummen vises også i tabellverdien ved siden av personkolonnen, som gjenspeiler nøyaktig hvordan verdiene ble gruppert og deres respektive likhetsresultater. Du kan utvide denne kolonnen om nødvendig eller bruke verdiene fra de nye frekvenskolonnene for andre typer transformasjoner.
Obs!
Når du grupperer etter flere kolonner, utfører transformasjonstabellen erstattoperasjonen i alle kolonner hvis det å erstatte verdien øker likhetspoengsummen.
Hvis du vil ha mer informasjon om hvordan transformasjonstabeller fungerer, kan du gå til forskrifter for transformasjonstabeller.