Jaa


Rivien ryhmittely tai yhteenveto

Power Queryssa voit ryhmitellä eri rivien arvot yhdeksi arvoksi ryhmittelemällä rivit yhden tai useamman sarakkeen arvojen mukaan. Voit valita kahdentyyppisiä ryhmittelytoimintoja:

  • Sarake ryhmittelyt.

  • Rivien ryhmittelyt.

Tässä opetusohjelmassa käytetään seuraavaa esimerkkitaulukkoa.

Esimerkki alkuperäisestä taulukosta.

Näyttökuva taulukosta, jossa on sarakkeita, joissa näkyvät Vuosi (2020), Maa (USA, Panama tai Kanada), tuote (paita tai shorts), myyntikanava (online tai jälleenmyyjä) ja yksiköt (eri arvot 55–7500)

Ryhmittelyperuste-painikkeen löytäminen

Ryhmittelyperuste-painikkeen voi etsiä kolmesta paikasta:

  • Valitse Aloitus-välilehden Muunna-ryhmästä.

    Näyttökuva Power Query -valintanauhasta, jossa Aloitus-välilehdessä on korostettu Ryhmittelyperuste-valintanauha.

  • Muunna-välilehden Taulukko-ryhmässä.

    Näyttökuva Power Query -valintanauhasta, jossa Ryhmittelyperuste-valintanauha on korostettu Muunna-välilehdessä.

  • Kun napsautat pikavalikosta sarakkeita hiiren kakkospainikkeella.

    Näyttökuva taulukosta, jossa pikavalikossa on korostettu Ryhmittelyperuste-vaihtoehto.

Koostefunktion käyttäminen ryhmittelyssä yhden tai useamman sarakkeen mukaan

Tässä esimerkissä tavoitteesi on tehdä yhteenveto maan ja myyntikanavan tasolla myytyjen yksiköiden kokonaismäärästä. Voit suorittaa ryhmittelyperuste-toiminnon Maa - ja Myyntikanava-sarakkeiden avulla.

  1. Valitse Aloitus-välilehdeltä Ryhmitteleperuste.
  2. Valitse Lisäasetukset-vaihtoehto , jotta voit valita useita sarakkeita, joiden mukaan ryhmitellä.
  3. Valitse Country-sarake.
  4. Valitse Lisää ryhmittely.
  5. Valitse Myyntikanava-sarake.
  6. Kirjoita Uuden sarakkeen nimi -kohtaan Yksiköitä yhteensä, valitse Operaatio, valitse Summa ja valitse Sarake-kohdasta Yksiköt.
  7. Valitse OK

Näyttökuva Ryhmittelyperuste-valintaikkunasta, jossa on täytetyt koostesarakkeet.

Tämä toiminto antaa sinulle seuraavan taulukon.

Näyttökuva mallitulostetaulukosta, jossa on Sarakkeet Maa-, Myyntikanava- ja Yksiköitä yhteensä -sarakkeet.

Käytettävissä olevat toiminnot

Ryhmittelyperuste-ominaisuuden avulla käytettävissä olevat toiminnot voidaan luokitella kahdella tavalla:

  • Rivitason toiminto
  • Saraketason toiminto

Seuraavassa taulukossa kuvataan jokainen näistä toiminnoista.

Toiminnon nimi Luokka Kuvaus
Sum Saraketoiminto Laskee yhteen kaikki sarakkeen arvot
Average Saraketoiminto Laskee keskiarvon sarakkeesta
Mediaani Saraketoiminto Laskee mediaaniarvon sarakkeesta
Min Saraketoiminto Laskee minimiarvon sarakkeesta
Max Saraketoiminto Laskee sarakkeen enimmäisarvon
Prosenttipiste Saraketoiminto Laskee prosenttipisteen käyttämällä syötearvoa 0–100 sarakkeesta
Erillisten arvojen laskeminen Saraketoiminto Laskee sarakkeen erillisten arvojen määrän
Laske rivit Rivitoiminto Laskee tietyn ryhmän rivien kokonaismäärän
Laske erilliset rivit Rivitoiminto Laskee tietyn ryhmän erillisten rivien määrän
Kaikki rivit Rivitoiminto Tulostaa kaikki taulukon ryhmitellyt rivit ilman koosteita

Muistiinpano

Erillisten määrä- ja Prosenttipiste-toiminnot ovat käytettävissä vain Power Query Onlinessa.

Suorita toiminto ryhmittelyssä yhden tai useamman sarakkeen mukaan

Alkuperäisestä mallista alkaen luot tässä esimerkissä sarakkeen, joka sisältää yksiköiden kokonaismäärän ja kaksi muuta saraketta, jotka antavat sinulle parhaiten suoriutuneen tuotteen nimen ja myydyt yksiköt maan ja myyntikanavan tasolla yhteenvedon mukaan.

Näyttökuva toimintojen sisältävästä mallitulostetaulukosta.

  1. Käytä seuraavia sarakkeita Ryhmittelyperuste-sarakkeina:

    • Maa
    • Myyntikanava
  2. Luo kaksi uutta saraketta seuraavasti:

    1. Koosta Yksiköt-sarake käyttämällä Sum-toimintoa. Anna tälle sarakkeelle nimeksi Yksiköitä yhteensä.
    2. Lisää uusi Tuotteet-sarake käyttämällä Kaikki rivit -toimintoa .

    Näyttökuva Ryhmittelyperuste-valintaikkunasta, jossa on koostamaton sarake.

Kun tämä toiminto on valmis, huomaa, miten Products-sarakkeessa on [Table]-arvot kunkin solun sisällä. Jokainen [Taulukko]-arvo sisältää kaikki rivit, jotka on ryhmitelty alkuperäisen taulukon Maa- ja Myyntikanava-sarakkeiden mukaan. Voit valita solun sisällä olevan tyhjän tilan, jolloin valintaikkunan alareunassa olevan taulukon sisällön esikatselu tulee näkyviin.

Näyttökuva taulukon tietojen esikatseluruudusta.

Muistiinpano

Tietojen esikatseluruudussa ei välttämättä näy kaikkia ryhmittelyperuste-toiminnossa käytettyjä rivejä. Voit valita [Taulukko]-arvon, jos haluat nähdä kaikki vastaavan ryhmittelyperuste-toiminnon rivit.

Seuraavaksi sinun on purettava rivi, jolla on suurin arvo uuden Tuotteet-sarakkeen taulukoiden Units-sarakkeessa, ja kutsuttava kyseistä uutta saraketta Top performer -tuotteeksi.

Poimi tärkeimmät suorittajan tuotetiedot

Uuden Tuotteet-sarakkeen [Taulukko]-arvoilla luot uuden mukautetun sarakkeen siirtymällä valintanauhan Lisää sarake -välilehteen ja valitsemalla Mukautettu sarake Yleiset-ryhmästä.

Näyttökuva Power Query -valintanauhasta, jossa Mukautettu sarake -vaihtoehto on korostettu Lisää sarake -välilehdessä.

Anna uudelle sarakkeelle nimi Top performer product. Kirjoita kaava Table.Max([Products], "Units" ) Mukautettu sarakekaava -kohtaan.

Näyttökuva Mukautettu sarake -valintaikkunasta, johon on syötetty Table.Max-kaava.

Tämän kaavan tulos luo uuden sarakkeen, jossa on [Record]-arvot. Nämä tietuearvot ovat pohjimmiltaan taulukko, jossa on vain yksi rivi. Nämä tietueet sisältävät rivin, jossa on yksikkösarakkeen enimmäisarvo kullekin [Taulukko]-arvolle Products-sarakkeessa.

Näyttökuva mukautetun sarakekaavan tuloksesta Table.Max-funktiolla.

Tämän uuden Top performer -tuotesarakkeen, joka sisältää [Tietue]-arvot, voit valita laajennuskuvakkeen, valita Tuote- ja Yksiköt-kentät ja valita sitten OK.

Näyttökuva Top performer -tuotesarakkeen tietuearvon laajennustoiminnosta.

Kun olet poistanut Tuotteet-sarakkeen ja määrittänyt tietotyypin kummallekin juuri laajennetulle sarakkeelle, tulos näyttää samalta kuin seuraavassa kuvassa.

Näyttökuva lopullisesta taulukosta, jossa on kaikki muunnokset.

Sumea ryhmittely

Muistiinpano

Seuraava ominaisuus on käytettävissä vain Power Query Onlinessa.

Seuraavassa kuvassa näkyvä esimerkkitaulukko havainnollistaa, miten voit tehdä "sumean ryhmittelyn".

Näyttökuva taulukosta, jossa on yhdeksän riviä merkintöjä, jotka sisältävät eri kirjoitusasuja ja isoilla kirjaimilla nimeltä Miguel ja William.

Sumean ryhmittelyn tavoitteena on tehdä ryhmittelyperuste-toiminto, joka käyttää tekstimerkkijonojen likimääräistä vastaavuusalgoritmia. Power Query käyttää Jaccard-samankaltaisuusalgoritmia esiintymäparien samankaltaisuuden mittaamiseen. Sitten se käyttää taajamallista hierarkkista klusterointia esiintymien ryhmittelemiseen yhteen. Seuraavassa kuvassa näet odotetun tuloksen, jossa taulukko ryhmitetään Henkilö-sarakkeen mukaan.

Näyttökuva taulukosta, joka näyttää person-merkinnät Miguel- ja Mike-arvoina ja Tiheys-kohdat vastaavasti numeroina 3 ja 2.

Jos haluat tehdä sumean ryhmittelyn, suorita samat vaiheet, jotka kuvattiin aiemmin tässä artikkelissa. Ainoa ero on, että tällä kertaa Valitse Ryhmittelyperuste-valintaikkunassa Käytä sumea ryhmittely -valintaruutu.

Näyttökuva Sumea ryhmittely -valintaruudusta, joka on korostettu Ryhmittelyperuste-valintaikkunassa.

Power Query valitsee jokaiselle riviryhmälle yleisimmän esiintymän kanoniseksi esiintymäksi. Jos useita esiintymiä esiintyy samalla tiheydellä, Power Query valitsee ensimmäisen. Kun olet valinnut OK Ryhmittelyperuste-valintaikkunassa, saat odottamasi tuloksen.

Näyttökuva sumean ryhmittelymallin lopullisesta taulukosta, ei muunnostaulukkoa.

Voit kuitenkin hallita sumeaa ryhmittelytoimintoa paremmin laajentamalla Sumea ryhmä -vaihtoehtoja.

Näyttökuva Ryhmittelyperuste-valintaikkunasta, jossa on korostettu Sumea ryhmä -asetukset.

Sumean ryhmittelyn käytettävissä ovat seuraavat vaihtoehdot:

  • Samankaltaisuuden raja-arvo (valinnainen): Tämä asetus ilmaisee, miten samanlaiset kaksi arvoa on ryhmiteltävä yhteen. Minimiasetus nolla (0) aiheuttaa sen, että kaikki arvot ryhmitellaan yhteen. Suurin asetus 1 sallii vain tarkalleen vastaavat arvot ryhmitellä yhteen. Oletusarvo on 0,8.
  • Ohita kirjainkoko: Kun tekstimerkkijonoja verrataan, kirjainkoko ohitetaan. Tämä asetus on oletusarvoisesti käytössä.
  • Ryhmittele yhdistämällä tekstiosat: Algoritmi yrittää yhdistää tekstiosat (esimerkiksi yhdistämällä Microsoftin ja pehmeästi) arvot ryhmittelemiseksi.
  • Näytä samankaltaisuuspisteet: Näytä samankaltaisuuspisteet syötearvojen ja laskettujen edustavien arvojen välillä sumean ryhmittelyn jälkeen. Edellyttää kaikkien rivien ja kaikkien rivien kaltaisten toiminnon lisäämistä, jotta nämä tiedot voidaan esitellä rivi riviltä -tasolla.
  • Muunnostaulukko (valinnainen): Voit valita muunnostaulukon, joka yhdistää arvot (kuten MSFT:n Microsoftiin) ja ryhmitellä ne yhteen.

Tässä esimerkissä käytetään muunnostaulukkoa osoittamaan, miten arvoja voidaan yhdistää. Muunnostaulukossa on kaksi saraketta:

  • Lähde: Taulukossa etsittävä tekstimerkkijono.
  • To: Tekstimerkkijono, jota käytetään korvaamaan tekstimerkkijono Kohteesta-sarakkeessa.

Seuraavassa kuvassa näytetään tässä esimerkissä käytetty muunnostaulukko.

Näyttökuva taulukosta, joka näyttää Miken ja Williamin arvot sekä Miguelin ja Billin arvot.

Tärkeä

On tärkeää, että muunnostaulukossa on samat sarakkeiden ja sarakkeiden nimet kuin edellisessä kuvassa (niille on merkittävä nimet "From" ja "To"). Muussa tapauksessa Power Query ei tunnista taulukkoa muunnostaulukoksi.

Palaa Ryhmittelyperuste-valintaikkunaan, laajenna Sumea ryhmä -asetuksia, muuta toiminto Laske rivit -asetukseksi Kaikki rivit, ota käyttöön Näytä samankaltaisuuspisteet -vaihtoehto ja valitse sitten avattava Muunna-taulukon valikko.

Näyttökuva sumean ryhmittelymallin muunnostaulukon avattavasta valikosta.

Kun olet valinnut muunnostaulukon, valitse OK. Toiminnon tulos antaa seuraavat tiedot:

Näyttökuva sumeasta ryhmittelyn lopullisesta taulukosta muunnostaulukon kanssa.

Tässä esimerkissä Ohita tapaus -asetus on käytössä, joten muunnostaulukon Lähde-sarakkeen arvoja käytetään merkkijonon etsimiseen ottamatta huomioon merkkijonon tapausta. Tämä muunnostoiminto suoritetaan ensin, ja sitten suoritetaan sumea ryhmittelytoiminto.

Samankaltaisuuspisteet näytetään myös henkilö-sarakkeen vieressä olevassa taulukon arvossa, mikä kuvastaa tarkalleen sitä, miten arvot ryhmiteltiin ja miten ne vastaavat samankaltaisuuspisteitä. Voit tarvittaessa laajentaa tämän sarakkeen tai käyttää uuden Frequency-sarakkeiden arvoja muunnoksiin.

Muistiinpano

Kun ryhmittelyä tehdään useiden sarakkeiden mukaan, muunnostaulukko suorittaa korvaustoiminnon kaikissa sarakkeissa, jos arvon korvaaminen kasvattaa samankaltaisuuspistemäärää.

Lisätietoja muunnostaulukoiden toiminnasta saat muunnostaulukon ennakkoluvat-kohdasta.

Katso myös

Mukautetun sarakkeen lisääminen
Kaksoiskappaleiden poistaminen