Rivien ryhmittely tai yhteenveto
Power Queryssa voit ryhmitellä eri rivien arvot yhdeksi arvoksi ryhmittelemällä rivit yhden tai useamman sarakkeen arvojen mukaan. Voit valita kahdentyyppisiä ryhmittelytoimintoja:
Sarake ryhmittelyt.
Rivien ryhmittelyt.
Tässä opetusohjelmassa käytetään seuraavaa esimerkkitaulukkoa.
Näyttökuva taulukosta, jossa on sarakkeita, joissa näkyvät Vuosi (2020), Maa (USA, Panama tai Kanada), tuote (paita tai shorts), myyntikanava (online tai jälleenmyyjä) ja yksiköt (eri arvot 55–7500)
Ryhmittelyperuste-painikkeen löytäminen
Ryhmittelyperuste-painikkeen voi etsiä kolmesta paikasta:
Valitse Aloitus-välilehden Muunna-ryhmästä.
Muunna-välilehden Taulukko-ryhmässä.
Kun napsautat pikavalikosta sarakkeita hiiren kakkospainikkeella.
Koostefunktion käyttäminen ryhmittelyssä yhden tai useamman sarakkeen mukaan
Tässä esimerkissä tavoitteesi on tehdä yhteenveto maan ja myyntikanavan tasolla myytyjen yksiköiden kokonaismäärästä. Voit suorittaa ryhmittelyperuste-toiminnon Maa - ja Myyntikanava-sarakkeiden avulla.
- Valitse Aloitus-välilehdeltä Ryhmitteleperuste.
- Valitse Lisäasetukset-vaihtoehto , jotta voit valita useita sarakkeita, joiden mukaan ryhmitellä.
- Valitse Country-sarake.
- Valitse Lisää ryhmittely.
- Valitse Myyntikanava-sarake.
- Kirjoita Uuden sarakkeen nimi -kohtaan Yksiköitä yhteensä, valitse Operaatio, valitse Summa ja valitse Sarake-kohdasta Yksiköt.
- Valitse OK
Tämä toiminto antaa sinulle seuraavan taulukon.
Käytettävissä olevat toiminnot
Ryhmittelyperuste-ominaisuuden avulla käytettävissä olevat toiminnot voidaan luokitella kahdella tavalla:
- Rivitason toiminto
- Saraketason toiminto
Seuraavassa taulukossa kuvataan jokainen näistä toiminnoista.
Toiminnon nimi | Luokka | Kuvaus |
---|---|---|
Sum | Saraketoiminto | Laskee yhteen kaikki sarakkeen arvot |
Average | Saraketoiminto | Laskee keskiarvon sarakkeesta |
Mediaani | Saraketoiminto | Laskee mediaaniarvon sarakkeesta |
Min | Saraketoiminto | Laskee minimiarvon sarakkeesta |
Max | Saraketoiminto | Laskee sarakkeen enimmäisarvon |
Prosenttipiste | Saraketoiminto | Laskee prosenttipisteen käyttämällä syötearvoa 0–100 sarakkeesta |
Erillisten arvojen laskeminen | Saraketoiminto | Laskee sarakkeen erillisten arvojen määrän |
Laske rivit | Rivitoiminto | Laskee tietyn ryhmän rivien kokonaismäärän |
Laske erilliset rivit | Rivitoiminto | Laskee tietyn ryhmän erillisten rivien määrän |
Kaikki rivit | Rivitoiminto | Tulostaa kaikki taulukon ryhmitellyt rivit ilman koosteita |
Muistiinpano
Erillisten määrä- ja Prosenttipiste-toiminnot ovat käytettävissä vain Power Query Onlinessa.
Suorita toiminto ryhmittelyssä yhden tai useamman sarakkeen mukaan
Alkuperäisestä mallista alkaen luot tässä esimerkissä sarakkeen, joka sisältää yksiköiden kokonaismäärän ja kaksi muuta saraketta, jotka antavat sinulle parhaiten suoriutuneen tuotteen nimen ja myydyt yksiköt maan ja myyntikanavan tasolla yhteenvedon mukaan.
Käytä seuraavia sarakkeita Ryhmittelyperuste-sarakkeina:
- Maa
- Myyntikanava
Luo kaksi uutta saraketta seuraavasti:
- Koosta Yksiköt-sarake käyttämällä Sum-toimintoa. Anna tälle sarakkeelle nimeksi Yksiköitä yhteensä.
- Lisää uusi Tuotteet-sarake käyttämällä Kaikki rivit -toimintoa .
Kun tämä toiminto on valmis, huomaa, miten Products-sarakkeessa on [Table]-arvot kunkin solun sisällä. Jokainen [Taulukko]-arvo sisältää kaikki rivit, jotka on ryhmitelty alkuperäisen taulukon Maa- ja Myyntikanava-sarakkeiden mukaan. Voit valita solun sisällä olevan tyhjän tilan, jolloin valintaikkunan alareunassa olevan taulukon sisällön esikatselu tulee näkyviin.
Muistiinpano
Tietojen esikatseluruudussa ei välttämättä näy kaikkia ryhmittelyperuste-toiminnossa käytettyjä rivejä. Voit valita [Taulukko]-arvon, jos haluat nähdä kaikki vastaavan ryhmittelyperuste-toiminnon rivit.
Seuraavaksi sinun on purettava rivi, jolla on suurin arvo uuden Tuotteet-sarakkeen taulukoiden Units-sarakkeessa, ja kutsuttava kyseistä uutta saraketta Top performer -tuotteeksi.
Poimi tärkeimmät suorittajan tuotetiedot
Uuden Tuotteet-sarakkeen [Taulukko]-arvoilla luot uuden mukautetun sarakkeen siirtymällä valintanauhan Lisää sarake -välilehteen ja valitsemalla Mukautettu sarake Yleiset-ryhmästä.
Anna uudelle sarakkeelle nimi Top performer product. Kirjoita kaava Table.Max([Products], "Units" )
Mukautettu sarakekaava -kohtaan.
Tämän kaavan tulos luo uuden sarakkeen, jossa on [Record]-arvot. Nämä tietuearvot ovat pohjimmiltaan taulukko, jossa on vain yksi rivi. Nämä tietueet sisältävät rivin, jossa on yksikkösarakkeen enimmäisarvo kullekin [Taulukko]-arvolle Products-sarakkeessa.
Tämän uuden Top performer -tuotesarakkeen, joka sisältää [Tietue]-arvot, voit valita laajennuskuvakkeen, valita Tuote- ja Yksiköt-kentät ja valita sitten OK.
Kun olet poistanut Tuotteet-sarakkeen ja määrittänyt tietotyypin kummallekin juuri laajennetulle sarakkeelle, tulos näyttää samalta kuin seuraavassa kuvassa.
Sumea ryhmittely
Muistiinpano
Seuraava ominaisuus on käytettävissä vain Power Query Onlinessa.
Seuraavassa kuvassa näkyvä esimerkkitaulukko havainnollistaa, miten voit tehdä "sumean ryhmittelyn".
Sumean ryhmittelyn tavoitteena on tehdä ryhmittelyperuste-toiminto, joka käyttää tekstimerkkijonojen likimääräistä vastaavuusalgoritmia. Power Query käyttää Jaccard-samankaltaisuusalgoritmia esiintymäparien samankaltaisuuden mittaamiseen. Sitten se käyttää taajamallista hierarkkista klusterointia esiintymien ryhmittelemiseen yhteen. Seuraavassa kuvassa näet odotetun tuloksen, jossa taulukko ryhmitetään Henkilö-sarakkeen mukaan.
Jos haluat tehdä sumean ryhmittelyn, suorita samat vaiheet, jotka kuvattiin aiemmin tässä artikkelissa. Ainoa ero on, että tällä kertaa Valitse Ryhmittelyperuste-valintaikkunassa Käytä sumea ryhmittely -valintaruutu.
Power Query valitsee jokaiselle riviryhmälle yleisimmän esiintymän kanoniseksi esiintymäksi. Jos useita esiintymiä esiintyy samalla tiheydellä, Power Query valitsee ensimmäisen. Kun olet valinnut OK Ryhmittelyperuste-valintaikkunassa, saat odottamasi tuloksen.
Voit kuitenkin hallita sumeaa ryhmittelytoimintoa paremmin laajentamalla Sumea ryhmä -vaihtoehtoja.
Sumean ryhmittelyn käytettävissä ovat seuraavat vaihtoehdot:
- Samankaltaisuuden raja-arvo (valinnainen): Tämä asetus ilmaisee, miten samanlaiset kaksi arvoa on ryhmiteltävä yhteen. Minimiasetus nolla (0) aiheuttaa sen, että kaikki arvot ryhmitellaan yhteen. Suurin asetus 1 sallii vain tarkalleen vastaavat arvot ryhmitellä yhteen. Oletusarvo on 0,8.
- Ohita kirjainkoko: Kun tekstimerkkijonoja verrataan, kirjainkoko ohitetaan. Tämä asetus on oletusarvoisesti käytössä.
- Ryhmittele yhdistämällä tekstiosat: Algoritmi yrittää yhdistää tekstiosat (esimerkiksi yhdistämällä Microsoftin ja pehmeästi) arvot ryhmittelemiseksi.
- Näytä samankaltaisuuspisteet: Näytä samankaltaisuuspisteet syötearvojen ja laskettujen edustavien arvojen välillä sumean ryhmittelyn jälkeen. Edellyttää kaikkien rivien ja kaikkien rivien kaltaisten toiminnon lisäämistä, jotta nämä tiedot voidaan esitellä rivi riviltä -tasolla.
- Muunnostaulukko (valinnainen): Voit valita muunnostaulukon, joka yhdistää arvot (kuten MSFT:n Microsoftiin) ja ryhmitellä ne yhteen.
Tässä esimerkissä käytetään muunnostaulukkoa osoittamaan, miten arvoja voidaan yhdistää. Muunnostaulukossa on kaksi saraketta:
- Lähde: Taulukossa etsittävä tekstimerkkijono.
- To: Tekstimerkkijono, jota käytetään korvaamaan tekstimerkkijono Kohteesta-sarakkeessa.
Seuraavassa kuvassa näytetään tässä esimerkissä käytetty muunnostaulukko.
Tärkeä
On tärkeää, että muunnostaulukossa on samat sarakkeiden ja sarakkeiden nimet kuin edellisessä kuvassa (niille on merkittävä nimet "From" ja "To"). Muussa tapauksessa Power Query ei tunnista taulukkoa muunnostaulukoksi.
Palaa Ryhmittelyperuste-valintaikkunaan, laajenna Sumea ryhmä -asetuksia, muuta toiminto Laske rivit -asetukseksi Kaikki rivit, ota käyttöön Näytä samankaltaisuuspisteet -vaihtoehto ja valitse sitten avattava Muunna-taulukon valikko.
Kun olet valinnut muunnostaulukon, valitse OK. Toiminnon tulos antaa seuraavat tiedot:
Tässä esimerkissä Ohita tapaus -asetus on käytössä, joten muunnostaulukon Lähde-sarakkeen arvoja käytetään merkkijonon etsimiseen ottamatta huomioon merkkijonon tapausta. Tämä muunnostoiminto suoritetaan ensin, ja sitten suoritetaan sumea ryhmittelytoiminto.
Samankaltaisuuspisteet näytetään myös henkilö-sarakkeen vieressä olevassa taulukon arvossa, mikä kuvastaa tarkalleen sitä, miten arvot ryhmiteltiin ja miten ne vastaavat samankaltaisuuspisteitä. Voit tarvittaessa laajentaa tämän sarakkeen tai käyttää uuden Frequency-sarakkeiden arvoja muunnoksiin.
Muistiinpano
Kun ryhmittelyä tehdään useiden sarakkeiden mukaan, muunnostaulukko suorittaa korvaustoiminnon kaikissa sarakkeissa, jos arvon korvaaminen kasvattaa samankaltaisuuspistemäärää.
Lisätietoja muunnostaulukoiden toiminnasta saat muunnostaulukon ennakkoluvat-kohdasta.
Katso myös
Mukautetun sarakkeen lisääminen
Kaksoiskappaleiden poistaminen