CSV-tiedostojen yhdistäminen
Power Queryssa voit yhdistää useita tiedostoja tietystä tietolähteestä. Tässä artikkelissa kuvataan, miten käyttökokemus toimii, kun yhdistettävät tiedostot ovat CSV-tiedostoja. Lisätietoja: Tiedostojen yhdistämisen yleiskatsaus
Vihje
Voit seurata tätä esimerkkiä lataamalla tässä artikkelissa käytetyt mallitiedostot tästä latauslinkistä. Voit sijoittaa kyseiset tiedostot valitsemaasi tietolähteeseen, kuten paikalliseen kansioon, SharePoint-kansioon, Azure Blob -säilöön, Azure Data Lake Tallennus tai muuhun tietolähteeseen, joka tarjoaa tiedostojärjestelmänäkymän.
Selvyyden vuoksi tämän artikkelin esimerkissä käytetään Kansio-liitintä. Lisätietoja: Kansio
Tiedostojen yhdistämiseksi on tärkeää, että kaikilla on sama rakenne ja sama tunniste. Kaikilla tässä esimerkissä käytetyillä tiedostoilla on sama rakenne ja tunniste (.csv).
CSV-tiedostoja on 12, yksi kalenterivuoden 2019 kullekin kuukaudelle. Seuraavassa kuvassa näkyvät tiedoston 15 ensimmäistä riviä tammikuulle.
Rivien määrä vaihtelee tiedostosta tiedostoon, mutta kaikilla tiedostoilla on otsikko-osa neljällä ensimmäisellä rivillä. Niiden viidennellä rivillä on sarakeotsikot, ja taulukon tiedot alkavat kuudennelta rivilta ja jatkuvat kaikkien myöhempien rivien läpi.
Tavoitteena on yhdistää kaikki 12 tiedostoa yhdeksi taulukoksi. Tämä yhdistetty taulukko sisältää taulukon yläosassa olevan otsikkorivin, ja se sisältää koko vuoden lähdenimen, päivämäärän, maan, yksiköt ja tuoton tiedot erillisissä sarakkeissa otsikkorivin jälkeen.
Kun muodostat yhteyden kansioon, joka isännöi yhdistettävien tiedostojen isäntäkansiota – tässä esimerkissä kyseisen kansion nimi on CSV-tiedostot – näkyviin tulee taulukon esikatselun valintaikkuna, jossa kansiopolku näkyy vasemmassa yläkulmassa. Tietojen esikatselu näyttää tiedostojärjestelmänäkymän.
Valitse tässä esimerkissä Yhdistä.
Huomautus
Erilaisessa tilanteessa voit valita Muunna tiedot , jos haluat suodattaa ja muuntaa tietoja lisää ennen tiedostojen yhdistämistä. Yhdistä-vaihtoehdon valitsemista suositellaan vain, jos olet varma, että kansio sisältää vain tiedostot, jotka haluat yhdistää.
Kun valitset taulukon esikatselussa Yhdistä tiedostot, näyttöön tulee Yhdistä tiedostot -valintaikkuna.
Huomautus
Power Query tunnistaa automaattisesti, mitä liitintä käytetään luettelosta löytyneen ensimmäisen tiedoston perusteella. Saat lisätietoja CSV-liittimestä ohjeartikkelista Teksti/CSV.
Jätä tässä esimerkissä kaikki oletusasetukset (esimerkkitiedoston arvoksi on asetettu Ensimmäinen tiedosto ja oletusarvot tiedostolle alkuperä, erotin ja tietotyypin tunnistaminen).
Valitse nyt oikeasta alakulmasta Muunna tiedot ja siirry tulostekyselyun.
Kun olet valinnut Yhdistä tiedostot -valintaikkunassa Muunna tiedot, palaat takaisin Power Query -editori kyselyssä, jonka loit aluksi yhteydestä paikalliseen kansioon. Tulostekysely sisältää nyt lähdetiedoston nimen vasemmanpuoleisimmassa sarakkeessa sekä kunkin lähdetiedoston tiedot jäljellä olevissa sarakkeissa.
Tiedot eivät kuitenkaan ole oikeassa muodossa. Sinun on poistettava neljä ylintä riviä kustakin tiedostosta ennen niiden yhdistämistä. Jos haluat tehdä tämän muutoksen kuhunkin tiedostoon ennen niiden yhdistämistä, valitse Muunna mallitiedosto -kysely näyttösi vasemmassa reunassa olevassa Kyselyt-ruudussa .
Tässä Muunna mallitiedosto -kyselyssä Päivämäärä-sarakkeen arvot ilmaisevat, että tiedot koskevat huhtikuuta, jossa on vuoden kuukausipäivä (VVVV-KK-PP) -muoto. 2019.csv. huhtikuuta on ensimmäinen tiedosto, joka näytetään taulukon esikatselussa.
Sinun on nyt otettava käyttöön uusi muunnosjoukko tietojen siistimiseksi. Kukin muunnos muunnetaan automaattisesti Helper Queries -ryhmän sisäiseksi funktioksi, jota käytetään kansion jokaisessa tiedostossa ennen kunkin tiedoston tietojen yhdistämistä.
Muunna mallitiedosto -kyselyyn lisättävät muunnokset ovat seuraavat:
Poista ylimmät rivit: Jos haluat suorittaa tämän toiminnon, valitse taulukon vasemmasta yläkulmasta taulukkokuvakevalikko ja valitse sitten Poista ylimmät rivit.
Kirjoita Poista ylimmät rivit -valintaikkunaan 4 ja valitse sitten OK.
Kun olet valinnut OK, taulukossa ei ole enää neljä ylintä riviä.
Käytä ensimmäistä riviä otsikoina: Valitse taulukkokuvake uudelleen ja valitse sitten Käytä ensimmäistä riviä otsikkoina.
Toiminnon tulos korottaa taulukon ensimmäisen rivin uusiksi sarakeotsikoksi.
Kun tämä toiminto on suoritettu, Power Query yrittää oletusarvoisesti tunnistaa sarakkeiden tietotyypit automaattisesti ja lisätä uuden Changed-saraketyypin vaiheen.
Kun siirryt takaisin CSV-tiedostojen kyselyyn, huomaat, että viimeinen vaihe antaa sinulle virheen, jossa lukee "Taulukon Sarake1-saraketta ei löytynyt". Tämä virhe johtuu siitä, että kyselyn edellinen tila teki toiminnon Column1-nimistä saraketta vasten. Muunna mallitiedostoa -kyselyyn tehtyjen muutosten vuoksi tätä saraketta ei enää ole. Lisätietoja: Virheiden käsittely Power Queryssa
Voit poistaa tämän kyselyn viimeisen vaiheen Käytössä olevat vaiheet -ruudusta valitsemalla X-poistokuvakkeen vaiheen nimen vasemmalla puolella. Kun olet poistanut tämän vaiheen, kyselysi näyttää oikeat tulokset.
Huomaa kuitenkin, että millään tiedostosta johdetulla sarakkeella (Päivämäärä, Maa, Yksiköt, Tuotto) ei ole määritetty tiettyä tietotyyppiä. Määritä kullekin sarakkeelle oikea tietotyyppi seuraavan taulukon avulla.
Sarakkeen nimi | Tietotyyppi |
---|---|
Pvm | Pvm |
Maa | Teksti |
Yksiköt | Kokonaisluku |
Tuotto | Valuutta |
Kun olet määrittänut kunkin sarakkeen tietotyypit, olet valmis lataamaan taulukon.
Huomautus
Jos haluat oppia määrittämään tai muuttamaan sarakkeiden tietotyyppejä, siirry kohtaan Tietotyypit.
Voit vahvistaa kaikkien tiedostojen yhdistämisen valitsemalla suodatinkuvakkeen Source.Name sarakeotsikossa, joka näyttää kaikki yhdistettyjen tiedostojen nimet. Jos näyttöön tulee varoitus "Luettelo saattaa olla kesken", valitse Lataa lisää valikon alareunasta, jotta näet enemmän käytettävissä olevia arvoja sarakkeessa.
Kun olet valinnut Lataa lisää, kaikki käytettävissä olevat tiedostonimet näytetään.