Kombinovanie súborov CSV
V power query môžete kombinovať viacero súborov z daného zdroja údajov. Tento článok popisuje, ako prostredie funguje, keď súbory, ktoré chcete kombinovať, sú CSV súbory. Ďalšie informácie: Prehľad kombinovania súborov
Prepitné
Postupujte podľa tohto príkladu a stiahnite si vzorové súbory použité v tomto článku z tohto prepojenia na stiahnutie. Tieto súbory môžete umiestniť do zdroja údajov podľa svojho výberu, ako je napríklad lokálny priečinok, priečinok SharePoint, ukladací priestor objektu BLOB platformy Azure, Azure Data Lake Storage alebo iný zdroj údajov, ktorý poskytuje zobrazenie systému súborov.
Pre jednoduchosť používa príklad v tomto článku konektor priečinka. Ďalšie informácie: Priečinok
Informácie o použitých vzorovými súboroch
Pri kombinovaní súborov je nevyhnutné, aby mali všetky rovnakú štruktúru a rovnaké rozšírenie. Všetky súbory použité v tomto príklade majú rovnakú štruktúru a rozšírenie (.csv).
K dispozícii je 12 súborov CSV, jeden pre každý mesiac kalendárneho roka 2019. Nasledujúci obrázok zobrazuje prvých 15 riadkov súboru za mesiac január.
Počet riadkov sa líši od súboru k súboru, ale všetky súbory majú v prvých štyroch riadkoch časť hlavičky. V piatom riadku majú hlavičky stĺpcov a údaje pre tabuľku sa začínajú v šiestom riadku a pokračujú vo všetkých nasledujúcich riadkoch.
Cieľom je skombinovať všetkých 12 súborov do jednej tabuľky. Táto kombinovaná tabuľka obsahuje riadok hlavičky v hornej časti tabuľky a obsahuje názov zdroja, dátum, krajinu, jednotky a údaje o výnosoch za celý rok v samostatných stĺpcoch za riadkom hlavičky.
Ukážka tabuľky
Pri pripájaní k priečinku, ktorý hosťuje súbory, ktoré chcete kombinovať, je v tomto príklade názvom tohto priečinka súbory CSV – zobrazí sa dialógové okno ukážky tabuľky, v ktorom sa zobrazí cesta k priečinku v ľavom hornom rohu. Ukážka údajov zobrazuje zobrazenie systému súborov.
V tomto príklade vyberte položku Kombinovať.
Poznámka
V inej situácii môžete vybrať možnosť Transformovať údaje na ďalšie filtrovanie a transformáciu údajov pred ich kombinovaním. Výber položky Kombinovať sa odporúča iba vtedy, ak si ste istí, že priečinok obsahuje iba súbory, ktoré chcete kombinovať.
Dialógové okno Skombinovať súbory
Po výbere možnosti Kombinovať v ukážke tabuľky sa zobrazí dialógové okno Skombinovať súbory .
Poznámka
Power Query automaticky zistí, aký konektor použiť na základe prvého súboru, ktorý sa nachádza v zozname. Ďalšie informácie o konektore CSV nájdete v téme Text/CSV.
V tomto príklade ponechajte všetky predvolené nastavenia (ukážkový súbor nastavený na hodnotu Prvý súbor a predvolené hodnoty pre položky Pôvod súboru, Oddeľovač a Zisťovanie typu údajov).
Teraz vyberte položku Transformovať údaje v pravom dolnom rohu, čím prejdete na výstupný dotaz.
Výstupný dotaz
Po výbere položky Transformovať údaje v dialógovom okne Skombinovať súbory sa vrátite späť do Editor Power Query v dotaze, ktorý ste pôvodne vytvorili z pripojenia k lokálnemu priečinku. Výstupný dotaz teraz obsahuje názov zdrojového súboru v stĺpci úplne vľavo spolu s údajmi z jednotlivých zdrojových súborov v zostávajúcich stĺpcoch.
Údaje však nie sú v správnom tvare. Pred ich kombináciou je potrebné z každého súboru odstrániť prvé štyri riadky. Ak chcete túto zmenu vykonať v každom súbore predtým, ako ich skombinujete, vyberte dotaz Transformovať vzorový súbor v table Dotazy na ľavej strane obrazovky.
Úprava dotazu transformovať vzorový súbor
V tomto dotaze Transformovať vzorový súbor hodnoty v stĺpci Date (Dátum ) označujú, že dané údaje sú pre mesiac apríl, ktorý má formát rok-mesiac-deň (RRRR-MM-DD). Apríl 2019.csv je prvý súbor, ktorý sa zobrazí v ukážke tabuľky.
Teraz je potrebné použiť novú množinu transformácií na vyčistenie údajov. Každá transformácia sa automaticky skonvertuje na funkciu v skupine dotazov Helper, ktorá sa použije na každý súbor v priečinku pred kombinovaním údajov z každého súboru.
Transformácie, ktoré je potrebné pridať do dotazu Transformovať vzorový súbor , sú:
Odstrániť horné riadky: Ak chcete vykonať túto operáciu, vyberte ponuku ikony tabuľky v ľavom hornom rohu tabuľky a potom vyberte položku Odstrániť najvrchnejšie riadky.
V dialógovom okne Odstrániť najvrchnejšie riadky zadajte číslo 4 a potom vyberte položku OK.
Po výbere tlačidla OK sa v tabuľke už nebudú nachádzať prvé štyri riadky.
Použiť prvý riadok ako hlavičky: Znova vyberte ikonu tabuľky a potom vyberte položku Použiť prvý riadok ako hlavičky.
Výsledkom tejto operácie sa zvýši úroveň prvého riadka tabuľky na nové hlavičky stĺpcov.
Po dokončení tejto operácie sa power query predvolene pokúsi automaticky zistiť typy údajov stĺpcov a pridať nový krok Zmenený typ stĺpca.
Revízia výstupného dotazu
Keď sa vrátite k dotazu CSV Files , všimnete si, že v poslednom kroku sa vyskytla chyba s textom Stĺpec Stĺpec1 tabuľky, ktorý sa nenašiel. Dôvodom tejto chyby je, že predchádzajúci stav dotazu bol pri operácii voči stĺpcu s názvom Column1. Z dôvodu zmien vykonaných v dotaze Transformovať vzorový súbor však tento stĺpec už neexistuje. Ďalšie informácie: Spracovanie chýb v doplnku Power Query
Tento posledný krok dotazu môžete odstrániť z tably Použité kroky tak, že vyberiete ikonu odstránenia X na ľavej strane názvu kroku. Po odstránení tohto kroku zobrazí váš dotaz správne výsledky.
Všimnite si však, že žiadny zo stĺpcov odvodených zo súborov (Date, Country, Units, Revenue) nemá priradený konkrétny typ údajov. Priraďte správny typ údajov ku každému stĺpcu pomocou nasledujúcej tabuľky.
Názov stĺpca | Typ údajov |
---|---|
Date (Dátum) | Date (Dátum) |
Krajina | Text |
Lekcie | Celé číslo |
Výnos | Mena |
Po definovaní typov údajov pre každý stĺpec budete pripravení na načítanie tabuľky.
Poznámka
Ak chcete zistiť, ako definovať alebo zmeniť typy údajov v stĺpcoch, prejdite do časti Typy údajov.
Overenie
Ak chcete overiť, či sa všetky súbory skombinovali, môžete vybrať ikonu filtra v hlavičke stĺpca Source.Name , kde sa zobrazia všetky názvy súborov, ktoré boli skombinované. Ak sa zobrazí upozornenie "Zoznam môže byť neúplný", výberom položky Načítať viac v dolnej časti ponuky zobrazíte v stĺpci viac dostupných hodnôt.
Po výbere tlačidla Načítať viac sa zobrazia všetky dostupné názvy súborov.