Čítať v angličtine

Zdieľať cez


Kombinovanie súborov CSV

V power query môžete kombinovať viacero súborov z daného zdroja údajov. Tento článok popisuje, ako prostredie funguje, keď súbory, ktoré chcete kombinovať, sú CSV súbory. Ďalšie informácie: Prehľad kombinovania súborov

Tip

Postupujte podľa tohto príkladu a stiahnite si vzorové súbory použité v tomto článku z tohto prepojenia na stiahnutie. Tieto súbory môžete umiestniť do zdroja údajov podľa svojho výberu, ako je napríklad lokálny priečinok, priečinok SharePoint, ukladací priestor objektu BLOB platformy Azure, Azure Data Lake Storage alebo iný zdroj údajov, ktorý poskytuje zobrazenie systému súborov.

Pre jednoduchosť používa príklad v tomto článku konektor priečinka. Ďalšie informácie: Priečinok

Informácie o použitých vzorovými súboroch

Pri kombinovaní súborov je nevyhnutné, aby mali všetky rovnakú štruktúru a rovnaké rozšírenie. Všetky súbory použité v tomto príklade majú rovnakú štruktúru a rozšírenie (.csv).

K dispozícii je 12 súborov CSV, jeden pre každý mesiac kalendárneho roka 2019. Nasledujúci obrázok zobrazuje prvých 15 riadkov súboru za mesiac január.

Vzorový súbor CSV z januára 2019 zobrazujúci časť hlavičky a ostatné údaje oddelené čiarkami.

Počet riadkov sa líši od súboru k súboru, ale všetky súbory majú v prvých štyroch riadkoch časť hlavičky. V piatom riadku majú hlavičky stĺpcov a údaje pre tabuľku sa začínajú v šiestom riadku a pokračujú vo všetkých nasledujúcich riadkoch.

Cieľom je skombinovať všetkých 12 súborov do jednej tabuľky. Táto kombinovaná tabuľka obsahuje riadok hlavičky v hornej časti tabuľky a obsahuje názov zdroja, dátum, krajinu, jednotky a údaje o výnosoch za celý rok v samostatných stĺpcoch za riadkom hlavičky.

Ukážka konečnej spojenej tabuľky.

Ukážka tabuľky

Pri pripájaní k priečinku, ktorý hosťuje súbory, ktoré chcete kombinovať, je v tomto príklade názvom tohto priečinka súbory CSV – zobrazí sa dialógové okno ukážky tabuľky, v ktorom sa zobrazí cesta k priečinku v ľavom hornom rohu. Ukážka údajov zobrazuje zobrazenie systému súborov.

Ukážka tabuľky pre zobrazenie systému súborov.

V tomto príklade vyberte položku Kombinovať.

Poznámka

V inej situácii môžete vybrať možnosť Transformovať údaje na ďalšie filtrovanie a transformáciu údajov pred ich kombinovaním. Výber položky Kombinovať sa odporúča iba vtedy, ak si ste istí, že priečinok obsahuje iba súbory, ktoré chcete kombinovať.

Dialógové okno Skombinovať súbory

Po výbere možnosti Kombinovať v ukážke tabuľky sa zobrazí dialógové okno Skombinovať súbory .

Dialógové okno Skombinovať súbory.

Poznámka

Power Query automaticky zistí, aký konektor použiť na základe prvého súboru, ktorý sa nachádza v zozname. Ďalšie informácie o konektore CSV nájdete v téme Text/CSV.

V tomto príklade ponechajte všetky predvolené nastavenia (ukážkový súbor nastavený na hodnotu Prvý súbor a predvolené hodnoty pre položky Pôvod súboru, Oddeľovač a Zisťovanie typu údajov).

Teraz vyberte položku Transformovať údaje v pravom dolnom rohu, čím prejdete na výstupný dotaz.

Výstupný dotaz

Po výbere položky Transformovať údaje v dialógovom okne Skombinovať súbory sa vrátite späť do Editor Power Query v dotaze, ktorý ste pôvodne vytvorili z pripojenia k lokálnemu priečinku. Výstupný dotaz teraz obsahuje názov zdrojového súboru v stĺpci úplne vľavo spolu s údajmi z jednotlivých zdrojových súborov v zostávajúcich stĺpcoch.

Výstupný dotaz na kombinované súbory bez ďalších transformácií.

Údaje však nie sú v správnom tvare. Pred ich kombináciou je potrebné z každého súboru odstrániť prvé štyri riadky. Ak chcete túto zmenu vykonať v každom súbore predtým, ako ich skombinujete, vyberte dotaz Transformovať vzorový súbor v table Dotazy na ľavej strane obrazovky.

Úprava dotazu transformovať vzorový súbor

V tomto dotaze Transformovať vzorový súbor hodnoty v stĺpci Date (Dátum ) označujú, že dané údaje sú pre mesiac apríl, ktorý má formát rok-mesiac-deň (RRRR-MM-DD). Apríl 2019.csv je prvý súbor, ktorý sa zobrazí v ukážke tabuľky.

Tabuľka zobrazujúca stĺpce s údajmi z apríla 2019 vrátane sekcie hlavičky v prvých štyroch riadkoch a nadpisov v piatom riadku.

Teraz je potrebné použiť novú množinu transformácií na vyčistenie údajov. Každá transformácia sa automaticky skonvertuje na funkciu v skupine dotazov Helper, ktorá sa použije na každý súbor v priečinku pred kombinovaním údajov z každého súboru.

Transformácie, ktoré je potrebné pridať do dotazu Transformovať vzorový súbor , sú:

  1. Odstrániť horné riadky: Ak chcete vykonať túto operáciu, vyberte ponuku ikony tabuľky v ľavom hornom rohu tabuľky a potom vyberte položku Odstrániť najvrchnejšie riadky.

    Odstráňte horné riadky v ponuke tabuľky.

    V dialógovom okne Odstrániť najvrchnejšie riadky zadajte číslo 4 a potom vyberte položku OK.

    Dialógové okno Odstrániť najvrchnejšie riadky.

    Po výbere tlačidla OK sa v tabuľke už nebudú nachádzať prvé štyri riadky.

    Vzorový dotaz s odstránenými riadkami.

  2. Použiť prvý riadok ako hlavičky: Znova vyberte ikonu tabuľky a potom vyberte položku Použiť prvý riadok ako hlavičky.

    Použite prvý riadok ako ikonu hlavičiek.

    Výsledkom tejto operácie sa zvýši úroveň prvého riadka tabuľky na nové hlavičky stĺpcov.

    Hlavičky so propagovanými tabuľkami ukážky.

Po dokončení tejto operácie sa power query predvolene pokúsi automaticky zistiť typy údajov stĺpcov a pridať nový krok Zmenený typ stĺpca.

Revízia výstupného dotazu

Keď sa vrátite k dotazu CSV Files , všimnete si, že v poslednom kroku sa vyskytla chyba s textom Stĺpec Stĺpec1 tabuľky, ktorý sa nenašiel. Dôvodom tejto chyby je, že predchádzajúci stav dotazu bol pri operácii voči stĺpcu s názvom Column1. Z dôvodu zmien vykonaných v dotaze Transformovať vzorový súbor však tento stĺpec už neexistuje. Ďalšie informácie: Spracovanie chýb v doplnku Power Query

Výstupný dotaz s chybou na úrovni kroku.

Tento posledný krok dotazu môžete odstrániť z tably Použité kroky tak, že vyberiete ikonu odstránenia X na ľavej strane názvu kroku. Po odstránení tohto kroku zobrazí váš dotaz správne výsledky.

Kombinovanie súborov bez kroku chyby.

Všimnite si však, že žiadny zo stĺpcov odvodených zo súborov (Date, Country, Units, Revenue) nemá priradený konkrétny typ údajov. Priraďte správny typ údajov ku každému stĺpcu pomocou nasledujúcej tabuľky.

Názov stĺpca Typ údajov
Date (Dátum) Date (Dátum)
Krajina Text
Lekcie Celé číslo
Výnos Mena

Po definovaní typov údajov pre každý stĺpec budete pripravení na načítanie tabuľky.

Ukážka konečnej spojenej tabuľky.

Poznámka

Ak chcete zistiť, ako definovať alebo zmeniť typy údajov v stĺpcoch, prejdite do časti Typy údajov.

Overenie

Ak chcete overiť, či sa všetky súbory skombinovali, môžete vybrať ikonu filtra v hlavičke stĺpca Source.Name , kde sa zobrazia všetky názvy súborov, ktoré boli skombinované. Ak sa zobrazí upozornenie "Zoznam môže byť neúplný", výberom položky Načítať viac v dolnej časti ponuky zobrazíte v stĺpci viac dostupných hodnôt.

Neúplný zoznam súborov, ktoré boli skombinované.

Po výbere tlačidla Načítať viac sa zobrazia všetky dostupné názvy súborov.

Úplný zoznam súborov, ktoré boli skombinované.