Číst v angličtině

Sdílet prostřednictvím


Kombinování souborů CSV

V Power Query můžete zkombinovat více souborů z daného zdroje dat. Tento článek popisuje, jak funguje prostředí, když soubory, které chcete zkombinovat, jsou soubory CSV. Další informace: Přehled kombinování souborů

Tip

S tímto příkladem můžete postupovat stažením ukázkových souborů použitých v tomto článku z tohoto odkazu ke stažení. Tyto soubory můžete umístit do zvoleného zdroje dat, jako je místní složka, složka SharePointu, úložiště objektů blob Azure, Azure Data Lake Storage nebo jiný zdroj dat, který poskytuje zobrazení systému souborů.

Pro zjednodušení používá příklad v tomto článku konektor složky. Další informace: Složka

Informace o použitých ukázkových souborech

Ke kombinování souborů je nezbytné, aby všechny měly stejnou strukturu a stejnou příponu. Všechny soubory použité v tomto příkladu mají stejnou strukturu a příponu (.csv).

Existuje 12 souborů CSV, jeden pro každý měsíc kalendářního roku 2019. Následující obrázek ukazuje prvních 15 řádků souboru za měsíc leden.

Ukázkový soubor CSV pro leden 2019 zobrazující oddíl záhlaví a zbytek dat oddělený čárkami.

Počet řádků se liší od souboru po soubor, ale všechny soubory mají v prvních čtyřech řádcích oddíl záhlaví. V pátém řádku mají záhlaví sloupců a data tabulky začínají v šestém řádku a procházejí všemi následujícími řádky.

Cílem je zkombinovat všechny 12 souborů do jedné tabulky. Tato kombinovaná tabulka obsahuje řádek záhlaví v horní části tabulky a obsahuje zdrojový název, datum, zemi, jednotky a údaje o výnosech za celý rok v samostatných sloupcích za řádkem záhlaví.

Ukázková konečná kombinovaná tabulka

Náhled tabulky

Při připojování ke složce, která je hostitelem souborů, které chcete zkombinovat – v tomto příkladu je název této složky Soubory CSV – zobrazí se dialogové okno náhledu tabulky, ve kterém se zobrazí cesta ke složce v levém horním rohu. Náhled dat zobrazuje zobrazení systému souborů.

Náhled tabulky pro zobrazení systému souborů

V tomto příkladu vyberte Kombinovat.

Poznámka

V jiné situaci můžete před kombinováním souborů vybrat možnost Transformovat data a data dále filtrovat a transformovat. Výběr možnosti Kombinovat se doporučuje jenom v případech, kdy jste si jisti, že složka obsahuje jenom soubory, které chcete zkombinovat.

Dialogové okno Kombinovat soubory

Po výběru možnosti Zkombinovat v náhledu tabulky se zobrazí dialogové okno Kombinovat soubory .

Dialogové okno Kombinovat soubory

Poznámka

Power Query automaticky zjistí, jaký konektor se má použít, na základě prvního souboru nalezeného v seznamu. Další informace o konektoru CSV najdete v části Text/CSV.

V tomto příkladu ponechte všechna výchozí nastavení (příklad souboru je nastavený na První soubor a výchozí hodnoty pro zjišťování původu souboru, oddělovače a datového typu).

Teď v pravém dolním rohu vyberte Transformovat data , abyste přešli na výstupní dotaz.

Výstupní dotaz

Po výběru možnosti Transformovat data v dialogovém okně Kombinovat soubory se vrátíte do Editor Power Query v dotazu, který jste původně vytvořili z připojení k místní složce. Výstupní dotaz teď obsahuje název zdrojového souboru v levém sloupci spolu s daty ze všech zdrojových souborů ve zbývajících sloupcích.

Výstupní dotaz pro kombinované soubory bez dalších transformací

Data ale nejsou ve správném tvaru. Před kombinováním těchto řádků je potřeba z každého souboru odebrat horní čtyři řádky. Pokud chcete tuto změnu provést v každém souboru před jejich kombinováním, vyberte v podokně Dotazy na levé straně obrazovky dotaz Transformovat ukázkový soubor.

Úprava dotazu ukázkového souboru transformace

V tomto dotazu ukázkového souboru transformace hodnoty ve sloupci Date označují, že data jsou pro měsíc duben, který má formát RRRR-MM-DD (year-month-day). Duben 2019.csv je první soubor, který se zobrazí v náhledu tabulky.

Tabulka zobrazující sloupce dat z dubna 2019, včetně oddílu záhlaví v prvních čtyřech řádcích a nadpisů v pátém řádku

Teď potřebujete k vyčištění dat použít novou sadu transformací. Každá transformace se automaticky převede na funkci ve skupině pomocných dotazů, která se použije pro každý soubor ve složce, a teprve potom zkombinuje data z každého souboru.

Transformace, které je potřeba přidat do dotazu ukázkového souboru transformace, jsou:

  1. Odebrat horní řádky: Chcete-li provést tuto operaci, vyberte nabídku ikon tabulky v levém horním rohu tabulky a pak vyberte Odebrat horní řádky.

    Odeberte horní řádky v nabídce tabulky.

    V dialogovém okně Odebrat horní řádky zadejte 4 a pak vyberte OK.

    Dialogové okno Odebrat horní řádky

    Po výběru možnosti OK už tabulka nebude obsahovat horní čtyři řádky.

    Ukázkový dotaz s odebranými řádky

  2. Použijte první řádek jako záhlaví: Znovu vyberte ikonu tabulky a pak vyberte Použít první řádek jako záhlaví.

    Použijte první řádek jako ikonu záhlaví.

    Výsledkem této operace bude zvýšení úrovně prvního řádku tabulky na nová záhlaví sloupců.

    Ukázková záhlaví upřednostněná tabulka

Po dokončení této operace se Power Query ve výchozím nastavení pokusí automaticky rozpoznat datové typy sloupců a přidat nový krok Změněný typ sloupce.

Revize výstupního dotazu

Když se vrátíte k dotazu Soubory CSV, všimnete si, že poslední krok zobrazuje chybu, která přečte sloupec Sloupec1 tabulky, který se nenašel. Důvodem této chyby je, že předchozí stav dotazu prováděl operaci se sloupcem s názvem Column1. Tento sloupec už ale kvůli změnám provedeným v dotazu ukázkového souboru transformace neexistuje. Další informace: Práce s chybami v Power Query

Výstupní dotaz s chybou na úrovni kroku

Tento poslední krok dotazu můžete odebrat z podokna Použitý postup tak, že na levé straně názvu kroku vyberete ikonu odstranění X. Po odstranění tohoto kroku se v dotazu zobrazí správné výsledky.

Zkombinujte soubory bez kroku chyby.

Všimněte si však, že žádný ze sloupců odvozených ze souborů (Date, Country, Units, Revenue) nemá přiřazený konkrétní datový typ. Pomocí následující tabulky přiřaďte ke každému sloupci správný datový typ.

Název sloupce Datový typ
Datum Datum
Země Text
Jednotky Celé číslo
Výnosy Měna

Po definování datových typů pro každý sloupec budete připraveni načíst tabulku.

Ukázková konečná kombinovaná tabulka

Poznámka

Pokud chcete zjistit, jak definovat nebo změnit datové typy sloupců, přejděte na Datové typy.

Ověření

Pokud chcete ověřit, že byly všechny soubory sloučené, můžete vybrat ikonu filtru v záhlaví sloupce Source.Name , která zobrazí všechny názvy zkombinovaných souborů. Pokud se zobrazí upozornění "Seznam může být neúplný", vyberte Načíst více v dolní části nabídky a zobrazte ve sloupci více dostupných hodnot.

Neúplný seznam sloučených souborů

Po výběru Možnosti Načíst další se zobrazí všechny dostupné názvy souborů.

Úplný seznam sloučených souborů