Kombinování souborů CSV
V Power Query můžete zkombinovat více souborů z daného zdroje dat. Tento článek popisuje, jak funguje prostředí, když soubory, které chcete zkombinovat, jsou soubory CSV. Další informace: Přehled kombinování souborů
Tip
S tímto příkladem můžete postupovat stažením ukázkových souborů použitých v tomto článku z tohoto odkazu ke stažení. Tyto soubory můžete umístit do zvoleného zdroje dat, jako je místní složka, složka SharePointu, úložiště objektů blob Azure, Azure Data Lake Storage nebo jiný zdroj dat, který poskytuje zobrazení systému souborů.
Pro zjednodušení používá příklad v tomto článku konektor složky. Další informace: Složka
Ke kombinování souborů je nezbytné, aby všechny měly stejnou strukturu a stejnou příponu. Všechny soubory použité v tomto příkladu mají stejnou strukturu a příponu (.csv).
Existuje 12 souborů CSV, jeden pro každý měsíc kalendářního roku 2019. Následující obrázek ukazuje prvních 15 řádků souboru za měsíc leden.
Počet řádků se liší od souboru po soubor, ale všechny soubory mají v prvních čtyřech řádcích oddíl záhlaví. V pátém řádku mají záhlaví sloupců a data tabulky začínají v šestém řádku a procházejí všemi následujícími řádky.
Cílem je zkombinovat všechny 12 souborů do jedné tabulky. Tato kombinovaná tabulka obsahuje řádek záhlaví v horní části tabulky a obsahuje zdrojový název, datum, zemi, jednotky a údaje o výnosech za celý rok v samostatných sloupcích za řádkem záhlaví.
Při připojování ke složce, která je hostitelem souborů, které chcete zkombinovat – v tomto příkladu je název této složky Soubory CSV – zobrazí se dialogové okno náhledu tabulky, ve kterém se zobrazí cesta ke složce v levém horním rohu. Náhled dat zobrazuje zobrazení systému souborů.
V tomto příkladu vyberte Kombinovat.
Poznámka
V jiné situaci můžete před kombinováním souborů vybrat možnost Transformovat data a data dále filtrovat a transformovat. Výběr možnosti Kombinovat se doporučuje jenom v případech, kdy jste si jisti, že složka obsahuje jenom soubory, které chcete zkombinovat.
Po výběru možnosti Zkombinovat v náhledu tabulky se zobrazí dialogové okno Kombinovat soubory .
Poznámka
Power Query automaticky zjistí, jaký konektor se má použít, na základě prvního souboru nalezeného v seznamu. Další informace o konektoru CSV najdete v části Text/CSV.
V tomto příkladu ponechte všechna výchozí nastavení (příklad souboru je nastavený na První soubor a výchozí hodnoty pro zjišťování původu souboru, oddělovače a datového typu).
Teď v pravém dolním rohu vyberte Transformovat data , abyste přešli na výstupní dotaz.
Po výběru možnosti Transformovat data v dialogovém okně Kombinovat soubory se vrátíte do Editor Power Query v dotazu, který jste původně vytvořili z připojení k místní složce. Výstupní dotaz teď obsahuje název zdrojového souboru v levém sloupci spolu s daty ze všech zdrojových souborů ve zbývajících sloupcích.
Data ale nejsou ve správném tvaru. Před kombinováním těchto řádků je potřeba z každého souboru odebrat horní čtyři řádky. Pokud chcete tuto změnu provést v každém souboru před jejich kombinováním, vyberte v podokně Dotazy na levé straně obrazovky dotaz Transformovat ukázkový soubor.
V tomto dotazu ukázkového souboru transformace hodnoty ve sloupci Date označují, že data jsou pro měsíc duben, který má formát RRRR-MM-DD (year-month-day). Duben 2019.csv je první soubor, který se zobrazí v náhledu tabulky.
Teď potřebujete k vyčištění dat použít novou sadu transformací. Každá transformace se automaticky převede na funkci ve skupině pomocných dotazů, která se použije pro každý soubor ve složce, a teprve potom zkombinuje data z každého souboru.
Transformace, které je potřeba přidat do dotazu ukázkového souboru transformace, jsou:
Odebrat horní řádky: Chcete-li provést tuto operaci, vyberte nabídku ikon tabulky v levém horním rohu tabulky a pak vyberte Odebrat horní řádky.
V dialogovém okně Odebrat horní řádky zadejte 4 a pak vyberte OK.
Po výběru možnosti OK už tabulka nebude obsahovat horní čtyři řádky.
Použijte první řádek jako záhlaví: Znovu vyberte ikonu tabulky a pak vyberte Použít první řádek jako záhlaví.
Výsledkem této operace bude zvýšení úrovně prvního řádku tabulky na nová záhlaví sloupců.
Po dokončení této operace se Power Query ve výchozím nastavení pokusí automaticky rozpoznat datové typy sloupců a přidat nový krok Změněný typ sloupce.
Když se vrátíte k dotazu Soubory CSV, všimnete si, že poslední krok zobrazuje chybu, která přečte sloupec Sloupec1 tabulky, který se nenašel. Důvodem této chyby je, že předchozí stav dotazu prováděl operaci se sloupcem s názvem Column1. Tento sloupec už ale kvůli změnám provedeným v dotazu ukázkového souboru transformace neexistuje. Další informace: Práce s chybami v Power Query
Tento poslední krok dotazu můžete odebrat z podokna Použitý postup tak, že na levé straně názvu kroku vyberete ikonu odstranění X. Po odstranění tohoto kroku se v dotazu zobrazí správné výsledky.
Všimněte si však, že žádný ze sloupců odvozených ze souborů (Date, Country, Units, Revenue) nemá přiřazený konkrétní datový typ. Pomocí následující tabulky přiřaďte ke každému sloupci správný datový typ.
Název sloupce | Datový typ |
---|---|
Datum | Datum |
Země | Text |
Jednotky | Celé číslo |
Výnosy | Měna |
Po definování datových typů pro každý sloupec budete připraveni načíst tabulku.
Poznámka
Pokud chcete zjistit, jak definovat nebo změnit datové typy sloupců, přejděte na Datové typy.
Pokud chcete ověřit, že byly všechny soubory sloučené, můžete vybrat ikonu filtru v záhlaví sloupce Source.Name , která zobrazí všechny názvy zkombinovaných souborů. Pokud se zobrazí upozornění "Seznam může být neúplný", vyberte Načíst více v dolní části nabídky a zobrazte ve sloupci více dostupných hodnot.
Po výběru Možnosti Načíst další se zobrazí všechny dostupné názvy souborů.