CSV-fájlok egyesítése
A Power Queryben több fájlt is kombinálhat egy adott adatforrásból. Ez a cikk bemutatja, hogyan működik a felhasználói élmény, ha az egyesíteni kívánt fájlok CSV-fájlok. További információ: Fájlok egyesítése – áttekintés
Tipp.
Ezt a példát követve letöltheti a cikkben használt mintafájlokat a letöltési hivatkozásról. Ezeket a fájlokat elhelyezheti a választott adatforrásban, például helyi mappában, SharePoint-mappában, Azure Blob Storage-ban, Azure Data Lake Storage-ban vagy más adatforrásban, amely a fájlrendszer nézetét biztosítja.
Az egyszerűség kedvéért a jelen cikkben szereplő példa a Mappa összekötőt használja. További információ: Mappa
A fájlok kombinálásához elengedhetetlen, hogy mindegyiknek ugyanaz a struktúrája és kiterjesztése legyen. A példában használt összes fájl struktúrája és kiterjesztése (.csv) azonos.
A 2019-es naptári év minden hónapjához 12 CSV-fájl tartozik. Az alábbi képen a fájl első 15 sora látható január hónapra vonatkozóan.
A sorok száma fájlonként eltérő, de minden fájl fejlécszakasza az első négy sorban található. Az ötödik sorban oszlopfejlécek találhatók, a táblázat adatai pedig a hatodik sorban kezdődnek, és az összes további sorban folytatódnak.
A cél az, hogy mind a 12 fájlt egyetlen táblába egyesítse. Ez a kombinált táblázat a tábla tetején található fejlécsort tartalmazza, és a fejlécsor után külön oszlopokban tartalmazza a teljes év forrásnevét, dátumát, országát, egységeinek és bevételi adatait.
Amikor az egyesíteni kívánt fájlokat tartalmazó mappához csatlakozik – ebben a példában a mappa neve CSV Files –, megjelenik a táblázat előnézete párbeszédpanel, amely a mappa elérési útját jeleníti meg a bal felső sarokban. Az adatelőnézet a fájlrendszer nézetét jeleníti meg.
Ebben a példában válassza az Összevonás lehetőséget.
Megjegyzés
Egy másik helyzetben az Adatok átalakítása lehetőséget választva tovább szűrheti és átalakíthatja az adatokat a fájlok kombinálása előtt. Az Egyesítés lehetőség kiválasztása csak akkor ajánlott, ha biztos benne, hogy a mappa csak az egyesíteni kívánt fájlokat tartalmazza.
Miután a táblázat előnézetében a Kombinálás lehetőséget választja, megjelenik a Fájlok egyesítése párbeszédpanel.
Megjegyzés
A Power Query a listában található első fájl alapján automatikusan észleli a használni kívánt összekötőt. A CSV-összekötőről a Text/CSV webhelyen tudhat meg többet.
Ebben a példában hagyja meg az összes alapértelmezett beállítást (a példafájl első fájlra van állítva, és a fájl eredetének, elválasztójelének és adattípus-észlelésének alapértelmezett értékeit).
Most válassza az Adatok átalakítása lehetőséget a jobb alsó sarokban a kimeneti lekérdezéshez való ugráshoz.
Miután kiválasztotta az Adatok átalakítása lehetőséget a Fájlok egyesítése párbeszédpanelen, a rendszer visszavesz a helyi mappával való kapcsolatból eredetileg létrehozott lekérdezés Power Query-szerkesztő. A kimeneti lekérdezés mostantól tartalmazza a forrásfájl nevét a bal oldali oszlopban, a többi oszlopban lévő forrásfájlok adataival együtt.
Az adatok azonban nem a megfelelő formában találhatóak. A fájlok egyesítése előtt el kell távolítania az első négy sort az egyes fájlokból. Ha a módosítást minden fájlban el szeretné végezni, mielőtt egyesítené őket, válassza a Mintafájl átalakítása lekérdezést a képernyő bal oldalán, a Lekérdezések panelen.
Ebben az átalakító mintafájl-lekérdezésben a Dátum oszlop értékei azt jelzik, hogy az adatok az április hónapra vannak állítva, amely év-hónap(YYYY-MM-DD) formátumú. Április 2019.csv az első fájl, amely megjelenik a tábla előnézetében.
Most új átalakításokat kell alkalmaznia az adatok megtisztításához. A rendszer minden átalakítást automatikusan a súgó lekérdezési csoportján belüli függvényré alakít át, amelyet a rendszer a mappában lévő összes fájlra alkalmaz, mielőtt egyesíteni szeretné az egyes fájlokból származó adatokat.
Az átalakító mintafájl-lekérdezéshez hozzáadandó átalakítások a következők:
Felső sorok eltávolítása: A művelet végrehajtásához válassza a táblázat bal felső sarkában található táblázatikon menüt, majd válassza a Felső sorok eltávolítása lehetőséget.
A Felső sorok eltávolítása párbeszédpanelen adja meg a 4 értéket, majd kattintson az OK gombra.
Az OK gombot választva a táblázat nem lesz az első négy sor.
Első sor használata fejlécként: Jelölje ki ismét a táblázat ikont, majd válassza az Első sor használata fejlécként lehetőséget.
A művelet eredménye előlépteti a tábla első sorát az új oszlopfejlécekre.
A művelet befejezése után a Power Query alapértelmezés szerint megpróbálja automatikusan észlelni az oszlopok adattípusait, és hozzáad egy új módosított oszloptípus-lépést .
Amikor visszatér a CSV-fájlok lekérdezéséhez, láthatja, hogy az utolsó lépés egy hibát jelez, amely a tábla "Oszlop1" oszlopát nem találja. A hiba oka az, hogy a lekérdezés előző állapota egy Oszlop1 nevű oszlopon végzett műveletet. Az átalakító mintafájl-lekérdezés módosításai miatt azonban ez az oszlop már nem létezik. További információ: Hibák kezelése a Power Queryben
A lekérdezés utolsó lépését eltávolíthatja az Alkalmazott lépések panelről, ha a lépés neve bal oldalán az X törlés ikont választja. A lépés törlése után a lekérdezés a megfelelő eredményeket jeleníti meg.
Figyelje meg azonban, hogy a fájlokból származtatott oszlopok (Dátum, Ország, Egységek, Bevétel) egyik oszlopa sem rendelkezik hozzájuk hozzárendelt adattípussal. Rendelje hozzá a megfelelő adattípust az egyes oszlopokhoz az alábbi táblázat használatával.
Oszlop neve | Adattípus |
---|---|
Dátum | Dátum |
Ország | Szöveg |
Egység | Egész szám |
Bevétel | Pénznem |
Az egyes oszlopok adattípusainak meghatározása után készen áll a tábla betöltésére.
Megjegyzés
Az oszlop adattípusának definiálásához vagy módosításához lépjen az Adattípusok elemre.
Annak ellenőrzéséhez, hogy az összes fájl kombinálva lett-e, kiválaszthatja a szűrőikont a Source.Name oszlopfejlécen, amely megjeleníti az összes egyesített fájl nevét. Ha a "Lista hiányos lehet" figyelmeztetés jelenik meg, a menü alján válassza a További betöltés lehetőséget, hogy több elérhető értéket jelenítsen meg az oszlopban.
Miután kiválasztotta a Továbbiak betöltése lehetőséget, az összes elérhető fájlnév megjelenik.