Tvarovanie pôvodných údajov

Dokončené

Editor Power Query v aplikácii Power BI Desktop umožňuje tvarovať (transformovať) vaše importované údaje. Môžete napríklad premenovať stĺpce alebo tabuľky, zmeniť text na čísla, odstrániť riadky, nastaviť prvý riadok ako hlavičky a vykonať ďalšie kroky. Tvarovanie údajov je dôležité, pretože vďaka nemu budú údaje spĺňať vaše požiadavky a budú vhodné na použitie v zostavách.

Do modelu Power BI ste načítali nespracované údaje z dvoch zdrojov.  Časť údajov pochádza z .csv súboru, ktorý tím predaja manuálne vytvoril v Microsoft Exceli.  Ostatné údaje sa načítali prostredníctvom pripojenia k ERP systému (Enterprise Resource Planning, plánovanie podnikových zdrojov) organizácie.  Keď sa teraz pozriete na tieto údaje v aplikácii Power BI Desktop, zistíte, že je v nich neporiadok, niektoré z údajov ani nepotrebujete a niektoré údaje, ktoré potrebujete, nie sú v správnom formáte.

Predtým, ako budete môcť začať vytvárať zostavy, treba použiť Editor Power Query na vyčistenie a tvarovanie údajov.

Začíname s Editorom Power Query

Ak chcete začať s tvarovaním údajov, otvorte Editor Power Query výberom možnosti Transformovať údaje na karte Domov na karte Power BI Desktop.

V Editor Power Query sa údaje z vybratého dotazu zobrazia v strede obrazovky a na ľavej strane tably Dotazy sa uvádzajú dostupné dotazy (tabuľky).

Pri práci v Editore Power Query sa všetky kroky, ktoré pri tvarovaní údajov vykonáte, zaznamenávajú. Po pripojení dotazu k zdroju údajov sa tieto kroky vždy automaticky použijú, takže údaje sú vždy tvarované tak, ako ste zadali.  Editor Power Query vykonáva zmeny len v konkrétnom zobrazení údajov, takže nemusíte mať obavy v súvislosti so zmenami v pôvodnom zdroji údajov. Zoznam krokov nájdete na pravej strane obrazovky na table Nastavenia dotazu spolu s vlastnosťami dotazu.

Pás s nástrojmi Editora Power Query obsahuje množstvo tlačidiel, ktoré môžete použiť na výber, zobrazenie a tvarovanie údajov.

Ďalšie informácie o dostupných funkciách nájdete v téme Pás s nástrojmi dotazu.

Poznámka

V Editor Power Query ponúkajú mnohé z rovnakých možností aj kontextové ponuky, ktoré sa na karte Transformovať na páse s nástrojmi nachádzajú.

Identifikovanie hlavičiek a názvov stĺpcov

Prvým krokom pri tvarovaní pôvodných údajov je identifikovanie hlavičiek a názvov stĺpcov v údajoch a následné vyhodnotenie ich umiestnenia, aby ste mali istotu, že sú na správnom mieste.

Na nasledujúcej snímke obrazovky majú zdrojové údaje v csv súbore SalesTarget (CieľPredaja, ukážka nie je uvedená) cieľ kategorizovaný podľa produktu a podkategóriu rozdelenú podľa mesiacov, pričom oba tieto údaje sú usporiadané v stĺpcoch.

Môžete si však všimnúť, že údaje sa neimportovali podľa očakávania.

V dôsledku toho sa údaje zložito čítajú. Vyskytol sa problém s údajmi v ich aktuálnom stave, pretože hlavičky stĺpcov sú v odlišných riadkoch (označené červenou) a názvy niektorých stĺpcov nie sú popisné, napríklad Stĺpec1, Stĺpec2 a tak ďalej.

Keď ste identifikovali, kde sa hlavičky a názvy stĺpcov nachádzajú, môžete vykonať zmeny v usporiadaní údajov.

Zvýšenie úrovne hlavičiek

Pri vytvorení tabuľky v aplikácii Power BI Desktop Editor Power Query predpokladá, že všetky údaje patria do riadkov tabuľky. Zdroj údajov však môže obsahovať prvý riadok s názvami stĺpcov, čo sa stalo aj v predchádzajúcom príklade SalesTarget (CieľPredaja).  Ak chcete túto nepresnosť opraviť, treba zvýšiť úroveň prvého riadka tabuľky na hlavičky stĺpcov.

Úroveň hlavičiek môžete zvýšiť dvoma spôsobmi: výberom možnosti Použiť prvý riadok ako hlavičky na karte Domov alebo výberom rozbaľovacieho tlačidla vedľa položky Stĺpec1 a následným výberom položky Použiť prvý riadok ako hlavičky.

Nasledujúci obrázok znázorňuje, aký vplyv bude mať funkcia Použiť prvý riadok ako hlavičky na údaje:

Premenovanie stĺpcov

Ďalším krokom pri tvarovaní údajov je kontrola hlavičiek stĺpcov. Možno zistíte, že niektoré stĺpce majú nesprávne hlavičky, hlavička obsahuje pravopisnú chybu alebo konvencia pomenovania hlavičiek nie je konzistentná či používateľsky prístupná.

Pozrite si predchádzajúcu snímku obrazovky, ktorá znázorňuje vplyv funkcie Použiť prvý riadok ako hlavičky . Všimnite si, že stĺpec obsahujúci údaje podkategórie Name (Názov) má teraz ako hlavičku stĺpca mesiac. Táto hlavička stĺpca je nesprávna, takže ju treba premenovať.

Hlavičky stĺpcov môžete premenovať dvoma spôsobmi. Jednou možnosťou je kliknúť na hlavičku pravým tlačidlom myši, vybrať položku Premenovať, upraviť názov a potom stlačiť kláves Enter. Prípadne môžete dvakrát kliknúť na hlavičku stĺpca a prepísať názov na správny názov.

Tento problém môžete obísť aj odstránením (vynechaním) prvých dvoch riadkov a následným premenovaním stĺpcov so správnym názvom.

Odstránenie najvrchnejších riadkov

Pri tvarovaní údajov možno budete potrebovať odstrániť niektoré najvrchnejšie riadky, napríklad ak sú prázdne alebo obsahujú údaje, ktoré vo svojich zostavách nepotrebujete.

Pokračujeme v príklade SalesTarget (CieľPredaja). Všimnite si, že prvý riadok je prázdny (neobsahuje údaje) a druhý riadok obsahuje údaje, ktoré už nie sú potrebné.

Ak chcete tieto nadbytočné riadky odstrániť, vyberte položky Odstrániť riadkyOdstrániť najvrchnejšie> riadky na karte Domov.

Odstránenie stĺpcov

Kľúčovým krokom v procese tvarovania údajov je odstránenie nadbytočných stĺpcov.  Stĺpce je vhodné odstrániť čo najskôr. Jedným zo spôsobov, ako stĺpce odstrániť, by bolo obmedziť stĺpce pri získavaní údajov zo zdroja údajov. Ak napríklad extrahujete údaje z relačnej databázy pomocou jazyka SQL, môžete obmedziť stĺpec, ktorý extrahujete, použitím zoznamu stĺpcov vo výraze SELECT.

Odstránenie stĺpcov v počiatočnom štádiu procesu je vhodnejšie ako keby ste to urobili neskôr, najmä ak máte vytvorené vzťahy medzi tabuľkami. Odstránenie nepotrebných stĺpcov vám pomôže sústrediť sa na potrebné údaje a pomôcť zlepšiť celkový výkon Power BI Desktop sémantických modelov a zostáv.

Každý stĺpec preskúmajte a položte si otázku, či údaje, ktoré obsahuje, potrebujete. Ak tieto údaje neplánujete použiť v zostave, stĺpec nepridá vášmu sémantickému modelu žiadnu hodnotu. Preto by ste tento stĺpec mali odstrániť.  Ak sa vaše požiadavky v priebehu času zmenia, stĺpec môžete kedykoľvek zase pridať.

Stĺpce možno odstrániť dvoma spôsobmi. Prvou možnosťou je vybrať stĺpce, ktoré chcete odstrániť, a potom na karte Domov vybrať položku Odstrániť stĺpce.

Prípadne môžete vybrať stĺpce, ktoré si chcete ponechať, a potom na karte Domov vybrať položky Odstrániť stĺpce>Odstrániť ostatné stĺpce.

Zrušenie kontingenčnosti stĺpcov

Zrušenie kontingenčnosti stĺpcov je užitočnou funkciou služby Power BI. Túto funkciu môžete použiť s údajmi z ľubovoľného zdroja údajov, najčastejšie ju však využijete pri importovaní údajov z Excelu. V nasledujúcom príklade je ukázaný vzorový excelový dokument s údajmi o predaji.

Napriek tomu, že spočiatku sa zdá, že údaje dávajú zmysel, ťažko by sa čítali, pretože celkový údaj o predaji kombinuje roky 2018 a 2019. Vaším cieľom by potom bolo použiť tieto údaje v službe Power BI s troma stĺpcami: Month (Mesiac), Year (Rok) a SalesAmount (ObjemPredaja).

Keď tieto údaje importujete do Power Query, bude to vyzerať ako na nasledujúcom obrázku.

Ďalej premenujete prvý stĺpec na Month (Mesiac). Tento stĺpec bol označený nesprávne, pretože hlavička v Exceli označovala stĺpce 2018 a 2019. Zvýraznite stĺpce 2018 a 2019, vyberte kartu Transformovať v doplnku Power Query a vyberte položku Zrušiť kontingenčnosť.

Stĺpec Attribute (Atribút) môžete premenovať na Year (Rok) a stĺpec Value (Hodnota) na SalesAmount (ObjemPredaja).

Zrušením kontingenčnosti sa zjednoduší neskorší proces vytvárania mierok DAX v údajoch. Dokončením tohto procesu ste získali jednoduchšiu možnosť rýchleho filtrovania údajov podľa stĺpcov Year (Rok) a Month (Mesiac).

Kontingenčné stĺpce

Ak sú tvarované údaje „ploché“ (inak povedané, obsahujú veľa podrobností, ale nie sú žiadnym spôsobom usporiadané ani zoskupené), ich nedostatočná štruktúra vám môže skomplikovať vyhľadávanie vzorov v týchto údajoch.

Pomocou funkcie Kontingenčný stĺpec môžete konvertovať ploché údaje na tabuľku, ktorá obsahuje agregovanú hodnotu pre každú jedinečnú hodnotu v stĺpci. Túto funkciu môžete použiť napríklad na sumarizáciu údajov pomocou rôznych matematických funkcií, ako napríklad Count, Minimum, Maximum, Median, Average alebo Sum.

V príklade SalesTarget (CieľPredaja) môžete vytvorením kontingenčnosti stĺpcov získať počet podkategórií produktov v jednotlivých kategóriách produktov.

Na karte Transformovať vyberte položku Transformovať > kontingenčné stĺpce.

V zobrazenom okne Kontingenčný stĺpec vyberte stĺpec zo zoznamu Stĺpec hodnôt , ako je napríklad Názov podkategórie. Rozbaľte rozšírené možnosti a vyberte možnosť zo zoznamu Funkcia agregovanej hodnoty , napríklad Počet (Všetko) a potom vyberte položku OK.

Na nasledujúcom obrázku je znázornené, ako funkcia kontingenčného stĺpca mení spôsob usporiadania údajov.

Editor Power Query zaznamenáva všetky kroky, ktoré pri tvarovaní údajov vykonáte, zoznam krokov sa zobrazuje na table Nastavenia dotazu. Ak ste vykonali všetky požadované zmeny, vyberte položku Zavrieť & použiť na zavretie Editor Power Query a použite zmeny v sémantickom modeli. Kým však vyberiete položku Zavrieť & Použiť, môžete vykonať ďalšie kroky na vyčistenie a transformáciu údajov v službe Editor Power Query.  Tieto ďalšie kroky sú uvedené ďalej v tomto module.