Zjednodušenie štruktúry údajov
Keď do aplikácie Power BI Desktop importujete údaje z viacerých zdrojov, údaje si zachovajú preddefinované názvy tabuliek a stĺpcov. Niektoré z týchto názvov možno budete chcieť zmeniť, aby mali konzistentné formátovanie, jednoduchšie sa s nimi pracovalo a aby im používateľ lepšie porozumel. Tieto zmeny názvov a zjednodušenie štruktúry údajov môžete urobiť pomocou Editora Power Query v aplikácii Power BI Desktop.
Ak chcete pokračovať s predchádzajúcim scenárom, v ktorom ste tvarovali pôvodné údaje v modeli, treba vykonať ďalšie kroky na zjednodušenie štruktúry údajov o predaji a pripraviť tieto údaje pre tím predaja na vývoj zostáv. Stĺpce ste už premenovali, teraz však treba preskúmať názvy dotazov (tabuliek) a zistiť, či ich nemožno vylepšiť. Treba tiež skontrolovať obsah stĺpcov a nahradiť všetky hodnoty, ktoré vyžadujú korekciu.
Premenovanie dotazu
Neobvyklé alebo neužitočné názvy dotazov je vhodné zmeniť na názvy, ktoré sú jednoznačnejšie alebo ktoré používateľ lepšie pozná. Ak napríklad importujete tabuľku faktov o produktoch do Power BI Desktop a názov dotazu sa zobrazí ako FactProductTable (TabuľkaProduktov), možno budete chcieť túto tabuľku zmeniť, aby bol viac používateľsky prívetivý, ako napríklad Products. Podobne ak importujete zobrazenie, toto zobrazenie môže mať pred názvom predponu v, napríklad vProduct (vProdukt). Pre ľudí môže byť tento názov nejasný a zavádzajúci, preto možno budete chcieť predponu odstrániť.
V tomto príklade ste preskúmali názov dotazu SalesTarget (CieľPredaja) a uvedomili ste si, že tento názov nie je užitočný, pretože dotaz s rovnakým názvom sa bude vytvárať pre každý rok. Chcete predísť zámene, preto sa rozhodnete pridať do názvu dotazu aj rok.
V Editor Power Query na table Dotazy naľavo od údajov vyberte dotaz, ktorý chcete premenovať. Kliknite pravým tlačidlom myši na dotaz a vyberte položku Premenovať. Upravte aktuálny názov alebo zadajte nový názov a potom stlačte kláves Enter.
Nahradenie hodnôt
Pomocou funkcie Nahradiť hodnoty v Editor Power Query môžete nahradiť ľubovoľnú hodnotu inou hodnotou vo vybratom stĺpci.
V tomto príklade si všimnete, že v stĺpci Attribute (Atribút ) je nesprávne napísaný mesiac December. Túto pravopisnú chybu chcete opraviť. Vyberte stĺpec obsahujúci hodnotu, ktorú chcete nahradiť (v tomto prípade Attribute (Atribút)), a potom na karte Transformovať vyberte položku Nahradiť hodnoty.
Do poľa Hodnota, ktorá sa má vyhľadať zadajte názov hodnoty, ktorú chcete nahradiť, a potom do poľa Nahradiť čím zadajte správny názov hodnoty a vyberte položku OK. V doplnku Power Query nie je možné vybrať jednu bunku a zmeniť jednu hodnotu, ako by ste to urobili v Exceli.
Na table Nastavenia dotazu si môžete prezrieť zoznam krokov, ktoré ste vykonali pri reštrukturalizácii a oprave údajov. Po dokončení všetkých krokov, ktoré chcete vykonať, môžete výberom položky Zavrieť & Použiť zavrieť Editor Power Query a použiť zmeny v dátom modeli. Môžete však pokračovať ďalšími krokmi a údaje vyčistiť a transformovať.
Nahradenie hodnôt null
Príležitostne možno zistíte, že zdroje údajov obsahujú hodnoty null. Suma prepravných nákladov v predajnej objednávke môže mať napríklad hodnotu null, ak je synonymom nuly. Ak hodnota zostane null, priemer sa nevypočíta správne. Jedným z riešení by bolo zmeniť hodnoty null na nulu, čo by malo za následok presnejší výpočet priemeru prepravných nákladov. V tomto prípade môžete pomocou rovnakých krokov, ktoré ste použili predtým, nahradiť hodnoty null nulami.
Odstránenie duplikátov
Môžete tiež odstrániť duplikáty zo stĺpcov, aby sa vo vybratom stĺpci nachádzali iba jedinečné názvy, a to pomocou funkcie Odstrániť duplikáty v Power Query.
V tomto príklade si všimnite, že stĺpec Názov kategórie obsahuje duplicitné hodnoty pre každú kategóriu. Preto chcete vytvoriť tabuľku s jedinečnými kategóriami a použiť ju v sémantickom modeli. Túto akciu môžete dosiahnuť tak, že vyberiete stĺpec, kliknete pravým tlačidlom myši na hlavičku stĺpca a potom vyberiete možnosť Odstrániť duplikáty .
Pred odstránením duplikátov porozmýšľajte, či si tabuľku neskopírovať. Možnosť Kopírovať nájdete navrchu kontextovej ponuky, ako je znázornené na nasledujúcej snímke obrazovky. Ak si tabuľku pred odstránením duplikátov skopírujete, získate možnosť tabuľky porovnať a v prípade potreby môžete využiť obe tabuľky.
Najvhodnejšie postupy pri vytváraní názvov tabuliek, stĺpcov a hodnôt
Konvencie pomenovania tabuliek, stĺpcov a hodnôt nemajú žiadne pevne stanovené pravidlá. Odporúča sa však použiť jazyk a skratky, ktoré sa vo vašej organizácii bežne používajú, ktoré sú všeobecne schválené a považujete ich za bežnú terminológiu.
Najvhodnejšie je vytvoriť pre tabuľky, stĺpce a mierky popisné obchodné názvy a nahradiť znaky podčiarknutia (_) medzerami. Skratky, predpony a slová ako "číslo" alebo "ID" používajte konzistentne. Neúmerne krátke skratky môžu využiť zavádzajúci spôsob, ak sa v organizácii bežne nepoužívajú.
Nejasnostiam môžete predísť aj tak, že odstránite predpony alebo prípony, ktoré sa môžu používať v názvoch tabuliek, a nahradíte ich názvami v jednoduchšom formáte.
Pri nahrádzaní hodnôt si skúste predstaviť, ako sa tieto hodnoty budú zobrazovať v zostave. Hodnoty, ktoré sú príliš dlhé, môžu spôsobovať problémy pri čítaní alebo sa nemusia zmestiť do vizuálu. Hodnoty, ktoré sú príliš krátke, môžu spôsobovať problémy pri interpretácii. Pokiaľ sa text priestorovo zmestí do vizuálu, je tiež vhodné vyhnúť sa v hodnotách akronymom.