Úvod
Uvažujme o scenári, v ktorom ste do služby Power BI importovali údaje z viacerých odlišných zdrojov a pri skúmaní týchto údajov zistíte, že nie sú pripravené na analýzu. Čo mohlo túto nepripravenosť údajov na analýzu spôsobiť?
Pri skúmaní údajov zistíte niekoľko problémov vrátane týchto:
stĺpec s názvom Employment status (Stav zamestnanosti) obsahuje iba číslice;
viacero stĺpcov obsahuje chyby;
niektoré stĺpce obsahujú hodnoty null;
zdá sa, že ID zákazníka sa v niektorých stĺpcoch zobrazuje duplicitne;
v stĺpci na jeden údaj adresy je skombinovaná ulica, mesto, štát a PSČ.
Začnete s údajmi pracovať, ale vždy, keď vytvoríte vizuály v zostavách, zobrazia sa chybné údaje, nesprávne výsledky a jednoduché zostavy o celkových výsledkoch predaja sú nesprávne.
Nekonvenční údaje môžu byť obrovské a hoci budete mať pocit frustrácie, rozhodnete sa využiť prácu a zistiť, ako urobiť tento sémantický model čo najčistejšie.
Power BI a Power Query našťastie ponúkajú výkonné prostredie na čistenie a prípravu údajov. Vyčistené údaje majú tieto výhody:
Mierky a stĺpce poskytujú pri vykonávaní agregácií a výpočtov presnejšie výsledky.
Tabuľky sú usporiadané, používatelia v nich dokážu nájsť údaje aj intuitívne.
Vďaka odstráneniu duplikátov je navigácia v údajoch jednoduchšia. Výsledné stĺpce možno použiť vo filtroch a rýchlych filtroch.
Zložitý stĺpec je možné rozdeliť do dvoch jednoduchších stĺpcov. Viaceré stĺpce možno pre lepšiu čitateľnosť skombinovať do jedného stĺpca.
Kódy a celé čísla možno nahradiť hodnotami, ktoré ľudia dokážu prečítať.
V tomto module sa naučíte:
vyriešiť nekonzistencie, neočakávané hodnoty alebo hodnoty null a problémy s kvalitou údajov;
využiť jednoducho použiteľné nahradenia hodnôt;
profilovať údaje, aby ste mohli získať ďalšie informácie o konkrétnom stĺpci ešte predtým, ako ho použijete;
vyhodnotiť a transformovať typy údajov v stĺpcoch;
použiť transformácie tvarov údajov na štruktúry tabuliek;
kombinovať dotazy,
použiť používateľsky príjemné konvencie pomenovania na stĺpce a dotazy;
upraviť kód jazyka M v Rozšírenom editore.