Úvod

Dokončené

Uvažujme o scenári, v ktorom ste do služby Power BI importovali údaje z viacerých odlišných zdrojov a pri skúmaní týchto údajov zistíte, že nie sú pripravené na analýzu. Čo mohlo túto nepripravenosť údajov na analýzu spôsobiť?

Pri skúmaní údajov zistíte niekoľko problémov vrátane týchto:

  • stĺpec s názvom Employment status (Stav zamestnanosti) obsahuje iba číslice;

  • viacero stĺpcov obsahuje chyby;

  • niektoré stĺpce obsahujú hodnoty null;

  • zdá sa, že ID zákazníka sa v niektorých stĺpcoch zobrazuje duplicitne;

  • v stĺpci na jeden údaj adresy je skombinovaná ulica, mesto, štát a PSČ.

Začnete s údajmi pracovať, ale vždy, keď vytvoríte vizuály v zostavách, zobrazia sa chybné údaje, nesprávne výsledky a jednoduché zostavy o celkových výsledkoch predaja sú nesprávne.

Nekonvenční údaje môžu byť obrovské a hoci budete mať pocit frustrácie, rozhodnete sa využiť prácu a zistiť, ako urobiť tento sémantický model čo najčistejšie.

Power BI a Power Query našťastie ponúkajú výkonné prostredie na čistenie a prípravu údajov. Vyčistené údaje majú tieto výhody:

  • Mierky a stĺpce poskytujú pri vykonávaní agregácií a výpočtov presnejšie výsledky.

  • Tabuľky sú usporiadané, používatelia v nich dokážu nájsť údaje aj intuitívne.

  • Vďaka odstráneniu duplikátov je navigácia v údajoch jednoduchšia. Výsledné stĺpce možno použiť vo filtroch a rýchlych filtroch.

  • Zložitý stĺpec je možné rozdeliť do dvoch jednoduchších stĺpcov. Viaceré stĺpce možno pre lepšiu čitateľnosť skombinovať do jedného stĺpca.

  • Kódy a celé čísla možno nahradiť hodnotami, ktoré ľudia dokážu prečítať.

V tomto module sa naučíte:

  • vyriešiť nekonzistencie, neočakávané hodnoty alebo hodnoty null a problémy s kvalitou údajov;

  • využiť jednoducho použiteľné nahradenia hodnôt;

  • profilovať údaje, aby ste mohli získať ďalšie informácie o konkrétnom stĺpci ešte predtým, ako ho použijete;

  • vyhodnotiť a transformovať typy údajov v stĺpcoch;

  • použiť transformácie tvarov údajov na štruktúry tabuliek;

  • kombinovať dotazy,

  • použiť používateľsky príjemné konvencie pomenovania na stĺpce a dotazy;

  • upraviť kód jazyka M v Rozšírenom editore.