Bevezetés
Képzelje el azt a helyzetet, hogy több különböző forrásból a Power BI-ba importált adatokkal rendelkezik, és az adatokat megvizsgálva megállapítja, hogy azok nincsenek előkészítve az elemzésre. Mitől lehetnek az adatok elemzésre előkészítetlenek?
Az adatok vizsgálatakor több problémát is felfedez, köztük a következőket:
Egy Employment status (Alkalmazotti státusz) nevű oszlop csak számokat tartalmaz.
Több oszlopban hibák is vannak.
Egyes oszlopok null értékeket tartalmaznak.
Úgy tűnik, hogy néhány oszlopban többször is megismétlődnek az ügyfél-azonosítók.
Egyetlen cím oszlopban van összefoglalva a cím, a város, az állam és az irányítószám.
Munkához lát az adatokkal, de valahányszor vizualizációt vagy jelentést hoz létre, rossz adatokat és helytelen eredményeket kap, az értékesítésről készített egyszerű jelentésekben pedig hibásak az összegek.
A piszkos adatok elsöprőek lehetnek, és bár frusztrálónak érezheti magát, úgy dönt, hogy dolgozik, és kitalálja, hogyan teheti ezt a szemantikai modellt a lehető legkorszerűbbé.
Szerencsére a Power BI és a Power Query hatékony környezetet kínál az adatok tisztításához és előkészítéséhez. A tiszta adatok az alábbi előnyökkel járnak:
A mértékek és oszlopok pontosabb eredményeket adnak, ha összesítéseket és számításokat végeznek.
A táblák rendezettek, a felhasználók intuitív módon megtalálják bennük az adatokat.
Az ismétlődések megszűnnek, ezáltal az adatok könnyebben kezelhetők. Olyan oszlopok is keletkeznek, amelyek szeletelőkben és szűrőkben használhatók.
Egy összetett oszlop felosztható két egyszerűbb oszlopra. Több oszlop egyetlen oszlopba kombinálható a jobb olvashatóság érdekében.
A kódok és egész számok érthető, olvasható értékekre cserélhetők.
Ebben a modulban a következőket sajátíthatja el:
Inkonzisztenciák, váratlan vagy null értékek és adatminőségi problémák kiküszöbölése.
Felhasználóbarát helyettesítő értékek alkalmazása.
Adatprofil készítése, hogy jobban megismerhessen egy adott oszlopot, mielőtt felhasználná.
Oszlopok adattípusainak kiértékelése és átalakítása.
Adatformázó átalakítások alkalmazása táblastruktúrákon.
Lekérdezések kombinálása.
Felhasználóbarát elnevezési konvenciók alkalmazása oszlopokra és lekérdezésekre.
M-kód szerkesztése a Speciális szerkesztőben.