Bevezetés

Befejeződött

Képzelje el azt a helyzetet, hogy több különböző forrásból a Power BI-ba importált adatokkal rendelkezik, és az adatokat megvizsgálva megállapítja, hogy azok nincsenek előkészítve az elemzésre. Mitől lehetnek az adatok elemzésre előkészítetlenek?

Az adatok vizsgálatakor több problémát is felfedez, köztük a következőket:

  • Egy Employment status (Alkalmazotti státusz) nevű oszlop csak számokat tartalmaz.

  • Több oszlopban hibák is vannak.

  • Egyes oszlopok null értékeket tartalmaznak.

  • Úgy tűnik, hogy néhány oszlopban többször is megismétlődnek az ügyfél-azonosítók.

  • Egyetlen cím oszlopban van összefoglalva a cím, a város, az állam és az irányítószám.

Munkához lát az adatokkal, de valahányszor vizualizációt vagy jelentést hoz létre, rossz adatokat és helytelen eredményeket kap, az értékesítésről készített egyszerű jelentésekben pedig hibásak az összegek.

A piszkos adatok elsöprőek lehetnek, és bár frusztrálónak érezheti magát, úgy dönt, hogy dolgozik, és kitalálja, hogyan teheti ezt a szemantikai modellt a lehető legkorszerűbbé.

Szerencsére a Power BI és a Power Query hatékony környezetet kínál az adatok tisztításához és előkészítéséhez. A tiszta adatok az alábbi előnyökkel járnak:

  • A mértékek és oszlopok pontosabb eredményeket adnak, ha összesítéseket és számításokat végeznek.

  • A táblák rendezettek, a felhasználók intuitív módon megtalálják bennük az adatokat.

  • Az ismétlődések megszűnnek, ezáltal az adatok könnyebben kezelhetők. Olyan oszlopok is keletkeznek, amelyek szeletelőkben és szűrőkben használhatók.

  • Egy összetett oszlop felosztható két egyszerűbb oszlopra. Több oszlop egyetlen oszlopba kombinálható a jobb olvashatóság érdekében.

  • A kódok és egész számok érthető, olvasható értékekre cserélhetők.

Ebben a modulban a következőket sajátíthatja el:

  • Inkonzisztenciák, váratlan vagy null értékek és adatminőségi problémák kiküszöbölése.

  • Felhasználóbarát helyettesítő értékek alkalmazása.

  • Adatprofil készítése, hogy jobban megismerhessen egy adott oszlopot, mielőtt felhasználná.

  • Oszlopok adattípusainak kiértékelése és átalakítása.

  • Adatformázó átalakítások alkalmazása táblastruktúrákon.

  • Lekérdezések kombinálása.

  • Felhasználóbarát elnevezési konvenciók alkalmazása oszlopokra és lekérdezésekre.

  • M-kód szerkesztése a Speciális szerkesztőben.