Bevezetés

Befejeződött

Egy nagyszerű szemantikai modell létrehozása az egyik legfontosabb feladat, amelyet egy adatelemző el tud végezni a Microsoft Power BI-ban. Ha jól végzik el a feladatot, megkönnyíthetik az adatok értelmezését, ezáltal pedig az értékes Power BI-jelentések létrehozását is mind a felhasználóknak, mind Önnek.

A modul lapjai csak oktató jellegűek, adatfájlok nincsenek megadva. Lehetősége van valós adatokkal dolgozni a laborokban.

A jó szemantikai modell a következő előnyöket kínálja:

  • Gyorsabb adatfeltárás.

  • Egyszerűbben elkészíthető összesítések.

  • Pontosabb jelentések.

  • Gyorsabban elkészíthető jelentések.

  • Könnyebben karbantartható jelentések.

A jó szemantikai modell beállítási szabályainak megadása nehézkes, mert minden adat eltérő, és az adatok használata változó. A kisebb szemantikai modell általában jobb, mert gyorsabban teljesít, és egyszerűbben használható. A kisebb szemantikai modell fogalmának meghatározása azonban ugyanolyan problémás, mert heurisztikus és szubjektív fogalom.

A kisebb szemantikai modell általában kevesebb táblából és kevesebb oszlopból áll minden táblában, amelyet a felhasználó láthat. Ha egy értékesítési adatbázis minden szükséges táblázatát importálja, a táblázatok száma azonban 30, a felhasználó ezt nem fogja intuitívnak találni. Ha ezeket a táblákat öt táblára összecsukja, a szemantikai modell intuitívabbá teszi a felhasználó számára, míg ha a felhasználó megnyit egy táblát, és 100 oszlopot talál, az túlterheltnek bizonyulhat. Ha eltávolítja a szükségtelen oszlopokat, hogy kezelhetőbb számokat biztosítson, növeli annak valószínűségét, hogy a felhasználó beolvassa az összes oszlopnevet. Összefoglalva, a szemantikai modellek tervezésekor az egyszerűségre kell törekednie.

Az alábbi képen egy szemantikai példamodell látható. A mezők adattáblákat tartalmaznak, és mindegyik sorelem egy oszlop. A mezőket összekötő vonalak a táblák közötti kapcsolatokat jelölik. Ezek a kapcsolatok lehetnek összetettek, még egy ilyen egyszerű modellben is. A szemantikai modell könnyen rendezetlenné válhat, és a modellben lévő táblák száma fokozatosan növekedhet. A szemantikai modell egyszerű, átfogó és pontos megtartása folyamatos erőfeszítést igényel.

Képernyőkép a sok kapcsolattal rendelkező szemantikai példamodellről.

A táblák közötti kapcsolatokat elsődleges és külső kulcsok határozzák meg. Az elsődleges kulcsok olyan oszlopok, amelyek az egyedi, nem null értékű adatsorokat azonosítják. Ha például rendelkezik egy Customers (Ügyfelek) táblázattal, ehhez tartozhat egy index, amely minden egyedi ügyfelet azonosít. Az első sor azonosítója 1, a második sor pedig 2 azonosító, és így tovább. Minden sorhoz egyedi érték tartozik, amelyre ezzel az egyszerű értékkel hivatkozhat: az elsődleges kulccsal. Ez a folyamat akkor válik fontossá, amikor egy eltérő tábla soraira hivatkozik – erre valók a külső kulcsok. A táblák közötti kapcsolatok akkor jönnek létre, ha különböző táblák közös elsődleges és külső kulcsokkal rendelkeznek.

A Power BI-ban különböző adatforrással rendelkező táblákkal is létrehozhatók kapcsolatok, aminek köszönhetően egy táblát importálhat a Microsoft Excelből, egy másikat pedig egy relációs adatbázisból. Ezután létrehozza a két tábla közötti kapcsolatot, és egységes szemantikai modellként kezeli őket.

Most, hogy megismerkedett az adatsémát alkotó kapcsolatokkal, megismerkedhet egy adott sématervtípussal, a star sémával, amely a nagy teljesítményre és a használhatóságra van optimalizálva.

Csillagsémák

Csillagséma létrehozásával leegyszerűsítheti az adatokat. Nem ez ennek az egyetlen módja, azonban rendkívül népszerű, így célszerű minden Power BI-adatelemzőnek ismernie. Egy star sémában a szemantikai modell minden táblája dimenzióként vagy ténytábláként van definiálva, ahogyan az az alábbi vizualizációban látható.

A Csillag sémát középen egy Ténytáblával, az öt ponton pedig Dimenziótáblákkal ábrázoló ábra.

A ténytáblák megfigyelési vagy eseményadatok értékeit tartalmazzák: értékesítési megrendeléseket, termékszámokat, árakat, tranzakciós dátumokat és időket, valamint mennyiségeket. A ténytáblák számos ismétlődő értéket tartalmazhatnak. Egy termék például többször is megjelenhet több sorban, különböző ügyfeleknél és különböző dátumokon. Ezeket az értékeket összesítve vizualizációkat hozhat létre. Az összes értékesítési megrendelés vizualizációja például a ténytábla összes értékesítési megrendelésének összesítése. A ténytáblák gyakran tartalmaznak számokkal és dátumokkal kitöltött oszlopokat. A számok lehetnek mértékegységek (például értékesítési mennyiség) vagy kulcsok (például ügyfélazonosító). A dátumok a rögzített időpontot képviselik, például a megrendelés vagy a kézbesítés dátuma.

A dimenziótáblák ténytáblákban tartalmazzák az adatok részleteit: termékeket, helyeket, alkalmazottakat és megrendelési típusokat. Ezek a táblák kulcsoszlopokkal kapcsolódnak a ténytáblához. A dimenziótáblákkal a ténytáblák adatai szűrhetők és csoportosíthatók. A ténytáblák viszont tartalmazzák a mérhető adatokat, például az értékesítést és a bevételt, és minden sor a dimenziótáblák értékeinek egyedi kombinációját jelöli. Az összes értékesítési megrendelés vizualizációja esetén úgy csoportosíthatja az adatokat, hogy termékenként jelenítse meg az értékesítési megrendeléseket. A termékek ebben az esetben egy dimenziótábla adatai.

A ténytáblák sokkal nagyobbak, mint a dimenziótáblák, mivel számos esemény történik a ténytáblákban, például az egyes értékesítésekben. A dimenziótáblák általában kisebbek, mert a szűrési és csoportosítási alapul szolgáló elemek száma korlátozott. Egy év például csak annyi hónapot tartalmaz, és a Egyesült Államok csak bizonyos számú államból állnak.

Ezeket tudomásul véve megfordulhat a fejében, hogy vajon hogyan készítheti el ezt a vizualizációt a Power BI-ban.

A vonatkozó adatok két táblában találhatók: Employee (Alkalmazott) és Sales (Értékesítés), ahogy az a következő szemantikai modellben is látható. Mivel a Sales tábla az értékesítési megrendelések értékeit tartalmazza, amelyek összesíthetők, ez egy ténytábla. Az Employee tábla az alkalmazottak neveit tartalmazza, és az értékesítési megrendeléseket szűri, tehát ez egy dimenziótábla. A két táblázat közötti közös oszlop, amely az Employee tábla elsődleges kulcsa, a EmployeeID, a kapcsolat a két tábla között tehát ezzel az oszloppal hozható létre.

Képernyőkép a szemantikai modell kapcsolatairól.

A kapcsolat létrehozásakor a vizualizációt a követelményeknek megfelelően készítheti el, az alábbi ábrán látható módon. Ha nem hozná létre ezt a kapcsolatot, a két tábla közötti közös elemeket szem előtt tartva, nehezebben tudná elkészíteni a vizualizációt.

Képernyőkép a Csillagséma példa eredményéről.

A csillagséma és az alapul szolgáló szemantikai modell a szervezett jelentések alapja; minél több időt tölt ezeknek a kapcsolatoknak a létrehozásával és tervezésével, annál könnyebb lesz jelentéseket létrehozni és karbantartani.