Dimenziómodellezés a Microsoft Fabric Warehouse-ban
A következőkre vonatkozik:✅ SQL Analytics-végpont és Warehouse a Microsoft Fabricben
Ez a cikk egy raktáron belüli dimenziómodellezésről szóló sorozat első része. Gyakorlati útmutatást nyújt a Microsoft Fabric Warehouse-hoz, amely számos T-SQL-képességet támogat, például táblákat hozhat létre és adatokat kezelhet a táblákban. Így teljes mértékben szabályozhatja a dimenziómodell-táblák létrehozását és adatokkal való betöltését.
Feljegyzés
Ebben a cikkben az adattárház kifejezés egy vállalati adattárházra utal, amely a kritikus fontosságú adatok átfogó integrációját biztosítja a szervezetben. Ezzel szemben az önálló kifejezésraktár egy Fabric Warehouse-ra utal, amely egy szolgáltatott szoftver (SaaS) relációs adatbázis, amelyet az adattárház implementálásához használhat. Az egyértelműség kedvéért ebben a cikkben az utóbbit Fabric Warehouse-ként említik.
Tipp.
Ha tapasztalatlan a dimenziómodellezésben, vegye figyelembe, hogy ez a cikksorozat az első lépés. Nem célja a dimenziómodellezés tervezésének teljes körű megvitatása. További információkért tekintse meg közvetlenül a széles körben elfogadott közzétett tartalmakat, például Ralph Kimball és mások által kiadott The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling (3. kiadás, 2013).
Csillagséma-kialakítás
A csillagséma a relációs adattárházak által alkalmazott dimenziómodellezési tervezési technika. Ajánlott tervezési módszer a Fabric Warehouse létrehozásakor. A csillagséma ténytáblákból és dimenziótáblákból áll.
- A dimenziótáblák a szervezet és az elemzési követelmények szempontjából releváns entitásokat írják le. Széles körben a modellel kapcsolatos dolgokat jelölik. A dolgok lehetnek termékek, személyek, helyek vagy bármely más fogalom, beleértve a dátumot és az időt. További információkért és a tervezési ajánlott eljárásokért tekintse meg a dimenziótáblákat ebben a sorozatban.
- A ténytáblák megfigyelésekhez vagy eseményekhez kapcsolódó méréseket tárolnak. Tárolhatnak értékesítési rendeléseket, részvényegyenlegeket, árfolyamokat, hőmérsékleti értékeket stb. A ténytáblák dimenziókulcsokat és részletes értékeket tartalmaznak, amelyek összesíthetők. További információkért és a tervezési ajánlott eljárásokért tekintse meg a jelen sorozat Ténytáblái című szakaszát.
A csillagséma-kialakítás elemzési lekérdezési számítási feladatokhoz van optimalizálva. Ezért ez a vállalati Power BI szemantikai modellek előfeltétele. Az elemzési lekérdezések az adatok szűrésével, csoportosításával, rendezésével és összegzésével foglalkoznak. A tényadatok a kapcsolódó dimenziótáblák szűrőinek és csoportosításainak kontextusában kerülnek összegzésre.
A csillagséma azért nevezik csillagsémaként, mert a ténytábla a csillag középpontját képezi, míg a kapcsolódó dimenziótáblák a csillag pontjait alkotják.
A csillagséma gyakran több ténytáblát, tehát több csillagot tartalmaz.
A jól megtervezett csillagséma nagy teljesítményű (relációs) lekérdezéseket biztosít kevesebb táblacsatlakozás és a hasznos indexek nagyobb valószínűsége miatt. Emellett a csillagséma gyakran alacsony karbantartást igényel az adattárház kialakítása során. Ha például egy új oszlopot ad hozzá egy dimenziótáblához, hogy támogassa az új attribútumok általi elemzést, viszonylag egyszerű feladat. Ahogy az adattárház hatóköre is változik, új tényeket és dimenziókat ad hozzá.
A dimenziómodellek táblái rendszeresen, esetleg naponta frissülnek és betölthetők egy kinyerési, átalakítási és betöltési (ETL) folyamattal. Ez a folyamat szinkronizálja az adatokat a forrásrendszerekkel, amelyek működési adatokat tárolnak. További információ: Táblázatok betöltése ebben a sorozatban.
Dimenziómodellezés a Power BI-hoz
Nagyvállalati megoldások esetén a Dimenzióraktár dimenziómodellje ajánlott előfeltétele a Power BI szemantikai modell létrehozásának. A dimenziómodell nem csak a szemantikai modellt támogatja, hanem más élményekhez, például gépi tanulási modellekhez is adatforrás.
Bizonyos körülmények között azonban nem ez a legjobb megközelítés. Például azok az önkiszolgáló elemzők, akiknek szabadságra és rugalmasságra van szükségük a gyors cselekvéshez, és nem függnek az informatikához, szemantikai modelleket hozhatnak létre, amelyek közvetlenül csatlakoznak a forrásadatokhoz. Ilyen esetekben a dimenziómodellezés elmélete még mindig releváns. Ez az elmélet segít az elemzőknek intuitív és hatékony modellek létrehozásában, miközben nem szükséges dimenziómodelleket létrehozni és betölteni egy adattárházban. Ehelyett kvázidimenziós modell hozható létre a Power Query használatával, amely meghatározza a szemantikai modelltáblák létrehozásához és betöltéséhez szükséges forrásadatokhoz való csatlakozás és átalakítás logikáját. További információ: A csillagséma és a Power BI fontossága.
Fontos
Ha a Power Query használatával definiál egy dimenziómodellt a szemantikai modellben, nem tudja kezelni az előzményváltozásokat, ami szükséges lehet a múlt pontos elemzéséhez. Ha ez követelmény, létre kell hoznia egy adattárházat, és engedélyeznie kell az időszakos ETL-folyamatok számára a dimenzióváltozások rögzítését és megfelelő tárolását.
Adattárház tervezése
Komoly és fontos vállalkozásként kell megközelítenie az adattárház létrehozását és a dimenziómodell kialakítását. Ennek az az oka, hogy az adattárház az adatplatform alapvető összetevője. Szilárd alapot kell képeznie, amely támogatja az elemzést és a jelentéskészítést – és ezáltal a döntéshozatalt – a teljes szervezet számára.
Ennek érdekében az adattárháznak törekednie kell arra, hogy az igazság egyetlen verziójaként tárolja a minőséget, a megfelelő és a korábbi pontosságú adatokat. Érthető és navigálásra alkalmas adatokat kell szolgáltatnia gyors teljesítménnyel, és engedélyeket kell kikényszerítenie, hogy a megfelelő adatokhoz csak a megfelelő személyek férhessenek hozzá. Törekedjen arra, hogy az adattárházat a rugalmasság érdekében tervezhesse meg, lehetővé téve, hogy alkalmazkodjon a változásokhoz a követelmények alakulásának megfelelően.
Az adattárház sikeres megvalósítása a jó tervezéstől függ. A Fabric és az adattárház sikeres bevezetéséhez vezető stratégiai és taktikai szempontokról és akcióelemekről a Microsoft Fabric bevezetési ütemtervében tájékozódhat.
Tipp.
Javasoljuk, hogy a vállalati adattárházat iteratív módon hozza létre. Először a legfontosabb tárgyterületekkel kezdje, majd idővel a prioritás és az erőforrások szerint bővítse ki az adattárházat más tárgyterületekkel.
Kapcsolódó tartalom
A sorozat következő cikkében megismerheti a dimenziótáblák útmutatását és tervezési ajánlott eljárásait.