Dimensjonal modellering i Microsoft Fabric Warehouse
Gjelder for:✅ SQL Analytics-endepunkt og Warehouse i Microsoft Fabric
Denne artikkelen er den første i en serie om dimensjonal modellering i et lager. Det gir praktisk veiledning for Warehouse i Microsoft Fabric, som er en opplevelse som støtter mange T-SQL-funksjoner, som å opprette tabeller og administrere data i tabeller. Så du har full kontroll over å opprette dimensjonale modelltabeller og laste dem inn med data.
Merk
I denne artikkelen refererer termdatalageret til et virksomhetsdatalager, som leverer omfattende integrering av kritiske data på tvers av organisasjonen. Derimot refererer det frittstående termlageret til et Fabric Warehouse, som er en programvare som en tjeneste (SaaS) relasjonsdatabase som du kan bruke til å implementere et datalager. For klarhet, i denne artikkelen sistnevnte er nevnt som Fabric Warehouse.
Tips
Hvis du er uerfaren med dimensjonal modellering, bør du vurdere at denne serien med artikler er ditt første trinn. Det er ikke ment å gi en fullstendig diskusjon om dimensjonal modelleringsutforming. Hvis du vil ha mer informasjon, kan du se allment publisert innhold, for eksempel Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling (3. utgave, 2013) av Ralph Kimball og andre.
Utforming av stjerneskjema
Stjerneskjema er en dimensjonal utformingsteknikk for modellering som er tatt i bruk av relasjonelle datalagre. Det er en anbefalt utformingstilnærming å ta når du oppretter et Fabric Warehouse. Et stjerneskjema består av faktatabeller og dimensjonstabeller.
- Dimensjonstabeller beskriver enhetene som er relevante for organisasjonen og analysekravene. Generelt representerer de tingene du modellerer. Ting kan være produkter, personer, steder eller andre konsepter, inkludert dato og klokkeslett. Hvis du vil ha mer informasjon og utforme anbefalte fremgangsmåter, kan du se Dimensjonstabeller i denne serien.
- Faktatabeller lagrer målinger som er knyttet til observasjoner eller hendelser. De kan lagre salgsordrer, børssaldoer, valutakurser, temperaturmålinger og mer. Faktatabeller inneholder dimensjonsnøkler sammen med detaljerte verdier som kan aggregeres. Hvis du vil ha mer informasjon og utforme anbefalte fremgangsmåter, kan du se Faktatabeller i denne serien.
En utforming av stjerneskjema er optimalisert for analytiske spørringsarbeidsbelastninger. Derfor regnes det som en forutsetning for semantiske modeller for enterprise Power BI. Analysespørringer er opptatt av filtrering, gruppering, sortering og oppsummering av data. Faktadata oppsummeres i konteksten til filtre og grupperinger av de relaterte dimensjonstabellene.
Grunnen til at det kalles et stjerneskjema er fordi en faktatabell danner midten av en stjerne, mens de relaterte dimensjonstabellene danner stjernepunktene.
Et stjerneskjema inneholder ofte flere faktatabeller, og derfor flere stjerner.
Et godt utformet stjerneskjema gir spørringer med høy ytelse (relasjonelle) på grunn av færre tabellsammenføyninger, og den høyere sannsynligheten for nyttige indekser. Et stjerneskjema krever også ofte lite vedlikehold etter hvert som utformingen av datalageret utvikler seg. Hvis du for eksempel legger til en ny kolonne i en dimensjonstabell for å støtte analyse av et nytt attributt, er det en relativt enkel oppgave å utføre. Det samme er å legge til nye fakta og dimensjoner etter hvert som omfanget av datalageret utvikler seg.
Med jevne mellomrom, kanskje daglig, oppdateres tabellene i en dimensjonal modell og lastes inn av en pakke-, transformerings- og belastningsprosess (ETL). Denne prosessen synkroniserer dataene med kildesystemene, som lagrer driftsdata. Hvis du vil ha mer informasjon, kan du se Laste inn tabeller i denne serien.
Dimensjonal modellering for Power BI
For virksomhetsløsninger er en dimensjonal modell i et Fabric Warehouse en anbefalt forutsetning for å opprette en Semantisk Power BI-modell. Ikke bare støtter den dimensjonale modellen semantisk modell, men den er også en kilde til data for andre opplevelser, som maskinlæringsmodeller.
I bestemte tilfeller er det imidlertid kanskje ikke den beste tilnærmingen. Selvbetjente analytikere som for eksempel trenger frihet og smidighet til å handle raskt, og uten avhengighet av IT, kan opprette semantiske modeller som kobler direkte til kildedata. I slike tilfeller er teorien om dimensjonal modellering fortsatt relevant. Denne teorien hjelper analytikere med å opprette intuitive og effektive modeller, samtidig som de unngår behovet for å opprette og laste inn en dimensjonal modell i et datalager. I stedet kan en kvasidimensjonal modell opprettes ved hjelp av Power Query, som definerer logikken å koble til, og transformere, kildedata for å opprette og laste inn semantiske modelltabeller. Hvis du vil ha mer informasjon, kan du se Forstå stjerneskjema og viktigheten for Power BI.
Viktig
Når du bruker Power Query til å definere en dimensjonal modell i den semantiske modellen, kan du ikke administrere historiske endringer, noe som kan være nødvendig for å analysere fortiden nøyaktig. Hvis dette er et krav, bør du opprette et datalager og tillate periodiske ETL-prosesser å registrere og lagre dimensjonsendringer på riktig måte.
Planlegging for et datalager
Du bør nærme deg oppretting av et datalager og utformingen av en dimensjonsmodell som et seriøst og viktig foretak. Det er fordi datalageret er en kjernekomponent i dataplattformen. Det bør danne et solid fundament som støtter analyse og rapportering – og derfor beslutningstaking – for hele organisasjonen.
Til dette formål bør datalageret strebe etter å lagre kvalitet, samsvarende og historisk nøyaktige data som én enkelt versjon av sannheten. Det bør levere forståelige og navigerbare data med rask ytelse, og fremtvinge tillatelser slik at de riktige dataene bare kan nås av de riktige personene. Prøv å utforme datalageret for robusthet, slik at det kan tilpasse seg endringer etter hvert som kravene dine utvikler seg.
Vellykket implementering av et datalager avhenger av god planlegging. Hvis du vil ha informasjon om strategiske og taktiske hensyn og gjøremål som fører til vellykket innføring av Fabric og datalageret, kan du se veikartet for innføring av Microsoft Fabric.
Tips
Vi anbefaler at du bygger ut virksomhetsdatalageret iterativt. Start med de viktigste emneområdene først, og deretter utvider du datalageret med andre emneområder over tid, i henhold til prioritet og ressurser.
Relatert innhold
I den neste artikkelen i denne serien kan du lære mer om veiledning og utforme anbefalte fremgangsmåter for dimensjonstabeller.