Dimensionel modellering i Microsoft Fabric Warehouse
Gælder for:✅ SQL Analytics-slutpunkt og warehouse i Microsoft Fabric
Denne artikel er den første i en serie om dimensionel modellering i et lager. Den indeholder praktisk vejledning til Warehouse i Microsoft Fabric, som er en oplevelse, der understøtter mange T-SQL-funktioner, f.eks. oprettelse af tabeller og administration af data i tabeller. Så du har fuld kontrol over, hvordan du opretter tabeller med din dimensionelle model og indlæser dem med data.
Bemærk
I denne artikel henviser begrebet data warehouse til et virksomhedsdata warehouse, som leverer omfattende integration af vigtige data på tværs af organisationen. I modsætning hertil refererer det separate begreb warehouse til et Fabric Warehouse, som er en SaaS-relationsdatabase (software as a service), som du kan bruge til at implementere et data warehouse. For klarheds skyld nævnes sidstnævnte i denne artikel som Fabric Warehouse.
Tip
Hvis du er uerfaren med dimensionel modellering, skal du overveje, at denne serie af artikler er dit første skridt. Det er ikke hensigten at give en komplet diskussion om dimensionel udformning design. Du kan finde flere oplysninger i det publicerede indhold, der er vedtaget i vid udstrækning, f.eks . The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling (3. udgave, 2013) af Ralph Kimball og andre.
Design af stjerneskemaer
Stjerneskema er en designteknik til dimensionsmodellering, der anvendes af relationsdata warehouses. Det er en anbefalet designtilgang, når du opretter et Fabric Warehouse. Et stjerneskema består af faktatabeller og dimensionstabeller.
- Dimensionstabeller beskriver de enheder, der er relevante for din organisation, og analysekrav. De repræsenterer stort set de ting, du modellerer. Ting kan være produkter, personer, steder eller andre koncepter, herunder dato og klokkeslæt. Du kan få flere oplysninger og designe bedste praksis i Dimensionstabeller i denne serie.
- Faktatabeller gemmer målinger, der er knyttet til observationer eller hændelser. De kan gemme salgsordrer, lagersaldi, valutakurser, temperaturaflæsninger og meget mere. Faktatabeller indeholder dimensionsnøgler sammen med detaljerede værdier, der kan aggregeres. Du kan få flere oplysninger og designe bedste praksis i Faktatabeller i denne serie.
Et stjerneskemadesign er optimeret til arbejdsbelastninger i analyseforespørgsler. Derfor anses det for at være en forudsætning for semantiske Power BI-virksomhedsmodeller. Analyseforespørgsler vedrører filtrering, gruppering, sortering og opsummering af data. Faktadata opsummeres i forbindelse med filtre og grupperinger af de relaterede dimensionstabeller.
Grunden til, at det kaldes et stjerneskema, er, at en faktatabel udgør midten af en stjerne, mens de relaterede dimensionstabeller udgør stjernens punkter.
Et stjerneskema indeholder ofte flere faktatabeller og derfor flere stjerner.
Et veldesignet stjerneskema leverer forespørgsler med høj ydeevne (relationelle) på grund af færre tabeljoinforbindelser og den højere sandsynlighed for nyttige indekser. Et stjerneskema kræver også ofte lav vedligeholdelse i takt med, at data warehouse-designet udvikler sig. Det er f.eks. en relativt enkel opgave at føje en ny kolonne til en dimensionstabel for at understøtte analyse af en ny attribut. Som det er at tilføje nye fakta og dimensioner i takt med, at omfanget af data warehouse udvikler sig.
Tabellerne i en dimensionsmodel opdateres og indlæses jævnligt, måske dagligt, af en ETL-proces (Extract, Transform og Load). Denne proces synkroniserer dataene med kildesystemerne, som gemmer driftsdata. Du kan få flere oplysninger under Indlæs tabeller i denne serie.
Dimensionel modellering til Power BI
I forbindelse med virksomhedsløsninger er en dimensionel model i et Fabric Warehouse en anbefalet forudsætning for at oprette en semantisk Power BI-model. Den dimensionelle model understøtter ikke kun den semantiske model, men den er også en datakilde til andre oplevelser, f.eks . modeller til maskinel indlæring.
Men under særlige omstændigheder er det muligvis ikke den bedste fremgangsmåde. Selvbetjente analytikere, der har brug for frihed og fleksibilitet til at handle hurtigt og uden afhængighed af it, kan f.eks. oprette semantiske modeller, der opretter direkte forbindelse til kildedata. I sådanne tilfælde er teorien om dimensionel modellering stadig relevant. Denne teori hjælper analytikere med at oprette intuitive og effektive modeller, samtidig med at de undgår behovet for at oprette og indlæse en dimensionel model i et data warehouse. I stedet kan der oprettes en kvasidimensionel model ved hjælp af Power Query, som definerer logikken til at oprette forbindelse til og transformere kildedata for at oprette og indlæse de semantiske modeltabeller. Du kan få flere oplysninger under Forstå stjerneskemaet og vigtigheden af Power BI.
Vigtigt
Når du bruger Power Query til at definere en dimensionel model i den semantiske model, kan du ikke administrere historiske ændringer, hvilket kan være nødvendigt for at analysere fortiden præcist. Hvis det er et krav, skal du oprette et data warehouse og tillade, at periodiske ETL-processer registrerer og gemmer dimensionsændringer korrekt.
Planlægning af et data warehouse
Du bør nærme dig oprettelsen af et data warehouse og designet af en dimensionsmodel som en seriøs og vigtig virksomhed. Det skyldes, at data warehouse'et er en kernekomponent i din dataplatform. Det bør danne et solidt grundlag, der understøtter analyse og rapportering – og derfor beslutningstagning – for hele organisationen.
Til dette formål bør dit data warehouse bestræbe sig på at gemme kvalitet, overensstemmende og historisk nøjagtige data som en enkelt version af sandheden. Den skal levere forståelige og navigerbare data med hurtig ydeevne og gennemtvinge tilladelser, så de rette data kun kan tilgås af de rette personer. Stræb efter at designe dit data warehouse til robusthed, så det kan tilpasse sig ændringer, efterhånden som dine krav udvikler sig.
En vellykket implementering af et data warehouse afhænger af god planlægning. Du kan få oplysninger om strategiske og taktiske overvejelser og handlingselementer, der fører til en vellykket implementering af Fabric og dit data warehouse, i Microsoft Fabric-implementeringsoversigten.
Tip
Vi anbefaler, at du bygger dit virksomhedsdata warehouse iterativt. Start med de vigtigste emneområder først, og udvid derefter med tiden i henhold til prioritet og ressourcer data warehouse med andre emneområder.
Relateret indhold
I den næste artikel i denne serie kan du få mere at vide om vejledning og design af bedste praksis for dimensionstabeller.