Dimensionale modellering in Microsoft Fabric Warehouse
Van toepassing op:✅ SQL Analytics-eindpunt en -magazijn in Microsoft Fabric
Dit artikel is de eerste in een reeks over dimensionale modellering in een magazijn. Het biedt praktische richtlijnen voor Warehouse in Microsoft Fabric. Dit is een ervaring die veel T-SQL-mogelijkheden ondersteunt, zoals het maken van tabellen en het beheren van gegevens in tabellen. U hebt dus volledige controle over het maken van uw dimensionale modeltabellen en het laden ervan met gegevens.
Notitie
In dit artikel verwijst de term datawarehouse naar een datawarehouse voor ondernemingen, dat een uitgebreide integratie van kritieke gegevens in de hele organisatie biedt. Het zelfstandige termenwarehouse verwijst daarentegen naar een Fabric Warehouse, een saaS-aanbieding (software as a service) voor relationele databases die u kunt gebruiken om een datawarehouse te implementeren. Voor de duidelijkheid wordt in dit artikel het laatste genoemd als Fabric Warehouse.
Tip
Als u onervaren bent met dimensionale modellering, moet u er rekening mee houden dat deze reeks artikelen uw eerste stap is. Het is niet bedoeld om een volledige discussie te bieden over dimensionale modelleringsontwerpen. Raadpleeg voor meer informatie rechtstreeks gepubliceerde inhoud, zoals The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling (3e editie, 2013) door Ralph Kimball en anderen.
Ontwerp stervormig schema
Stervormig schema is een dimensionale modelleringsontwerptechniek die wordt gebruikt door relationele datawarehouses. Het is een aanbevolen ontwerpmethode voor het maken van een fabricwarehouse. Een stervormig schema bestaat uit feitentabellen en dimensietabellen.
- Dimensietabellen beschrijven de entiteiten die relevant zijn voor uw organisatie- en analysevereisten. In grote lijnen vertegenwoordigen ze de dingen die u modelleren. Dingen kunnen producten, personen, plaatsen of een ander concept zijn, inclusief datum en tijd. Zie Dimensietabellen in deze reeks voor meer informatie en aanbevolen procedures voor ontwerpen.
- Feitentabellen slaan metingen op die zijn gekoppeld aan waarnemingen of gebeurtenissen. Ze kunnen verkooporders, aandelensaldi, wisselkoersen, temperatuurmetingen en meer opslaan. Feitentabellen bevatten dimensiesleutels samen met gedetailleerde waarden die kunnen worden geaggregeerd. Zie Feitentabellen in deze reeks voor meer informatie en het ontwerpen van aanbevolen procedures.
Een stervormig schemaontwerp is geoptimaliseerd voor analytische queryworkloads. Daarom wordt het beschouwd als een vereiste voor semantische Power BI-modellen voor ondernemingen. Analysequery's hebben betrekking op filteren, groeperen, sorteren en samenvatten van gegevens. Feitengegevens worden samengevat in de context van filters en groeperingen van de gerelateerde dimensietabellen.
De reden waarom het een stervormig schema wordt genoemd, is omdat een feitentabel het midden van een ster vormt terwijl de gerelateerde dimensietabellen de punten van de ster vormen.
Een stervormig schema bevat vaak meerdere feitentabellen en dus meerdere sterren.
Een goed ontworpen stervormig schema levert query's met hoge prestaties (relationele) vanwege minder tabelsamenvoegingen en de hogere kans op nuttige indexen. Een stervormig schema vereist vaak weinig onderhoud naarmate het datawarehouse-ontwerp zich ontwikkelt. Het toevoegen van een nieuwe kolom aan een dimensietabel ter ondersteuning van analyse door een nieuw kenmerk is bijvoorbeeld een relatief eenvoudige taak die moet worden uitgevoerd. Zoals het toevoegen van nieuwe feiten en dimensies naarmate het bereik van het datawarehouse zich ontwikkelt.
De tabellen in een dimensional model worden periodiek, mogelijk dagelijks, bijgewerkt en geladen door een ETL-proces (Extract, Transform en Load). Met dit proces worden de gegevens gesynchroniseerd met de bronsystemen, waarin operationele gegevens worden opgeslagen. Zie Tabellen laden in deze reeks voor meer informatie.
Dimensionale modellering voor Power BI
Voor bedrijfsoplossingen is een dimensional model in een Fabric Warehouse een aanbevolen vereiste voor het maken van een semantisch Power BI-model. Het dimensionale model ondersteunt niet alleen het semantische model, maar het is ook een gegevensbron voor andere ervaringen, zoals machine learning-modellen.
In specifieke omstandigheden is dit echter niet de beste aanpak. Selfserviceanalisten die vrijheid en flexibiliteit nodig hebben om snel te handelen, en zonder afhankelijkheid van IT, kunnen semantische modellen maken die rechtstreeks verbinding maken met brongegevens. In dergelijke gevallen is de theorie van dimensionale modellering nog steeds relevant. Deze theorie helpt analisten intuïtieve en efficiënte modellen te maken, terwijl ze voorkomen dat een dimensional model in een datawarehouse hoeft te worden gemaakt en geladen. In plaats daarvan kan een quasidimensionaal model worden gemaakt met behulp van Power Query, waarmee de logica wordt gedefinieerd waarmee verbinding moet worden gemaakt en waarmee brongegevens kunnen worden gemaakt en geladen om de semantische modeltabellen te maken en te laden. Zie Meer informatie over stervormige schema's en het belang van Power BI.
Belangrijk
Wanneer u Power Query gebruikt om een dimensional model in het semantische model te definiëren, kunt u historische wijzigingen niet beheren. Dit kan nodig zijn om het verleden nauwkeurig te analyseren. Als dat een vereiste is, moet u een datawarehouse maken en periodieke ETL-processen toestaan om dimensiewijzigingen vast te leggen en op de juiste manier op te slaan.
Planning voor een datawarehouse
U moet het maken van een datawarehouse en het ontwerp van een dimensiemodel benaderen als een serieuze en belangrijke onderneming. Dat komt doordat het datawarehouse een kernonderdeel van uw gegevensplatform is. Het moet een solide basis vormen die ondersteuning biedt voor analyse en rapportage en daarom besluitvorming voor uw hele organisatie.
Daarom moet uw datawarehouse streven naar het opslaan van kwaliteit, conforme en historisch nauwkeurige gegevens als één versie van de waarheid. Het moet begrijpelijke en navigeerbare gegevens leveren met snelle prestaties en machtigingen afdwingen, zodat de juiste gegevens alleen toegankelijk zijn voor de juiste personen. Probeer uw datawarehouse te ontwerpen voor tolerantie, zodat het zich kan aanpassen aan wijzigingen naarmate uw vereisten zich ontwikkelen.
De succesvolle implementatie van een datawarehouse is afhankelijk van een goede planning. Voor informatie over strategische en tactische overwegingen en actie-items die leiden tot een succesvolle acceptatie van Fabric en uw datawarehouse, raadpleegt u de roadmap voor acceptatie van Microsoft Fabric.
Tip
U wordt aangeraden uw datawarehouse iteratief uit te bouwen. Begin eerst met de belangrijkste onderwerpen en breid vervolgens na verloop van tijd het datawarehouse uit met andere onderwerpen.
Gerelateerde inhoud
In het volgende artikel in deze reeks vindt u informatie over richtlijnen en aanbevolen procedures voor het ontwerpen van dimensietabellen.