Inleiding

Voltooid

Het maken van een geweldig semantisch model is een van de belangrijkste taken die een gegevensanalist kan uitvoeren in Microsoft Power BI. Door dit probleem te verhelpen, kunt u ervoor zorgen dat mensen uw gegevens gemakkelijker kunnen begrijpen, waardoor het bouwen van waardevolle Power BI-rapporten eenvoudiger voor hen en voor u is.

De pagina's in deze module zijn alleen instructief, er worden geen gegevensbestanden opgegeven. U hebt de kans om te werken met echte gegevens in de labs.

Een goed semantisch model biedt de volgende voordelen:

  • Gegevens verkennen gaat sneller.

  • Aggregaties zijn eenvoudiger te bouwen.

  • Rapporten zijn nauwkeuriger.

  • Het schrijven van rapporten neemt minder tijd in beslag.

  • Rapporten zijn in de toekomst eenvoudiger te onderhouden.

Het opgeven van vaste regels voor wat een goed semantisch model maakt, is moeilijk omdat alle gegevens verschillend zijn en het gebruik van die gegevens varieert. Over het algemeen is een kleiner semantisch model beter omdat het sneller presteert en eenvoudiger te gebruiken is. Het definiëren van wat een kleiner semantisch model inhoudt, is echter net zo problematisch omdat het een heuristisch en subjectief concept is.

Normaal gesproken bestaat een kleiner semantisch model uit minder tabellen en minder kolommen in elke tabel die de gebruiker kan zien. Als u alle benodigde tabellen uit een verkoopdatabase importeert, maar het totaal aantal tabellen is 30, zal de gebruiker dat niet intuïtief vinden. Als u deze tabellen in vijf tabellen samenvouwt, wordt het semantische model intuïtiever voor de gebruiker. Als de gebruiker een tabel opent en 100 kolommen vindt, kan het overweldigend zijn. Als u overbodige kolommen verwijdert om een beter beheerbaar getal te bieden, neemt de kans toe dat de gebruiker alle kolomnamen leest. Samenvattend moet u streven naar eenvoud bij het ontwerpen van uw semantische modellen.

De volgende afbeelding is een voorbeeld van een semantisch model. De vakken bevatten tabellen met gegevens, waarbij elk regelitem in het vak een kolom is. De lijnen die de vakken verbinden, vertegenwoordigen relaties tussen de tabellen. Deze relaties kunnen complex zijn, zelfs in een dergelijk simplistisch model. Het semantische model kan gemakkelijk ongeorganiseerd raken en het totale aantal tabellen in het model kan geleidelijk toenemen. Om uw semantische model eenvoudig, uitgebreid en nauwkeurig te houden, is constante inspanning vereist.

Schermopname van het voorbeeld van een semantisch model met veel relaties.

Relaties worden gedefinieerd tussen tabellen via primaire en refererende sleutels. Primaire sleutels is een kolom of zijn kolommen waarmee elke unieke, niet-null gegevensrij wordt geïdentificeerd. Als u bijvoorbeeld een tabel Klanten hebt, kunt u een index hebben die elke unieke klant identificeert. De eerste rij heeft een id van 1, de tweede rij een id van 2, enzovoort. Aan elke rij wordt een unieke waarde toegewezen, waarnaar kan worden verwezen met deze eenvoudige waarde: de primaire sleutel. Dit proces wordt belangrijk wanneer u verwijst naar rijen in een andere tabel. Dit is wat refererende sleutels doen. Relaties tussen tabellen worden gevormd wanneer u primaire en refererende sleutels in verschillende tabellen gebruikt.

Power BI maakt het mogelijk om relaties te bouwen op basis van tabellen met verschillende gegevensbronnen, een krachtige functie waarmee u één tabel kunt ophalen uit Microsoft Excel en een andere uit een relationele database. Vervolgens maakt u de relatie tussen deze twee tabellen en behandelt u deze als een uniform semantisch model.

Nu u meer hebt geleerd over de relaties waaruit het gegevensschema bestaat, kunt u een specifiek type schemaontwerp verkennen, het star schema, dat is geoptimaliseerd voor hoge prestaties en bruikbaarheid.

Stervormige schema's

U kunt een stervormig schema ontwerpen om uw gegevens te vereenvoudigen. Het is niet de enige manier om uw gegevens te vereenvoudigen, maar het is een populaire methode. Daarom moet elke Power BI-gegevensanalist deze begrijpen. In een star-schema wordt elke tabel in uw semantische model gedefinieerd als een dimensie- of feitentabel, zoals wordt weergegeven in de volgende visual.

Afbeelding van het stervormige schema met een feitentabel in het midden en dimensietabellen op elk van de vijf punten.

Feitentabellen bevatten waarden voor waarnemings- of gebeurtenisgegevens: verkooporders, producttellingen, prijzen, transactiedatums en -tijden en hoeveelheden. Feitentabellen kunnen verschillende herhaalde waarden bevatten. Zo kan een product bijvoorbeeld meerdere malen in meerdere rijen verschijnen, voor verschillende klanten op verschillende datums. Deze waarden kunnen worden gecombineerd om visuals te maken. Zo is een visualisatie van de totale verkooporders een aggregatie van alle verkooporders in de feitentabel. Met feitentabellen is het gebruikelijk om kolommen weer te geven die zijn gevuld met getallen en datums. De getallen kunnen maateenheden zijn, zoals het verkoopbedrag of ze kunnen sleutels zijn, zoals een klant-id. De datums vertegenwoordigen de tijd die wordt vastgelegd, zoals de order- of verzenddatum.

Dimensietabellen bevatten de details over de gegevens in feitentabellen: producten, locaties, werknemers en ordertypen. Deze tabellen zijn verbonden met de feitentabel via sleutelkolommen. Dimensietabellen worden gebruikt voor het filteren en groeperen van de gegevens in feitentabellen. De feitentabellen bevatten daarentegen de meetbare gegevens, zoals verkoop en omzet, en elke rij vertegenwoordigt een unieke combinatie van waarden uit de dimensietabellen. Voor de weergave van de totale verkooporders zou u de gegevens kunnen groeperen, zodat u de totale verkooporders per product ziet, waarbij het product de gegevens in de dimensietabel vertegenwoordigt.

Feitentabellen zijn veel groter dan dimensietabellen omdat er talloze gebeurtenissen voorkomen in feitentabellen, zoals afzonderlijke verkopen. Dimensietabellen zijn doorgaans kleiner, omdat u beperkt bent tot het aantal items dat u kunt filteren en groeperen. Een jaar bevat bijvoorbeeld slechts zoveel maanden en de Verenigde Staten bestaan uit slechts een bepaald aantal staten.

Als u nadenkt over deze informatie over feiten- en dimensietabellen, vraagt u zich misschien af hoe u deze visuals in Power BI kunt bouwen.

De relevante gegevens bevinden zich in twee tabellen, Werknemer en Verkoop, zoals wordt weergegeven in het volgende semantische model. Omdat de tabel Sales de waarden van de verkooporders bevat, die kunnen worden geaggregeerd, wordt de tabel als een feitentabel gezien. De tabel Employee bevat de specifieke naam van de werknemer, waarmee de verkooporders worden gefilterd, zodat deze een dimensietabel zou zijn. De gemeenschappelijke kolom tussen de twee tabellen, die de primaire sleutel is in de tabel Employee, is EmployeeID, zodat u een relatie tussen de twee tabellen kunt instellen op basis van deze kolom.

Schermopname van de Semantische modelrelaties.

Wanneer u deze relatie maakt, kunt u de visual maken aan de hand van de vereisten, zoals wordt weergegeven in de volgende afbeelding. Als u deze relatie niet had ingesteld, terwijl u met de gemeenschappelijkheid tussen de twee tabellen rekening hield, zou u meer moeite hebben gehad met het maken van uw visuals.

Schermopname van het voorbeeldresultaat van het stervormige schema.

Sterschema's en het onderliggende semantische model vormen de basis van georganiseerde rapporten; Hoe meer tijd u besteedt aan het maken van deze verbindingen en het ontwerp, hoe eenvoudiger het is om rapporten te maken en te onderhouden.