Relaties

Voltooid

Overzicht

Relaties zijn belangrijk, vooral als het gaat om uw gegevens.

Met relaties kunnen gebruikers query's uitvoeren op gegevens uit meerdere tabellen. De enige manier om deze methode te gebruiken, is via een overeenkomend veld tussen de meerdere tabellen. Power BI verwijst naar dit veld als een relatieveld.

Een relatieweergave in Power BI met meerdere relatievelden.

Video: Demo van Geavanceerde editor

Voordat u het belang van het relatieveld verder verkent, moet u meer weten over dimensionale modellering, waarmee u uw relatiemodel beter kunt structureren. Inmiddels moet u praktische ervaring hebben met het maken van een snowflake-vertakking op uw model, naast inzicht in het verschil tussen dimensie- en feitentabellen en tussen genormaliseerde en gedenormaliseerde tabellen.

Als u nog niet de mogelijkheid hebt gehad om deze dimensionale modelleringsconcepten te leren, bieden de volgende secties een opfrisser.

Snowflake-schema

Een snowflake-model, of sneeuwvlokschema, is wanneer er veel relaties tussen tabellen optreden en u meerdere relaties moet doorgeven om van de ene tabel naar de andere te gaan. Dit model lijkt meestal op een sneeuwvlokshape met feitentabellen (meestal in het midden) die zijn verbonden met meerdere dimensietabellen. Het principe achter een snowflake-model is het normaliseren van de dimensietabellen, het verwijderen van kenmerken met een lage kardinaliteit en het maken van hun eigen tabellen. In de volgende schermopname ziet u een voorbeeld van een snowflake-model.

Een voorbeeld van een Snowflake-schema in Power BI.

Feitentabellen

Het vorige schema heeft slechts één feitentabel: Verkoopfeit. Deze tabel Verkoopfeit bevat metingen of de kwantitatieve kenmerken, zoals de velden Korting, Hoeveelheid en Totaal . De tabel Verkoopfeit bevat ook de relatievelden (refererende sleutels) waarmee gebruikers kunnen verwijzen naar andere dimensietabellen in het schema. Als u bijvoorbeeld de totale verkoop voor een klant wilt weten, moet u de velden CustomerID gebruiken in de tabel Sales Fact en de tabel Customer Dim.

Dimensietabellen

U ziet dat het snowflake-schema zeven dimensietabellen bevat:

  • Tijdsdim

  • Product Dim

  • ProductCategory Dim

  • Klant dim

  • Stadsdymp

  • Werknemer dim

  • Afdelingsdymp

Elke dimensietabel bevat unieke, beschrijvende kenmerken die meer betekenis geven aan de metingen in de tabel Sales Fact, zoals CustomerID, EmployeeID en ProductID. Met deze velden kunt u erachter komen welk product het meest wordt gekocht door verschillende klanten.

Genormaliseerde tabellen

Een genormaliseerde tabel is een tabel die is gemaakt in overeenstemming met een reeks normale formulieren om gegevensredundantie te verminderen en de gegevensintegriteit te verbeteren. In hetzelfde snowflake-model ziet u dat de gegevensredundantie niet aanwezig is in de dimensietabellen; elke dimensietabel heeft zijn eigen unieke kenmerken.

Power BI-specifieke relaties zijn de koppeling of het communicatiekanaal tussen de gemaakte tabellen. Jij hebt de controle over hen; u kunt de richting van de relatie en de velden bepalen.

Relatietypen

De drie relatietypen zijn een-op-een (1:1), een-op-veel (1:*) en veel-op-veel (*:*).

Een een-op-een-relatie betekent dat elke record in een tabel is gekoppeld aan één, en slechts één, record in een andere tabel. In het snowflake-model heeft elke klant bijvoorbeeld slechts één klant-id.

Een een-op-veel-relatie betekent dat een record in de ene tabel betrekking kan hebben op nul, één of veel records in een andere tabel. In het snowflake-model kan één klant bijvoorbeeld meerdere adressen hebben, afhankelijk van of de klant meerdere keren is verhuisd en of de klant aankopen heeft gedaan met behulp van de verschillende adressen.

Een veel-op-veel-relatie betekent dat nul, één of veel records in een tabel betrekking kunnen hebben op nul, één of veel records in een andere tabel. Met betrekking tot het vorige snowflake-model zou het voorbeeld zijn dat klanten verschillende producten kunnen kopen en veel klanten producten kunnen kopen.

Tableau vergeleken met Power BI

Tableau maakt doorgaans gebruik van één grote genormaliseerde tabel. U kunt joins van tevoren instellen, maar uw joins vergroten uw tabel, waardoor deze groter en langer wordt. Het resultaat is een gedenormaliseerde tabel. Als u tot 2018 pseudodimensionale modellering wilde uitvoeren, was de enige manier waarop u die taak kon uitvoeren door gegevens te combineren. Als u een id-veld in een dimensietabel hebt en u een uitgebreide niet-genormaliseerde tabel hebt, kunt u deze koppelen via wat Tableau een 'relatie' noemt. Met deze relatie wordt een koppelingspictogram gemaakt in het deelvenster Dimensies in Tableau Desktop, waarmee wordt aangegeven welke velden worden gebruikt in de gegevensmix. Hoewel deze functie handig is, is het uiteindelijk niet gebruikelijk in de Tableau Community.