Een model vernieuwen en de functie verbeteren

Voltooid

Voordat u verder verkent hoe u het vernieuwen en functioneren van een model kunt verbeteren, moet u weten hoe Power BI gegevens opslaat. Net als bij de hyperbestanden van Tableau slaat Power BI gegevens op als een kolomdatabase.

Schermopname van de op rijen gebaseerde database en power BI-kolomdatabase.

Notitie

In een kolomdatabase wordt elke kolom opgeslagen als een eigen bestand in plaats van de gegevens rij voor rij (database op basis van rijen).

Het opslaan van uw gegevens als een kolomdatabase is ideaal voor lange tabellen waarbij het ophalen van rijen voor een kolom veel sneller gaat. Gegevens in één kolom zijn altijd van hetzelfde type, zoals een tekenreeks of geheel getal. Omdat alle vermeldingen van een type zijn gegroepeerd, kunnen ze efficiënter worden gecomprimeerd, wat leidt tot betere prestaties wanneer u grote hoeveelheden gegevens analyseert.

Notitie

Power BI probeert deze kolommen ook optimaal op te slaan door ze te groeperen, zoals items. Nadat de kolommen zijn gegroepeerd, wordt een woordenlijst met toegewezen afzonderlijke waarden gemaakt.

Een model verbeteren

Houd rekening met de volgende factoren wanneer u de prestaties van een model wilt verbeteren:

  • Kardinaliteit

  • LEGE WAARDEN wijzigen in waarden

  • Overbodige en overbodige velden verwijderen

  • Stervormige schema's

  • Automatische datum/tijd

  • Gehele getallen versus tekenreeksen

Velden met hoge kardinaliteit verwijderen

Kardinaliteit verwijst naar het aantal unieke waarden in een databasekolom of -veld. Waarden met een hoge kardinaliteit zijn doorgaans identificatienummers, e-mailadressen of gebruikersnamen.

Schermopnamevoorbeeld van een gegevenstabelkolom met een hoge kardinaliteit is een tabel USERS met een kolom met de naam USER_ID.

De eerste overweging is het verwijderen van velden met hoge kardinaliteit. Als u voor elke rij een unieke id hebt, verwijdert u dat veld. Hoe hoger de kardinaliteit, hoe duurder het is om op te slaan; unieke waarden zijn gelijk aan hoge kosten.

Een veelvoorkomend probleem is een datum/tijd-veld , waarbij de combinatie van de datum en tijd de kardinaliteit van het veld verhoogt. U kunt dit probleem oplossen door het veld op te splitsen in afzonderlijke datum- en tijdvelden.

LEGE WAARDEN wijzigen in waarden

Wanneer u metingen schrijft, kunt u scenario's tegenkomen waarin een zinvolle waarde niet kan worden geretourneerd. In deze gevallen kunt u in de verleiding komen om in plaats daarvan een waarde, zoals nul, te retourneren. Omwille van de prestaties moet u deze verleiding opnieuw overwegen.

Tijdens de meeste berekeningen worden BLANK-waarden genegeerd, maar de nulwaarden niet. Als u de BLANK-waarden converteert naar nul, wordt de berekening gedwongen meer rijen te evalueren en een grote queryresultatenset te retourneren, wat vaak leidt tot trage rapportweergave. Met andere woorden, het converteren van de BLANK-waarden naar nul draagt bij aan de berekeningskosten.

Overbodige en overbodige velden verwijderen

Het verwijderen van overbodige en overbodige velden is belangrijk omdat u probeert de breedte van uw tabellen te beperken, waardoor de vernieuwingsprestaties worden verbeterd. Normaal gesproken kunt u redundante velden verwijderen omdat u een star schema hebt gemaakt en u niet nodig hebt dat hetzelfde veld meerdere keren wordt weergegeven. Met onnodige velden bepaalt u welke velden worden gebruikt bij het importeren. Het is het beste om klein te beginnen en te groeien in plaats van al uw gegevens samen te voegen in één enorme gegevensset.

Krachtige modellen maken met star schema's

Stervormig schemaontwerp is relevant voor het ontwikkelen van krachtige, bruikbare Power BI-modellen. Elk Power BI-rapport maakt een query die wordt verzonden naar het Power BI-model. Deze query's worden gebruikt om de modelgegevens te filteren, te groeperen en samen te vatten. Een goed ontworpen model biedt tabellen voor filteren, groeperen en samenvatten.

Notitie

Een star-schema is een type gegevensmodelleringsschema met één feitentabel in het midden en verschillende gekoppelde dimensietabellen rond de feitentabel. Sterschema's zijn geoptimaliseerd voor het uitvoeren van query's op grote gegevenssets.

Dit goed ontworpen model werkt goed met de star schemavereisten:

  • De dimensietabellen ondersteunen filteren en groeperen

  • De feitentabel ondersteunt samenvatting

Een star schema voorkomt de berekening en verwerking van toevoegingskoppelingen die u uit een snowflake-schema krijgt, maar biedt nog steeds het voordeel van verkorte gegevens die een platte tabel niet kan bieden.

Automatische datum/tijd uitschakelen

Automatische datum/tijd is een optie voor het laden van gegevens in Power BI Desktop die ondersteuning biedt voor nuttige time intelligence-rapportage op basis van datumkolommen die in een model worden geladen. Als deze optie is ingeschakeld, maakt Power BI Desktop verborgen datum-/tijdtabellen achter elk datumveld in uw gegevensset.

Met al deze verborgen datum-/tijdtabellen en datumvelden samen, neemt de grootte van uw model aanzienlijk toe. Door de modelgrootte te verkleinen, worden de prestaties geoptimaliseerd, met name bij grotere gegevenssets. Optimaal zou u één datumtabel maken en er een koppeling naar maken. U kunt ook andere datumdimensionaliteiten toevoegen met uw eigen datumtabel die meer functionaliteit kunnen bieden dan de verborgen tabel met automatische datum/tijd.

Gebruik de volgende procedure om de optie Automatische datum/tijd in Power BI uit te schakelen.

  1. Selecteer Bestandsopties > en -instellingen.

  2. Selecteer Opties.

    Schermopname van de opties en instellingen die worden gebruikt om Automatische datum/tijd uit te schakelen.

  3. Selecteer de optie Gegevens laden in de sectie Algemeen of Huidig bestand .

  4. Schakel het selectievakje Automatische datum/tijd voor nieuwe bestanden in de sectie Time intelligence uit.

Gehele getallen over tekenreeksen gebruiken

Gehele getallen zijn om twee redenen beter dan tekenreeksen:

  • Het vergelijken van een geheel getal met een ander geheel getal is sneller dan het koppelen van een tekenreeks aan een tekenreeks.

  • Tekenreeksen moeten zo worden opgeslagen dat u eerst de index moet vinden en vervolgens de waarde.

Naar tekenreeksen wordt twee keer verwezen, terwijl naar gehele getallen slechts één keer wordt verwezen.

Zie Meer informatie over stervormige schema's en het belang daarvan voor Power BI voor meer informatie.