Premium-functies van gegevensstromen
Gegevensstromen worden ondersteund voor gebruikers van Power BI Pro, PPU (Premium Per User) en Power BI Premium. Sommige functies zijn alleen beschikbaar met een Power BI Premium-abonnement (dit is een Premium-capaciteit of PPU-licentie). In dit artikel worden de PPU- en Premium-functies en het gebruik ervan beschreven en beschreven.
De volgende functies zijn alleen beschikbaar met Power BI Premium (PPU of een premium-capaciteitsabonnement):
- Verbeterde berekeningsengine
- DirectQuery
- Berekende entiteiten
- Gekoppelde entiteiten
- Incrementeel vernieuwen
In de volgende secties worden deze functies in detail beschreven.
Notitie
Gegevensstromen zijn niet beschikbaar in de Power BI-service voor DoD-klanten van de Amerikaanse overheid. Zie Beschikbaarheid van Power BI-functies voor amerikaanse overheidsklanten voor meer informatie over welke functies beschikbaar zijn en welke niet.
De verbeterde berekeningsengine
Dankzij de verbeterde berekeningsengine in Power BI kunnen Power BI Premium-abonnees hun capaciteit gebruiken om het gebruik van gegevensstromen te optimaliseren. Het gebruik van de verbeterde berekeningsengine biedt de volgende voordelen:
- Vermindert de vernieuwingstijd die nodig is voor langlopende ETL-stappen (extraheren, transformeren, laden) voor berekende entiteiten, zoals het uitvoeren van joins, distinct, filters en groeperen op.
- Voert DirectQuery-query's uit op entiteiten.
Notitie
- De validatie- en vernieuwingsprocessen informeren gegevensstromen van het modelschema. Als u het schema van de tabellen zelf wilt instellen, gebruikt u de Power Query-editor en stelt u gegevenstypen in.
- Deze functie is beschikbaar op alle Power BI-clusters, met uitzondering van WABI-INDIA-CENTRAL-A-PRIMARY
De verbeterde berekeningsengine inschakelen
Belangrijk
De verbeterde berekeningsengine werkt alleen voor A3 of grotere Power BI-capaciteiten.
In Power BI Premium wordt de verbeterde berekeningsengine afzonderlijk ingesteld voor elke gegevensstroom. Er zijn drie configuraties waaruit u kunt kiezen:
Uitgeschakeld
Geoptimaliseerd (standaard): de verbeterde berekeningsengine is uitgeschakeld. Deze functie wordt automatisch ingeschakeld wanneer naar een tabel in de gegevensstroom wordt verwezen door een andere tabel of wanneer de gegevensstroom is verbonden met een andere gegevensstroom in dezelfde werkruimte.
Aan
Voer de volgende stappen uit om de standaardinstelling te wijzigen en de verbeterde rekenengine in te schakelen:
Selecteer in uw werkruimte, naast de gegevensstroom waarvoor u de instellingen wilt wijzigen, De optie Meer opties.
Selecteer instellingen in het menu Meer opties van de gegevensstroom.
Vouw de instellingen van de verbeterde rekenengine uit.
Selecteer in de instellingen van de verbeterde berekeningsenginede optie Aan en kies vervolgens Toepassen.
De verbeterde rekenengine gebruiken
Nadat de verbeterde berekeningsengine is ingeschakeld, keert u terug naar gegevensstromen en ziet u een prestatieverbetering in elke berekende tabel die complexe bewerkingen uitvoert, zoals joins of groeperen op bewerkingen voor gegevensstromen die zijn gemaakt op basis van bestaande gekoppelde entiteiten op dezelfde capaciteit.
Als u optimaal gebruik wilt maken van de berekeningsengine, splitst u de ETL-fase op de volgende manier op in twee afzonderlijke gegevensstromen:
- Gegevensstroom 1 : deze gegevensstroom mag alleen alle vereiste gegevens uit een gegevensbron opnemen.
- Gegevensstroom 2: voer alle ETL-bewerkingen in deze tweede gegevensstroom uit, maar zorg ervoor dat u verwijst naar gegevensstroom 1, die dezelfde capaciteit moet hebben. Zorg er ook voor dat u bewerkingen uitvoert die eerst kunnen worden gevouwen: filteren, groeperen op, uniek, samenvoegen). En voer deze bewerkingen uit vóór een andere bewerking, om ervoor te zorgen dat de berekeningsengine wordt gebruikt.
Veelgestelde vragen en antwoorden
Vraag: Ik heb de verbeterde berekeningsengine ingeschakeld, maar mijn vernieuwingen zijn trager. Hoe kan dat?
Antwoord: Als u de verbeterde berekeningsengine inschakelt, zijn er twee mogelijke verklaringen die kunnen leiden tot tragere vernieuwingstijden:
Wanneer de verbeterde berekeningsengine is ingeschakeld, is er geheugen vereist om deze goed te laten functioneren. Als zodanig wordt het geheugen dat beschikbaar is voor het uitvoeren van een vernieuwing verminderd, waardoor de kans dat vernieuwingen in de wachtrij worden geplaatst, toeneemt. Die toename vermindert vervolgens het aantal gegevensstromen dat gelijktijdig kan worden vernieuwd. Als u dit probleem wilt oplossen, verhoogt u bij het inschakelen van verbeterde rekenkracht het geheugen dat is toegewezen voor gegevensstromen om ervoor te zorgen dat het geheugen dat beschikbaar is voor gelijktijdige gegevensstroomvernieuwingen hetzelfde blijft.
Een andere reden waarom u tragere vernieuwingen kunt tegenkomen, is dat de berekeningsengine alleen boven op bestaande entiteiten werkt. Als uw gegevensstroom verwijst naar een gegevensbron die geen gegevensstroom is, ziet u geen verbetering. Er zal geen prestatieverhoging optreden, omdat in sommige big data-scenario's de eerste leesbewerking uit een gegevensbron trager zou zijn omdat de gegevens moeten worden doorgegeven aan de verbeterde rekenengine.
Vraag: Ik zie de wisselknop verbeterde rekenengine niet. Hoe komt dat?
Antwoord: De verbeterde rekenengine wordt gefaseerd uitgebracht in regio's over de hele wereld, maar is nog niet in elke regio beschikbaar.
Vraag: Wat zijn de ondersteunde gegevenstypen voor de berekeningsengine?
Antwoord: De verbeterde berekeningsengine en gegevensstromen ondersteunen momenteel de volgende gegevenstypen. Als u voor uw gegevensstroom niet een van de volgende gegevenstypen gebruikt, treedt er een fout op tijdens het vernieuwen:
- Datum/tijd
- Decimaal getal
- Tekst
- Geheel getal
- Datum/tijd/zone
- Waar/onwaar
- Datum
- Tijd
DirectQuery gebruiken met gegevensstromen in Power BI
U kunt DirectQuery gebruiken om rechtstreeks verbinding te maken met gegevensstromen en tegelijkertijd verbinding maken met uw gegevensstroom zonder dat u de gegevens erin hoeft te importeren.
Door DirectQuery met gegevensstromen te gebruiken, worden de volgende verbeteringen aangebracht aan uw Power BI- en gegevensstroomprocessen:
Vermijd het gebruik van afzonderlijke vernieuwingsschema's: DirectQuery maakt rechtstreeks verbinding met een gegevensstroom, waardoor het niet meer nodig is om een geïmporteerde gegevensset te maken. Als zodanig betekent het dat als u DirectQuery met uw gegevensstromen gebruikt, u niet langer afzonderlijke vernieuwingsschema's nodig hebt voor de gegevensstroom en de gegevensset om er zeker van te zijn dat uw gegevens worden gesynchroniseerd.
Filteren van gegevens: DirectQuery is handig als u wilt werken met een gefilterde weergave van gegevens in een gegevensstroom. U kunt DirectQuery gebruiken met de berekeningsengine om gegevensstromen te filteren en te werken met de gefilterde subset die u nodig hebt. Door gegevens te filteren, kunt u werken met een kleinere en beter beheerbare subset van de gegevens in uw gegevensstroom.
DirectQuery gebruiken voor gegevensstromen
Het gebruik van DirectQuery met gegevensstromen is beschikbaar in Power BI Desktop.
Er zijn vereisten voor het gebruik van DirectQuery met gegevensstromen:
- Uw gegevensstroom moet zich bevinden in een werkruimte met Power BI Premium ingeschakeld.
- De berekeningsengine moet zijn ingeschakeld.
Zie DirectQuery gebruiken met gegevensstromen voor meer informatie over DirectQuery met gegevensstromen.
DirectQuery inschakelen voor gegevensstromen
De status van de verbeterde berekeningsengine moet Geoptimaliseerd zijn, om uw gegevensstroom beschikbaar te kunnen maken voor toegang door DirectQuery. Stel de nieuwe optie Instellingen voor de verbeterde berekeningsengine in op Aan, als u DirectQuery wilt inschakelen voor gegevensstromen.
Nadat u deze instelling hebt toegepast, vernieuwt u de gegevensstroom zodat de optimalisatie van kracht wordt.
Overwegingen en beperkingen voor DirectQuery
Er zijn enkele bekende beperkingen met betrekking tot DirectQuery en gegevensstromen:
Samengestelde/gemengde modellen met import- en DirectQuery-gegevensbronnen worden momenteel niet ondersteund.
Grote gegevensstromen kunnen problemen hebben met time-outproblemen bij het weergeven van visualisaties. Voor grote gegevensstromen met time-outproblemen moet de Import-modus worden gebruikt.
Onder instellingen voor gegevensbron worden in de gegevensstroomconnector ongeldige referenties weergegeven als u DirectQuery gebruikt. Deze waarschuwing heeft geen invloed op het gedrag en de gegevensset werkt goed.
Berekende entiteiten
U kunt berekeningen in de opslag uitvoeren wanneer u gegevensstromen gebruikt met een Power BI Premium-abonnement. Met deze functie kunt u berekeningen uitvoeren op uw bestaande gegevensstromen en resultaten retourneren waarmee u zich kunt richten op het maken en analyseren van rapporten.
Als u berekeningen in de opslag wilt uitvoeren, moet u eerst de gegevensstroom maken en gegevens verplaatsen naar deze Power BI-gegevensstroomopslag. Nadat u een gegevensstroom hebt die gegevens bevat, kunt u berekende entiteiten maken. Dit zijn entiteiten die berekeningen in de opslag uitvoeren.
Overwegingen en beperkingen van berekende entiteiten
- Wanneer u werkt met gegevensstromen die zijn gemaakt in het Azure Data Lake Storage Gen2-account van een organisatie, werken gekoppelde entiteiten en berekende entiteiten alleen goed wanneer de entiteiten zich in hetzelfde opslagaccount bevinden.
Als best practice bij het uitvoeren van berekeningen op gegevens die worden samengevoegd door on-premises- en cloudgegevens, maakt u een nieuwe gegevensstroom voor elke bron (één voor on-premises en één voor de cloud) en maakt u vervolgens een derde gegevensstroom om deze twee gegevensbronnen samen te voegen of te berekenen.
Gekoppelde entiteiten
U kunt verwijzen naar bestaande gegevensstromen met behulp van gekoppelde entiteiten met een Power BI Premium-abonnement. Hiermee kunt u berekeningen uitvoeren op deze entiteiten met behulp van berekende entiteiten of een tabel 'één bron van de waarheid' maken die u binnen meerdere gegevensstromen kunt hergebruiken.
Incrementeel vernieuwen
Gegevensstromen kunnen worden ingesteld om incrementeel te vernieuwen om te voorkomen dat alle gegevens bij elke vernieuwing moeten worden opgehaald. Selecteer hiervoor de gegevensstroom en kies vervolgens het pictogram Incrementeel vernieuwen.
Bij het instellen van incrementele vernieuwing worden er parameters aan de gegevensstroom toegevoegd om het datumbereik te specificeren. ZieIncrementeel vernieuwen gebruiken met gegevensstromen voor gedetailleerde informatie over het instellen van incrementeel vernieuwen.
Overwegingen voor wanneer incrementeel vernieuwen niet moet worden ingesteld
Stel een gegevensstroom niet in op incrementeel vernieuwen in de volgende situaties:
- Gekoppelde entiteiten mogen geen incrementeel vernieuwen gebruiken als ze verwijzen naar een gegevensstroom.
Volgende stappen
De volgende artikelen bieden meer informatie over gegevensstromen en Power BI: