Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of mappen te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen om mappen te wijzigen.
In deze zelfstudie vindt u een overzicht van de stappen en overwegingen voor het implementeren van een medaillonarchitectuur met behulp van gematerialiseerde meerweergaven. Aan het einde van deze zelfstudie leert u de belangrijkste functies en mogelijkheden van gematerialiseerde lake-views kennen en bent u in staat een geautomatiseerde werkstroom voor gegevenstransformatie te maken. Deze zelfstudie is niet bedoeld als referentiearchitectuur, een uitgebreide lijst met functies en functionaliteit of een aanbeveling voor specifieke aanbevolen procedures.
Vereiste voorwaarden
Voer de volgende stappen uit als vereisten voor deze zelfstudie:
- Meld u aan bij uw Power BI-account of als u nog geen account hebt, meld u aan voor een gratis proefversie.
- Schakel Microsoft Fabric in uw tenant in. Selecteer het standaardpictogram van Power BI linksonder in het scherm en selecteer Fabric.
- Maak een werkruimte met Microsoft Fabric-functionaliteit.
- Selecteer een werkruimte op het tabblad Werkruimten, selecteer de optie + Nieuw, en kies Pijplijn. Geef een naam op voor uw pijplijn en selecteer Maken.
- Maak een Lakehouse met ingeschakelde schema's Noem het SalesLakehouse en laad voorbeeldgegevensbestanden in Lakehouse. Voor meer informatie, zie Lakehouse-tutorial.
Overzicht van scenario
In deze zelfstudie gaat u een voorbeeld nemen van een fictieve retailorganisatie, Contoso, die gebruikmaakt van een medaille-architectuur voor gegevensanalyse om bruikbare inzichten te krijgen in de verkoopactiviteiten van de detailhandel. Het is erop gericht het analyseproces te stroomlijnen en dieper inzicht te krijgen in bedrijfsprestaties door hun gegevens in drie lagen te organiseren: brons (onbewerkte gegevens), zilver (opgeschoonde en verrijkte gegevens) en goud (geaggregeerde en geanalyseerde gegevens).
Het volgende diagram vertegenwoordigt verschillende entiteiten in elke laag van de medallion-architectuur van de SalesLakehouse.
Entiteiten
Orders: Deze entiteit bevat details over elke klantorder, zoals orderdatum, verzendgegevens, productcategorie en subcategorie. Inzichten kunnen worden getrokken om verzendstrategieën te optimaliseren, populaire productcategorieën te identificeren en orderbeheer te verbeteren.
Verkoop: Door verkoopgegevens te analyseren, kan Contoso belangrijke metrische gegevens evalueren, zoals totale omzet, winstmarges, orderprioriteiten en kortingen. Correlaties tussen deze factoren bieden een duidelijker inzicht in het aankoopgedrag van klanten en de efficiëntie van kortingsstrategieën.
Locatie: Hiermee wordt de geografische dimensie van verkoop en orders vastgelegd, waaronder steden, staten, regio's en klantsegmenten. Het helpt Contoso bij het identificeren van regio's met hoge prestaties, het aanpakken van laag presterende gebieden en het personaliseren van strategieën voor specifieke klantsegmenten.
Agentprestaties: Met details over agents die transacties, hun commissies en verkoopgegevens beheren, kan Contoso de prestaties van afzonderlijke agents evalueren, topprestaties stimuleren en effectieve commissiestructuren ontwerpen.
Agentprovisies: Het opnemen van commissiegegevens zorgt voor transparantie en maakt betere kostenbeheersing mogelijk. Inzicht in de correlatie tussen commissiepercentages en agentprestaties helpt om incentivesystemen te verfijnen.
Voorbeeldgegevens
Contoso onderhoudt onbewerkte gegevens voor retailbewerkingen in CSV-indeling binnen ADLS Gen2. We gebruiken deze gegevens om de bronslaag te maken en gebruiken vervolgens de bronslaag om de gematerialiseerde weergaven te maken die de zilveren en gouden lagen van de medaillonarchitectuur vormen. Download eerst de CSV-voorbeeldbestanden uit de opslagplaats Fabric-voorbeelden.
De pijplijn maken
De stappen op hoog niveau zijn als volgt:
- Bronslaag: onbewerkte gegevens opnemen in de vorm van CSV-bestanden in het lakehouse.
- Silver Layer: Gegevens opschonen met gematerialiseerde lake views.
- Gold Layer: Verzamel data voor analytics en rapportage met behulp van gematerialiseerde lake-weergaven.
Een bronzen laag van de medaillonarchitectuur voor verkoopanalyse creëren
Laad de CSV-bestanden die overeenkomen met verschillende entiteiten uit de gedownloade gegevens in Lakehouse. Hiervoor gaat u naar uw lakehouse en uploadt u de gedownloade gegevens naar de sectie Bestanden van het lakehouse. Er wordt een map gemaakt met de naam zelfstudie.
Maak vervolgens een snelkoppeling naar deze in de sectie Tabellen . Selecteer ... naast de sectie Tabellen en selecteer nieuwe schemasnelkoppeling en vervolgens Microsoft OneLake. Kies SalesLakehouse uit de gegevensbrontypen. Vouw de sectie Bestanden uit, kies de tutorial-map en selecteer vervolgens Maken. U kunt ook andere alternatieve opties gebruiken om gegevens in Lakehouse op te halen.
Wijzig in de sectie Tabellen de naam van de map zelfstudie als brons.
Lagen van zilveren en gouden medaillon architectuur maken
Upload het gedownloade notebookbestand naar uw werkruimte.
Open het notebook vanuit Lakehouse. Zie De lakehouse-gegevens verkennen met een notebook voor meer informatie.
Voer alle cellen van het notebook uit met behulp van Spark SQL om gematerialiseerde lake weergaven te maken met regels voor de gegevenskwaliteit. Zodra alle cellen succesvol zijn uitgevoerd, vernieuwt u de SalesLakehouse-bron om de nieuw gemaakte gematerialiseerde lake views weer te geven voor het zilver en goud schema.
De pijplijn plannen
Zodra de gematerialiseerde lakeweergaven voor zilver- en goudlagen zijn gemaakt, navigeert u naar het lakehouse en selecteert u beheerde gematerialiseerde lakeweergave om de afkomstweergave te bekijken. Het wordt automatisch gegenereerd op basis van afhankelijkheden, waarbij elke afhankelijke gematerialiseerde lakeweergave de knopen van de afstamming vormt.
Selecteer Planning op het navigatielint. Schakel het vernieuwingsschema in en configureer het schema.
Bewaking en problemen oplossen
In het vervolgkeuzemenu worden de huidige en historische uitvoeringen weergegeven.
Door een van de runs te selecteren, vindt u de gematerialiseerde weergavedetails van het meer op het paneel aan de rechterkant. Het onderste activiteitenvenster biedt een algemeen overzicht van de uitvoeringsstatus van knooppunten.
Selecteer een knooppunt in de herkomst om de uitvoeringsdetails van het knooppunt te bekijken en een koppeling naar gedetailleerde logboeken te maken. Als de status van het knooppunt is mislukt, wordt er ook een foutbericht weergegeven.
Als u de koppeling Gedetailleerde logboeken selecteert, wordt u omgeleid naar de Monitor Hub , waar u toegang hebt tot Spark-foutenlogboeken voor verdere probleemoplossing.
Selecteer de knop Rapport gegevenskwaliteit op het lint van de pagina met gematerialiseerde lake-weergaven, om een automatisch gegenereerd rapport over gegevenskwaliteit te maken of weer te geven.