Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Tento kurz vás provede implementací architektury medailionu pomocí materializovaných zobrazení jezera v toku Fabric Lakehouse. Nakonec vytvoříte automatizovaný tok transformace dat z bronzu na stříbro na zlaté vrstvy. Tento kurz není referenční architekturou, vyčerpávajícím průvodcem funkcí ani doporučením doporučených osvědčených postupů.
Požadavky
Než začnete, dokončete tyto požadavky:
- Pokud ho nemáte, přihlaste se ke svému účtu Power BI nebo si zaregistrujte zkušební verzi.
- Povolte Microsoft Fabric ve vašem tenantovi.
- Vytvořte pracovní prostor s podporou Fabric.
- Vytvořte Lakehouse s povolenými schématy a pojmenujte ho SalesLakehouse.
Tyto požadavky se používají v tomto kurzu: pracovní prostor a SalesLakehouse se vyžadují v krocích bronzové, stříbrné a zlaté vrstvy a při plánování a monitorování.
Přehled scénáře
V tomto kurzu se jako ukázkový scénář používá fiktivní maloobchodní organizace Contoso. Společnost Contoso organizuje prodejní data v architektuře medailiónů, aby zlepšila analytické výsledky oddělením dat na bronzové (nezpracované), stříbro (vyčištěné a obohacené) a zlaté vrstvy (agregované a analyzované).
Následující diagram představuje různé entity v každé vrstvě architektury medallionu v SalesLakehouse:
Klíčové entity ve scénáři
Následující entity odpovídají entitám zobrazeným v diagramu architektury medallionu v předchozí části.
Objednávky: Tato entita obsahuje podrobnosti o každé objednávce zákazníka, jako je datum objednávky, podrobnosti o zásilce, kategorie produktů a podkategorie. Přehledy je možné využít k optimalizaci strategií dopravy, identifikaci oblíbených kategorií produktů a zlepšení správy objednávek.
Prodej: Analýzou prodejních dat může Společnost Contoso vyhodnotit klíčové metriky, jako jsou celkové výnosy, ziskové marže, priority objednávek a slevy. Korelace mezi těmito faktory poskytují jasnější porozumění chování při nákupu zákazníků a efektivitě strategií slev.
Umístění: Zachycuje geografickou dimenzi prodeje a objednávek, včetně měst, států, oblastí a segmentů zákazníků. Pomáhá společnosti Contoso identifikovat vysoce výkonné oblasti, řešit oblasti s nízkým výkonem a přizpůsobit strategie pro konkrétní segmenty zákazníků.
Agent: S podrobnostmi o agentech, kteří spravují transakce, jejich provize a údaje o prodeji, může Společnost Contoso vyhodnotit výkon jednotlivých agentů, incentivizovat nejvyšší výkon a navrhnout efektivní struktury provize.
Provize z agentů: Začlenění údajů o provizech zajišťuje transparentnost a umožňuje lepší správu nákladů. Pochopení korelace mezi sazbami provize a výkonem agenta pomáhá upřesňovat systémy pobídek.
Ukázková data a poznámkové bloky
Tento kurz používá ukázkovou datovou sadu z úložiště ukázek Fabric. Než budete pokračovat, stáhněte si celou tutorial složku.
Tyto prostředky použijete k vytvoření bronzové vrstvy nejprve a pak vytvoříte stříbro a zlaté materializované zobrazení jezera.
Stažená tutorial složka obsahuje:
- Složky CSV:
agent,agent_commissions,location,ordersasales. - Soubor poznámkového bloku:
Notebook.
Vytvořte tok dat medallionu
V této části vytvoříte bronzové, stříbrné a zlaté vrstvy pro architekturu medailiónu v SalesLakehouse. Tyto vrstvy definují tok dat založený na rodokmenu pro vaše materializovaná zobrazení jezera.
Základní kroky jsou následující:
- Bronzová vrstva: Příjem nezpracovaných dat ve formě souborů CSV do jezera. Viz Vytvořte bronzovou vrstvu architektury medailonu pro analytiku prodeje.
- Silver and Gold Layers: Čištění dat a kurátorování dat pro analýzu a vytváření sestav pomocí materializovaných zobrazení jezera. Viz Vytváření stříbrných a zlatých vrstev architektury medailiónu.
Později v tomto kurzu naplánujete aktualizaci pro tento rodokmen, aby se tok spouštěl automaticky.
Vytvořte bronzovou vrstvu medailové architektury analýzy prodeje
V této části vytvoříte bronzovou vrstvu tak, že nahrajete obsah stažené tutorial složky do SalesLakehouse. Tyto soubory odpovídají entitám popsaným výše v tomto kurzu.
V pracovním prostoru otevřete SalesLakehouse a přejděte do části Soubory .
Nahrajte obsah stažené
tutorialsložky a zachováte strukturu složek:agentagent_commissionslocationorderssales
Po nahrání se vytvoří složka s názvem tutorial v části Soubory a obsahuje tyto podsložky.
Dále vytvořte k němu zástupce v oddílu Tabulky. Vyberte ... vedle sekce Tabulky a zvolte Nová zkratka schématu a poté Microsoft OneLake. Zvolte SalesLakehouse z typů zdrojů dat. Rozbalte oddíl Soubory a zvolte složku kurzu a vyberte Vytvořit. K získání dat do Lakehouse můžete použít také další alternativní možnosti.
V části Tabulky přejmenujte složku kurzu na bronzovou.
Vytváření stříbrných a zlatých vrstev architektury medailiónů
Ze stažené
tutorialsložky nahrajteNotebooksoubor do pracovního prostoru.Otevřete nahraný poznámkový blok z SalesLakehouse. Další informace najdete v tématu Prozkoumání dat lakehouse pomocí poznámkového bloku.
Pro spuštění všech buněk poznámkového bloku použijte Spark SQL k vytvoření materializovaných zobrazení datového jezera s omezeními kvality dat.
Po úspěšném spuštění všech buněk aktualizujte SalesLakehouse a prohlédněte si nová materializovaná zobrazení jezera pod stříbrnými a zlatými schématy.
Naplánovat aktualizaci
V SalesLakehouse otevřete kartu Materialized Lake views a výběrem možnosti Spravovat otevřete rodokmen.
Zobrazení rodokmenu zobrazuje automaticky vygenerovaný graf závislostí, kde se každé závislé materializované zobrazení lake zobrazuje jako uzel.
Na pásu karet vyberte Plán a pak v podokně plány vyberte Nový plán .
Aktivujte plán, zadejte název a vyberte materializovaná zobrazení jezera, která chcete aktualizovat.
Nastavte frekvenci plánu a pak vyberte Použít.
Pokud chcete plán spustit okamžitě, vyberte Spustit podle vytvořeného plánu.
Monitorování a řešení potíží
Na kartě Poslední spuštění zkontrolujte stav spuštění.
Výběrem ID spuštění otevřete podrobnosti pro dané spuštění.
Na kartě Podrobnosti o spuštění zkontrolujte panel podrobností na pravé straně a dolní panel aktivit, kde najdete stav spuštění.
Výběrem materializovaného uzlu zobrazení lake v rodokmenu zobrazíte podrobnosti o spuštění, jeho cestu ABFS a odkaz na podrobné protokoly.
Pokud je stav uzlu neúspěšný, zkontrolujte zobrazenou chybovou zprávu.
Výběrem podrobných protokolů otevřete Centrum monitorování a zkontrolujte protokoly chyb Sparku.
Výběrem karty Sestava kvality dat v zobrazení Materialized Lake můžete vytvořit nebo zobrazit automaticky vygenerovanou sestavu kvality dat.