Implementace architektury medailionu s materializovanými zobrazeními jezera

Tento kurz vás provede implementací architektury medailionu pomocí materializovaných zobrazení jezera v toku Fabric Lakehouse. Nakonec vytvoříte automatizovaný tok transformace dat z bronzu na stříbro na zlaté vrstvy. Tento kurz není referenční architekturou, vyčerpávajícím průvodcem funkcí ani doporučením doporučených osvědčených postupů.

Požadavky

Než začnete, dokončete tyto požadavky:

  1. Pokud ho nemáte, přihlaste se ke svému účtu Power BI nebo si zaregistrujte zkušební verzi.
  2. Povolte Microsoft Fabric ve vašem tenantovi.
  3. Vytvořte pracovní prostor s podporou Fabric.
  4. Vytvořte Lakehouse s povolenými schématy a pojmenujte ho SalesLakehouse.

Tyto požadavky se používají v tomto kurzu: pracovní prostor a SalesLakehouse se vyžadují v krocích bronzové, stříbrné a zlaté vrstvy a při plánování a monitorování.

Přehled scénáře

V tomto kurzu se jako ukázkový scénář používá fiktivní maloobchodní organizace Contoso. Společnost Contoso organizuje prodejní data v architektuře medailiónů, aby zlepšila analytické výsledky oddělením dat na bronzové (nezpracované), stříbro (vyčištěné a obohacené) a zlaté vrstvy (agregované a analyzované).

Následující diagram představuje různé entity v každé vrstvě architektury medallionu v SalesLakehouse:

Snímek obrazovky znázorňující architekturu medallionu

Klíčové entity ve scénáři

Následující entity odpovídají entitám zobrazeným v diagramu architektury medallionu v předchozí části.

  • Objednávky: Tato entita obsahuje podrobnosti o každé objednávce zákazníka, jako je datum objednávky, podrobnosti o zásilce, kategorie produktů a podkategorie. Přehledy je možné využít k optimalizaci strategií dopravy, identifikaci oblíbených kategorií produktů a zlepšení správy objednávek.

  • Prodej: Analýzou prodejních dat může Společnost Contoso vyhodnotit klíčové metriky, jako jsou celkové výnosy, ziskové marže, priority objednávek a slevy. Korelace mezi těmito faktory poskytují jasnější porozumění chování při nákupu zákazníků a efektivitě strategií slev.

  • Umístění: Zachycuje geografickou dimenzi prodeje a objednávek, včetně měst, států, oblastí a segmentů zákazníků. Pomáhá společnosti Contoso identifikovat vysoce výkonné oblasti, řešit oblasti s nízkým výkonem a přizpůsobit strategie pro konkrétní segmenty zákazníků.

  • Agent: S podrobnostmi o agentech, kteří spravují transakce, jejich provize a údaje o prodeji, může Společnost Contoso vyhodnotit výkon jednotlivých agentů, incentivizovat nejvyšší výkon a navrhnout efektivní struktury provize.

  • Provize z agentů: Začlenění údajů o provizech zajišťuje transparentnost a umožňuje lepší správu nákladů. Pochopení korelace mezi sazbami provize a výkonem agenta pomáhá upřesňovat systémy pobídek.

Ukázková data a poznámkové bloky

Tento kurz používá ukázkovou datovou sadu z úložiště ukázek Fabric. Než budete pokračovat, stáhněte si celou tutorial složku.

Tyto prostředky použijete k vytvoření bronzové vrstvy nejprve a pak vytvoříte stříbro a zlaté materializované zobrazení jezera.

Stažená tutorial složka obsahuje:

  • Složky CSV: agent, agent_commissions, location, ordersa sales.
  • Soubor poznámkového bloku: Notebook.

Vytvořte tok dat medallionu

V této části vytvoříte bronzové, stříbrné a zlaté vrstvy pro architekturu medailiónu v SalesLakehouse. Tyto vrstvy definují tok dat založený na rodokmenu pro vaše materializovaná zobrazení jezera.

Základní kroky jsou následující:

  1. Bronzová vrstva: Příjem nezpracovaných dat ve formě souborů CSV do jezera. Viz Vytvořte bronzovou vrstvu architektury medailonu pro analytiku prodeje.
  2. Silver and Gold Layers: Čištění dat a kurátorování dat pro analýzu a vytváření sestav pomocí materializovaných zobrazení jezera. Viz Vytváření stříbrných a zlatých vrstev architektury medailiónu.

Později v tomto kurzu naplánujete aktualizaci pro tento rodokmen, aby se tok spouštěl automaticky.

Vytvořte bronzovou vrstvu medailové architektury analýzy prodeje

V této části vytvoříte bronzovou vrstvu tak, že nahrajete obsah stažené tutorial složky do SalesLakehouse. Tyto soubory odpovídají entitám popsaným výše v tomto kurzu.

  1. V pracovním prostoru otevřete SalesLakehouse a přejděte do části Soubory .

  2. Nahrajte obsah stažené tutorial složky a zachováte strukturu složek:

    • agent
    • agent_commissions
    • location
    • orders
    • sales

    Po nahrání se vytvoří složka s názvem tutorial v části Soubory a obsahuje tyto podsložky.

  3. Dále vytvořte k němu zástupce v oddílu Tabulky. Vyberte ... vedle sekce Tabulky a zvolte Nová zkratka schématu a poté Microsoft OneLake. Zvolte SalesLakehouse z typů zdrojů dat. Rozbalte oddíl Soubory a zvolte složku kurzu a vyberte Vytvořit. K získání dat do Lakehouse můžete použít také další alternativní možnosti.

    Snímek obrazovky ukazující, jak vytvořit odkaz, který umožní načtení dat do tabulek.

  4. V části Tabulky přejmenujte složku kurzu na bronzovou.

Vytváření stříbrných a zlatých vrstev architektury medailiónů

  1. Ze stažené tutorial složky nahrajte Notebook soubor do pracovního prostoru.

    Snímek obrazovky znázorňující tvorbu pohledu na stříbrné materializované jezero.

  2. Otevřete nahraný poznámkový blok z SalesLakehouse. Další informace najdete v tématu Prozkoumání dat lakehouse pomocí poznámkového bloku.

  3. Pro spuštění všech buněk poznámkového bloku použijte Spark SQL k vytvoření materializovaných zobrazení datového jezera s omezeními kvality dat.

  4. Po úspěšném spuštění všech buněk aktualizujte SalesLakehouse a prohlédněte si nová materializovaná zobrazení jezera pod stříbrnými a zlatými schématy.

    Snímek obrazovky znázorňující spuštění poznámkového bloku

Naplánovat aktualizaci

  1. V SalesLakehouse otevřete kartu Materialized Lake views a výběrem možnosti Spravovat otevřete rodokmen.

    Zobrazení rodokmenu zobrazuje automaticky vygenerovaný graf závislostí, kde se každé závislé materializované zobrazení lake zobrazuje jako uzel.

    Snímek obrazovky znázorňující vytvoření rodokmenu

  2. Na pásu karet vyberte Plán a pak v podokně plány vyberte Nový plán .

  3. Aktivujte plán, zadejte název a vyberte materializovaná zobrazení jezera, která chcete aktualizovat.

  4. Nastavte frekvenci plánu a pak vyberte Použít.

  5. Pokud chcete plán spustit okamžitě, vyberte Spustit podle vytvořeného plánu.

    Snímek obrazovky znázorňující vytvoření plánu

Monitorování a řešení potíží

  1. Na kartě Poslední spuštění zkontrolujte stav spuštění.

  2. Výběrem ID spuštění otevřete podrobnosti pro dané spuštění.

    Snímek obrazovky zobrazující nedávné výkony

  3. Na kartě Podrobnosti o spuštění zkontrolujte panel podrobností na pravé straně a dolní panel aktivit, kde najdete stav spuštění.

  4. Výběrem materializovaného uzlu zobrazení lake v rodokmenu zobrazíte podrobnosti o spuštění, jeho cestu ABFS a odkaz na podrobné protokoly.

  5. Pokud je stav uzlu neúspěšný, zkontrolujte zobrazenou chybovou zprávu.

    Snímek obrazovky s podrobnostmi o spuštění

  6. Výběrem podrobných protokolů otevřete Centrum monitorování a zkontrolujte protokoly chyb Sparku.

    Snímek obrazovky zobrazující protokoly Sparku

  7. Výběrem karty Sestava kvality dat v zobrazení Materialized Lake můžete vytvořit nebo zobrazit automaticky vygenerovanou sestavu kvality dat.