Sdílet prostřednictvím


Kurz: Prostředky infrastruktury pro uživatele Power BI

V tomto kurzu se naučíte používat toky dat Gen2 a Pipelines k ingestování dat do Lakehouse a vytvoření dimenzionálního modelu. Dozvíte se také, jak automaticky vygenerovat krásnou sestavu, aby se během pouhých 45 minut zobrazily nejnovější údaje o prodeji.

Začneme!

  • Příprava a načtení dat do jezera
  • Vytvoření dimenzionálního modelu v jezeře
  • Automatické vytvoření sestavy pomocí rychlého vytvoření

Požadavky

Vytvoření lakehouse pro ukládání dat

Začneme vytvořením jezera pro ukládání dat, toků dat Gen2 pro přípravu a transformaci sloupců a kanálu pro zpracování orchestrace plánované aktualizace a e-mailové aktivity.


  1. Přejděte do svého pracovního prostoru a vyberte Nový. Pak vyberte Zobrazit vše.

    Screenshot of the Show all option in the new item menu.

  2. Na obrazovce Vytvoření nové položky vyberte Lakehouse v kategorii Přípravy dat.

    Screenshot of Data engineering items.

  3. Nastavte název Lakehouse na SalesLakehouse. Pak vyberte Vytvořit.

    Screenshot of naming a name Lakehouse.

  4. Jakmile budete v editoru Lakehouse, vyberte Nový tok dat Gen2.

    Poznámka:

    Můžete také vybrat Načíst data z pásu karet a pak nový tok dat Gen2.

    Screenshot of Get data drop down in the Lakehouse editor.

Příprava a načtení dat do jezera

Pokud chcete načíst data do jezera, proveďte následující kroky:

  1. Jakmile budete v editoru Power Query Online pro toky dat Gen2, vyberte Importovat ze šablony Power Query a zvolte soubor šablony stažený z požadavků.

    Screenshot of watermarks in the Dataflows Gen2 editor.

  2. Vyberte dotaz DimDate ve skupině dotazů Načítání dat a pak vyberte možnost Konfigurovat připojení. V případě potřeby nastavte typ ověřování na Anonymní před výběrem Připojení.

    Screenshot of the configure connection menu.

  3. Když je vybraný dotaz DimDate, změňte v okně náhledu dat datový typ sloupce DateKey na Datum a čas výběrem ikony v levém horním rohu.

    Screenshot of changing data types within the Power Query editor.

  4. V okně Změnit typ sloupce vyberte Nahradit aktuální.

    Screenshot of the change column type menu.

Přidání cíle dat

Pokud chcete přidat cíl dat, postupujte následovně:

  1. Pokud je vybraná tabulka DimDate , na kartě Domů vyberte Přidat cíl dat a pak vyberte položku nabídky Možnosti Lakehouse .

    Screenshot of the get data destination Lakehouse option.

  2. V případě potřeby nastavte ověřování na účet organizace a pak vyberte Další.

    Screenshot of the Connect to data destination menu.

  3. V navigátoru vyberte pracovní prostor použitý pro tento kurz a rozbalte zobrazení všech položek Lakehouse . Vyberte SalesLakehouse a před výběrem možnosti Další potvrďte, že je vybraná výchozí nová tabulka.

    Screenshot of the destination target navigator item.

  4. Nastavte metodu Update na Nahradit a pak vyberte Uložit nastavení.

    Upozornění

    Nastavení metody aktualizace nahradit odstraní všechna existující data a nahradí je novými daty při každé následné aktualizaci.

    Screenshot of the destination settings menu option.

    Poznámka:

    V pravém dolním rohu editoru Power Query Online najdete nakonfigurovaná nastavení cíle dat pro váš dotaz, kde můžete dále přizpůsobit nebo odebrat.

    Screenshot of the configured data destination.

  5. Než přejdete k další části tohoto kurzu, nezapomeňte provést stejné kroky , jaké jste provedli dříve v této části, abyste pro každý z následujících dotazů nakonfigurovali Lakehouse jako cíl dat.

    Dotaz
    DimCustomer
    DimEmployee
    DimProduct
    DimStore
  6. Vyberte dotaz FactOnlineSales ve skupině dotazu transformace dat a na kartě Domů vyberte Přidat cíl dat a pak vyberte možnost Lakehouse.

    Screenshot of the Data destination Lakehouse target option.

  7. V případě potřeby nastavte ověřování na účet organizace a pak vyberte Další.

    Screenshot of the Connect to data destination menu.

  8. V navigátoru vyberte pracovní prostor použitý pro tento kurz a rozbalte zobrazení všech položek Lakehouse . Vyberte SalesLakehouse a před výběrem možnosti Další potvrďte, že je vybraná výchozí nová tabulka.

    Screenshot of the destination target navigator window.

  9. Nastavte metodu Update na Připojit a pak vyberte Uložit nastavení.

    Poznámka:

    Tento proces vloží data a zachová stávající řádky v tabulce při každé následné aktualizaci.

    Screenshot of the destination settings menu selection.

  10. Výběrem možnosti Publikovat uložte tok dat a ukončete editor Power Query Online .

    Screenshot of the publish button within Power Query Online.

  11. Najetím myší nad vytvořený tok dat v pracovním prostoru vyberte tři tečky (...) a možnost Vlastnosti .

    Screenshot of the dataflows properties in a workspace.

  12. Změňte název toku dat na OnlineSalesDataflow a vyberte Uložit.

    Screenshot of renaming a dataflow option.

Orchestrace datového kanálu

Pomocí kanálů nejprve orchestrujeme aktualizaci toku dat. Pokud dojde k chybě, pošleme přizpůsobený e-mail Outlooku, který obsahuje důležité podrobnosti.

  1. Vyberte položku Lakehouse s názvem SalesLakehouse v rámci vašeho pracovního prostoru.

    Screenshot of renaming an existing dataflow.

  2. Jakmile budete v editoru Lakehouse, vyberte Nový datový kanál.

    Poznámka:

    Na pásu karet můžete také vybrat Získat data a pak nový datový kanál.

    Screenshot of watermarks in the Lakehouse editor.

  3. Nastavte název kanálu na SalesPipeline. Pak vyberte Vytvořit.

    Screenshot of the pipeline name menu option.

  4. Výběrem možnosti Storno zavřete Pomocníka pro kopírování dat. Pokud se zobrazí výzva k potvrzení ukončení okna kopírování dat, vyberte Ano, zrušte akci.

    Screenshot of the copy data assistant menu.

  5. Jakmile budete v editoru kanálu, vyberte Přidat aktivitu kanálu a pak vyberte Tok dat.

    Poznámka:

    Na pásu karet můžete také vybrat tok dat.

    Screenshot of the pipeline watermark canvas and the add activity option.

  6. Vyberte aktivitu toku dat v editoru kanálu a změňte její hodnotu Názvu na OnlineSalesActivity v části Obecné.

    Screenshot of the dataflow name value.

  7. Když je aktivita toku dat stále vybraná, vyberte Nastavení a v seznamu toků dat zvolte OnlineSalesDataflow. V případě potřeby aktualizujte seznam výběrem ikony Aktualizovat .

    Screenshot of the dataflow selection setting.

  8. Vyberte kartu Aktivity a pak aktivitu Office365 Outlooku.

    Poznámka:

    Pokud se zobrazí okno udělení souhlasu, vyberte OK, přihlaste se pomocí účtu organizace a pak vyberte Povolit přístup.

    Screenshot of the Office365 Outlook activity information.

  9. Vyberte aktivitu Office365 Outlooku v editoru kanálů a změňte její hodnotu Název na Pošta při selhání v části Obecné.

    Screenshot of the Office365 Outlook activity name.

  10. Když je aktivita Office365 Outlook pořád vybraná, vyberte Nastavení. Aktualizujte pole To na vaši e-mailovou adresu a chybu Předmět kanálu. V textu pošty vyberte dynamický obsah [Alt+Shift+D].

    Poznámka:

    Další možnosti konfigurace e-mailu, například Od (Odeslat jako), Kopie, Skrytá, Popisek citlivosti a další, jsou k dispozici v rozšířených vlastnostech.

    Screenshot of the Office365 Outlook settings.

  11. Do tvůrce výrazů kanálu vložte následující blok kódu výrazu:

    @concat(
        'Pipeline: '
        , 
        , '<br>'
        , 'Workspace: '
        , 
        , '<br>'
        , 'Time: '
        , 
    )
    

    Screenshot of the Office365 Outlook activity with expression builder.

  12. Vyberte systémové proměnné a vložte následující proměnné výběrem odpovídajícího názvu z následující tabulky.

    Název hodnoty Line Systémová proměnná
    Potrubí: 3 ID kanálu
    Pracovní prostor: 6 ID pracovního prostoru

    Screenshot of the pipeline system variables.

  13. Vyberte Funkce a vložte následující funkci výběrem odpovídajícího názvu z následující tabulky. Po dokončení vyberte OK.

    Název hodnoty Line Systémová proměnná
    Čas: 9 utcnow

    Screenshot of pipeline functions.

  14. Vyberte OnlineSalesActivity a z dostupných možností cesty vyberte a podržte X (Při selhání) a vytvořte šipku, která se zahodí na aktivitu Pošty při selhání . Tato aktivita se teď vyvolá, pokud onlineSalesActivity selže.

    Screenshot of the on failure path.

  15. Na kartě Domů vyberte Plán. Jakmile aktualizujete následující konfigurace, uložte změny výběrem možnosti Použít .

    Jméno Hodnota
    Naplánované spuštění V den
    Repeat denně
    Čas 12:00:00

    Screenshot of on failure branch.

  16. Na kartě Domů vyberte Spustit. Pokud se zobrazí dialogové okno, vyberte možnost Uložit a spustit , abyste mohli pokračovat.

    Screenshot of the run option from the home tab.

    Pokud chcete monitorovat aktuální stav kanálu, můžete zobrazit tabulku Výstup , která zobrazuje průběh aktuální aktivity. Tabulka se bude pravidelně aktualizovat samostatně nebo ji můžete aktualizovat ručně výběrem ikony aktualizace.

    Screenshot of the current pipeline activity progress.

  17. Jakmile se stav vrátí úspěch, můžete přejít k další části kurzu tak, že se vrátíte do svého pracovního prostoru.

    Screenshot of the side rail with workspace selection.

Vytvoření sémantického modelu v Lakehouse

Načtená data jsou téměř připravená k vytváření sestav. Nejprve použijeme koncový bod SQL k vytvoření relací a zobrazení SQL v našem jezeře. To nám umožňuje snadný přístup k datům v sémantickém modelu, což je model metadat, který obsahuje fyzické databázové objekty, které jsou abstrahovány a upraveny do logických dimenzí. Je navržená k prezentaci dat pro analýzu podle struktury firmy.

Vytvoření vztahů

Tento model je hvězdicové schéma, které můžete vidět z datových skladů: Podobá se hvězdě. Středem hvězdy je tabulka faktů. Okolní tabulky se nazývají tabulky dimenzí, které souvisejí s tabulkou faktů s relacemi.


  1. V zobrazení pracovního prostoru vyberte položku koncového bodu SQL s názvem SalesLakehouse.

    Screenshot of the SQL endpoint item in a workspace.

  2. Jakmile v Průzkumníku vyberete zobrazení Model v dolní části obrazovky, začnete vytvářet relace.

    Screenshot of the Model view selection.

  3. Vytvořte relaci přetažením sloupce CustomerKey z tabulky FactOnlineSales do CustomerKey v tabulce DimCustomer.

  4. V okně Vytvořit relaci se ujistěte, že jste vybrali správné tabulky, sloupce a nastavení, jak je znázorněno v následující tabulce. Pokračujte výběrem možnosti Potvrdit .

    Aktivovat tuto relaci Od: Tabulka 1 (sloupec) To: Tabulka 2 (sloupec) Kardinalita Směr křížového filtru
    FactOnlineSales (CustomerKey) DimCustomer (CustomerKey) M:1 (*:1) Jeden

    Screenshot of Relationship between the FactOnlineSales and DimCustomer table.

  5. Pokud chcete vytvořit relace, proveďte stejný postup pro každou zbývající tabulku a sloupce uvedené v následující tabulce.

    Aktivovat tuto relaci Od: Tabulka 1 (sloupec) To: Tabulka 2 (sloupec) Kardinalita Směr křížového filtru
    FactOnlineSales (ProductKey) DimProduct (ProductKey) M:1 (*:1) Jeden
    FactOnlineSales (StoreKey) DimStore (StoreKey) M:1 (*:1) Jeden
    FactOnlineSales (DateKey) DimDate (DateKey) M:1 (*:1) Jeden
    DimStore (StoreKey) DimEmployeee (StoreKey) M:1 (*:1) Oba

    Následující obrázek znázorňuje dokončené zobrazení sémantického modelu se všemi vytvořenými relacemi.

    Screenshot of table relationships in the model view pane.

Zápis míry v jazyce DAX

Pojďme napsat základní míru, která vypočítá celkovou částku prodeje.

  1. Ve složce Tabulky vyberte tabulku FactOnlineSales. Na kartě Domů vyberte Možnost Nová míra.

    Screenshot of table relationships in the model view.

  2. V editoru vzorců zkopírujte a vložte nebo zadejte následující míru, abyste vypočítali celkovou částku prodeje. Vyberte značku zaškrtnutí, která se má potvrdit.

    Total Sales Amount = SUM(FactOnlineSales[SalesAmount])
    

    Screenshot of Select the check mark to commit a DAX measure.

Vytvoření zobrazení SQL

Pojďme napsat příkaz SQL, který vypočítá celkovou částku prodeje po měsících. Tento příkaz pak uložíme jako zobrazení v našem jezeře. To nám umožní snadno získat přístup k celkové výši prodeje po měsících v budoucnu.

  1. Na kartě Domů vyberte Nový dotaz SQL.

    Screenshot of New SQL query from the home tab.

  2. V editoru dotazů zkopírujte a vložte níže uvedený dotaz, abyste vypočítali celkovou částku prodeje podle čísla měsíce v sestupném pořadí. Po zadání vyberte Spustit a zobrazte výsledky.

    SELECT 
    MONTH(DateKey) as "MonthNumber",
    SUM(SalesAmount) as "TotalSalesAmount"
    FROM FactOnlineSales
    GROUP BY MONTH(DateKey)
    

    Screenshot of SQL query editor.

  3. Zvýrazněte celý text dotazu a vyberte Uložit jako zobrazení.

    Screenshot of Save as view option.

  4. V okně Uložit jako zobrazení nastavte název zobrazení na TotalSalesByMonth a pak vyberte OK.

    Screenshot of Save as view window.

  5. V Průzkumníku rozbalte část Zobrazení a výběrem možnosti TotalSalesByMonth zobrazte výsledky v náhledu dat.

    Screenshot of Views with the Lakehouse explorer.

    Až prozkoumáte editor koncových bodů SQL, můžete přejít k další části kurzu tak, že se vrátíte do svého pracovního prostoru.

    Screenshot of the side rail and selection of the workspace.

Automatické vytvoření sestavy

Teď, když jste modelovali data, je čas vizualizovat a zkoumat data pomocí rychlého vytvoření.


  1. V zobrazení pracovního prostoru najeďte myší nad typ položky Dataset (výchozí) a název položky SalesLakehouse. Vyberte tři tečky (...) a zvolte Automaticky vytvořit sestavu.

    Screenshot of the Autocreate report option with a workspace.

    Sestava se automaticky vygeneruje a dynamicky se aktualizuje na základě výběru sloupců v podokně Vaše data .

    • Zobrazená sestava se může lišit od obrázku níže.

    Screenshot of the finished Auto-create report.

  2. Výběrem možnosti Uložit na pásu karet uložte kopii do aktuálního pracovního prostoru.

    • Pokud chcete zadat kompletní prostředí pro vytváření vizuálů, můžete na pásu karet vybrat Možnost Upravit .

    Screenshot of the Save button when visualizing data.

  3. V dialogovém okně Uložit sestavu zadejte Do pole Zadejte název pole sestavy souhrn prodeje. Po dokončení vyberte Uložit .

    Screenshot of the Save button completing its process when visualizing data.

Další informace o rychlém vytvoření

Blahopřejeme k dokončení kurzu! Pokud jste pro tento kurz vytvořili pracovní prostor, můžete ho teď odstranit. Případně můžete odebrat jednotlivé položky vytvořené během kurzu.

Doufáme, že tento kurz ukázal, jak můžou uživatelé Power BI snadno poskytovat přehled o datech na libovolné úrovni škálování pomocí Microsoft Fabric.