Kurz k Lakehouse: Vytvoření jezera, ingestování ukázkových dat a sestavení sestavy

V tomto kurzu vytvoříte lakehouse, ingestujete ukázková data do tabulky Delta, použijete transformace tam, kde je to potřeba, a pak vytvoříte sestavy.

Požadavky

Vytvoření jezerahouse

  1. V služba Power BI vyberte v nabídce vlevo pracovní prostory.

  2. Pokud chcete otevřít pracovní prostor, zadejte jeho název do vyhledávacího textového pole umístěného nahoře a vyberte ho z výsledků hledání.

  3. V přepínači prostředí v levém dolním rohu vyberte Datoví technici ing.

    Screenshot showing where to select the experience switcher and Data Engineering.

  4. Na kartě Datoví technici vyberte Lakehouse a vytvořte jezero.

  5. V dialogovém okně New lakehouse zadejte do pole Název wwilakehouse.

    Screenshot of the New lakehouse dialog box.

  6. Výběrem možnosti Vytvořit vytvořte a otevřete nový jezerní dům.

Ingestace ukázkových dat

Poznámka:

Pokud nemáte nakonfigurovaný OneDrive, zaregistrujte si bezplatnou zkušební verzi Microsoftu 365: bezplatnou zkušební verzi – Vyzkoušejte Microsoft 365 za měsíc.

  1. Stáhněte si soubor dimension_customer.csv z úložiště ukázek prostředků infrastruktury.

  2. V Průzkumníku Lakehouse uvidíte možnosti načtení dat do lakehouse. Vyberte Nový tok dat Gen2.

    Screenshot showing where to select New Dataflow Gen2 option to load data into your lakehouse.

  3. V novém podokně toku dat vyberte Importovat ze souboru Text/CSV.

  4. V podokně Připojení do zdroje dat vyberte přepínač Nahrát soubor. Přetáhněte dimension_customer.csv soubor, který jste stáhli v kroku 1. Po nahrání souboru vyberte Další.

    Screenshot showing where to select Upload file and where to drag the previously downloaded file.

  5. Na stránce Náhled dat souboru si prohlédněte náhled dat a výběrem možnosti Vytvořit pokračujte a vraťte se zpět na plátno toku dat.

  6. V podokně Nastavení dotazu aktualizujte pole Název na dimension_customer.

    Poznámka:

    Prostředky infrastruktury ve výchozím nastavení přidají na konec názvu tabulky mezeru a číslo. Názvy tabulek musí být malé a nesmí obsahovat mezery. Přejmenujte ho odpovídajícím způsobem a odeberte všechny mezery z názvu tabulky.

    Screenshot of the query settings pane, showing where to enter the name and select the data destination.

  7. V tomto kurzu jste už přidružovali zákaznická data k jezeru. V případě, že máte další datové položky, které chcete přidružit k jezeře, je můžete přidat pomocí následujícího postupu:

    • V položkách nabídky vyberte Přidat cíl dat a vyberte Lakehouse. Na obrazovce Připojení k cílovému cíli dat se v případě potřeby přihlaste ke svému účtu a vyberte Další.

    • Přejděte do wwilakehouse v pracovním prostoru.

    • Pokud tabulka dimension_customer neexistuje, vyberte nastavení Nová tabulka a zadejte název tabulky dimension_customer. Pokud tabulka již existuje, vyberte nastavení Existující tabulka a v seznamu tabulek v Průzkumníku objektů zvolte dimension_customer . Vyberte Další.

      Screenshot showing how to choose the destination table.

    • V podokně Zvolit nastavení cíle vyberte Nahradit jako metodu aktualizace. Výběrem možnosti Uložit nastavení se vrátíte na plátno toku dat.

  8. Na plátně toku dat můžete data snadno transformovat na základě vašich obchodních požadavků. Pro zjednodušení neprobínáme žádné změny v tomto kurzu. Pokračujte výběrem možnosti Publikovat v pravém dolním rohu obrazovky.

    Screenshot of the Query setting pane that contains the Publish button.

  9. Rotující kruh vedle názvu toku dat označuje, že publikování probíhá v zobrazení položky. Po dokončení publikování vyberte ... a vyberte Vlastnosti. Přejmenujte tok dat na Load Lakehouse Table a vyberte Uložit.

  10. Výběrem možnosti Aktualizovat hned vedle názvu toku dat aktualizujte tok dat. Spustí tok dat a přesune data ze zdrojového souboru do tabulky Lakehouse. Zatímco probíhá, uvidíte v zobrazení položky rotující kruh pod obnoveným sloupcem.

    Screenshot showing where to find the Refresh now icon.

  11. Po aktualizaci toku dat vyberte nový jezerní dům na levém navigačním panelu a zobrazte tabulku dimension_customer delta.

    Screenshot of navigation panel from which the lakehouse is opened.

  12. Výběrem tabulky zobrazíte náhled dat. K dotazování dat pomocí příkazů SQL můžete také použít koncový bod analýzy SQL lakehouse. V rozevírací nabídce Lakehouse v pravém horním rohu obrazovky vyberte koncový bod SQL Analytics.

    Screenshot of the delta table, showing where to select SQL analytics endpoint.

  13. Výběrem tabulky dimension_customer zobrazíte náhled svých dat, nebo vyberte Nový dotaz SQL pro zápis příkazů SQL.

    Screenshot of the SQL analytics endpoint screen, showing where to select New SQL query.

  14. Následující ukázkový dotaz agreguje počet řádků na základě sloupce BuyingGroup v tabulce dimension_customer . Soubory dotazů SQL se automaticky ukládají pro budoucí referenci a tyto soubory můžete podle potřeby přejmenovat nebo odstranit.

    Pokud chcete skript spustit, vyberte ikonu Spustit v horní části souboru skriptu.

    SELECT BuyingGroup, Count(*) AS Total
    FROM dimension_customer
    GROUP BY BuyingGroup
    

Vytvoření sestavy

  1. V zobrazení položky pracovního prostoru vyberte výchozí sémantický model wwilakehouse . Tento sémantický model se vytvoří automaticky a má stejný název jako jezero.

    Screenshot showing the default semantic model that was created when the new lakehouse was created.

  2. V podokně sémantický model můžete zobrazit všechny tabulky. Můžete vytvářet sestavy úplně od začátku, stránkované sestavy nebo nechat Power BI automaticky vytvořit sestavu na základě vašich dat. Pro účely tohoto kurzu vyberte v části Prozkoumat tato data možnost Automaticky vytvořit sestavu. V dalším kurzu vytvoříme sestavu úplně od začátku.

    Screenshot of the semantic model details page, showing where to select Create a report.

  3. Vzhledem k tomu, že tabulka je dimenze a v ní nejsou žádné míry, Vytvoří Power BI míru pro počet řádků a agreguje ji napříč různými sloupci a vytvoří různé grafy, jak je znázorněno na následujícím obrázku. Tuto sestavu můžete uložit pro budoucnost výběrem možnosti Uložit na horním pásu karet. Pokud chcete splnit váš požadavek, můžete v této sestavě provést další změny tím, že zahrnete nebo vyloučíte jiné tabulky nebo sloupce.

    Screenshot of a Quick summary page displaying four different bar charts.

Další krok