Sdílet prostřednictvím


Kurz k Lakehouse: Vytvoření jezera, ingestování ukázkových dat a sestavení sestavy

V tomto kurzu vytvoříte lakehouse, ingestujete ukázková data do tabulky Delta, použijete transformace tam, kde je to potřeba, a pak vytvoříte sestavy. Tady je kontrolní seznam kroků, které jste dokončili:

Pokud nemáte Microsoft Fabric, zaregistrujte si bezplatnou zkušební kapacitu.

Požadavky

  • Než vytvoříte lakehouse, musíte vytvořit pracovní prostor Fabric.
  • Než budete ingestovat soubor CSV, musíte mít nakonfigurovaný OneDrive. Pokud nemáte nakonfigurovaný OneDrive, zaregistrujte si bezplatnou zkušební verzi Microsoftu 365: bezplatnou zkušební verzi – Vyzkoušejte Microsoft 365 za měsíc.

Proč pro tento kurz potřebuji OneDrive?

Pro účely tohoto kurzu potřebujete OneDrive, protože proces příjmu dat využívá OneDrive jako základní mechanismus úložiště pro nahrávání souborů. Když nahrajete soubor CSV do systému Fabric, je dočasně uložen ve vašem účtu OneDrive, než se importuje do datového jezera. Tato integrace zajišťuje zabezpečený a bezproblémový přenos souborů v ekosystému Microsoft 365.

Krok načítání dat nefunguje, pokud nemáte nakonfigurovaný OneDrive, protože Fabric nemá přístup k nahranému souboru. Pokud už máte data dostupná v jezeře nebo jiném podporovaném umístění, OneDrive se nevyžaduje.

Poznámka:

Pokud už máte data v jezeře, můžete tato data použít místo ukázkového souboru CSV. Pokud chcete zjistit, zda jsou data již propojena s vaším lakehouse, použijte Lakehouse Explorer nebo koncový bod SQL Analytics k procházení tabulek, souborů a složek. Další informace o tom, jak zkontrolovat, najdete v tématu Přehled Lakehouse a dotazování tabulek Lakehouse s využitím koncového bodu SQL Analytics.

Vytvoření jezerahouse

V této části vytvoříte lakehouse v Fabric.

  1. V Fabricvyberte z navigačního panelu Pracovní prostory.

  2. Pokud chcete otevřít pracovní prostor, zadejte jeho název do vyhledávacího pole umístěného nahoře a vyberte ho z výsledků hledání.

  3. V pracovním prostoru vyberte Nová položka, do vyhledávacího pole zadejte Lakehouse a pak vyberte Lakehouse.

  4. V dialogovém okně New lakehouse zadejte do pole Název wwilakehouse.

    Snímek obrazovky s dialogovým oknem New lakehouse

  5. Výběrem možnosti Vytvořit vytvořte a otevřete nový jezerní dům.

Ingestace ukázkových dat

V této části ingestujete ukázková zákaznická data do jezera.

Poznámka:

Pokud nemáte nakonfigurovaný OneDrive, zaregistrujte si bezplatnou zkušební verzi Microsoftu 365: bezplatnou zkušební verzi – Vyzkoušejte Microsoft 365 za měsíc.

  1. Stáhněte si soubor dimension_customer.csv z úložiště ukázek prostředků infrastruktury.

  2. Na kartě Domů v části Získat data v jezeře se zobrazí možnosti načtení dat do jezera. Vyberte Nový tok dat Gen2.

    snímek obrazovky znázorňující, kde vybrat možnost Nový tok dat Gen2 pro načtení dat do lakehouse.

  3. V podokně Vytvořit tok dat zadejte data dimenze zákazníka do pole Název a vyberte Další.

    Snímek obrazovky s podoknem Vytvořit tok dat zobrazující, kde zadat název toku dat

  4. Na nové obrazovce toku dat vyberte Importovat ze souboru Text/CSV.

  5. Na obrazovce Připojit ke zdroji dat vyberte přepínač Nahrát soubor. Přetáhněte dimension_customer.csv soubor, který jste stáhli v kroku 1. Po nahrání souboru vyberte Další.

    Snímek obrazovky znázorňující, kde vybrat Nahrát soubor a kam přetáhnout dříve stažený soubor

  6. Na stránce Náhled dat souboru si prohlédněte náhled dat a výběrem možnosti Vytvořit pokračujte a vraťte se zpět na plátno toku dat.

Transformace a načtení dat do Lakehouse

V této části transformujete data na základě vašich obchodních požadavků a načtete je do jezera.

  1. V podokně Nastavení dotazu aktualizujte pole Název na dimension_customer.

    Poznámka:

    Prostředky infrastruktury ve výchozím nastavení přidají na konec názvu tabulky mezeru a číslo. Názvy tabulek musí být malými písmeny a nesmí obsahovat mezery. Přejmenujte ho odpovídajícím způsobem a odeberte všechny mezery z názvu tabulky.

    Snímek obrazovky s podoknem nastavení dotazu, kde zadat název a vybrat cíl dat

  2. V tomto kurzu jste přidružli zákaznická data k jezeru. Pokud vytvoříte tok dat z jezera, nahraná data se automaticky propojí s výchozím jezerem. Pokud tok dat vytváříte samostatně, můžete ho volitelně přidružit k jezeru pomocí následujícího postupu:

    1. V položkách nabídky vyberte Přidat cíl dat a vyberte Lakehouse. Na obrazovce Připojit k cíli dat se v případě potřeby přihlaste ke svému účtu a vyberte Další.

    2. Přejděte do wwilakehouse v pracovním prostoru.

    3. Pokud tabulka dimension_customer neexistuje, vyberte nastavení Nová tabulka a zadejte název tabulky dimension_customer. Pokud tabulka již existuje, vyberte nastavení Existující tabulka a v seznamu tabulek v Průzkumníku objektů zvolte dimension_customer . Vyberte Další.

      Snímek obrazovky znázorňující, jak zvolit cílovou tabulku

    4. V podokně Zvolit nastavení cíle vyberte Nahradit jako metodu aktualizace. Výběrem možnosti Uložit nastavení se vrátíte na plátno toku dat.

  3. Na plátně toku dat můžete data snadno transformovat na základě vašich obchodních požadavků. Pro zjednodušení neprobínáme žádné změny v tomto kurzu. Pokračujte tak, že na panelu nástrojů vyberete Uložit a Spustit .

    Snímek obrazovky s podoknem nastavení dotazu, které obsahuje tlačítko Publikovat

  4. Vraťte se do svého pracovního prostoru a najeďte myší na datový tok Dimenze zákazníka, vyberte nabídku ... a pak vyberte Aktualizovat nyní. Tato možnost spustí tok dat a přesune data ze zdrojového souboru do tabulky Lakehouse. Zatímco probíhá, zobrazí se vedle názvu toku dat rotující kruh.

    Snímek obrazovky znázorňující, kde najít ikonu Aktualizovat

  5. Po aktualizaci toku dat vyberte v horním řádku nabídek svůj jezerní dům a zobrazte tabulku dimension_customer Delta.

    Snímek obrazovky s navigačním panelem, ze kterého je otevřeno jezero

  6. Výběrem tabulky zobrazíte náhled dat. K dotazování dat pomocí příkazů SQL můžete také použít koncový bod analýzy SQL lakehouse. V rozevírací nabídce Lakehouse v pravém horním rohu obrazovky vyberte koncový bod sql Analytics.

    Snímek obrazovky tabulky Delta znázorňující, kde vybrat koncový bod analýzy SQL

  7. Výběrem tabulky dimension_customer zobrazíte náhled svých dat, nebo vyberte Nový dotaz SQL pro zápis příkazů SQL.

    Snímek obrazovky koncového bodu SQL Analytics zobrazující, kde vybrat Nový dotaz SQL

  8. Následující ukázkový dotaz agreguje počet řádků na základě sloupce BuyingGroup v tabulce dimension_customer . Soubory dotazů SQL se automaticky ukládají pro budoucí referenci a tyto soubory můžete podle potřeby přejmenovat nebo odstranit.

    Pokud chcete skript spustit, vyberte ikonu Spustit v horní části souboru skriptu.

    SELECT BuyingGroup, Count(*) AS Total
    FROM dimension_customer
    GROUP BY BuyingGroup
    

Přidání tabulek do sémantického modelu

V této části přidáte tabulky do sémantického modelu, abyste je mohli použít k vytváření zpráv.

  1. Otevřete lakehouse a přepněte do zobrazení koncového bodu analýzy SQL , vyberte Nový sémantický model, pojmenujte sémantický model, přiřaďte pracovní prostor a vyberte tabulky, které chcete přidat do sémantického modelu. V tomto případě vyberte tabulku dimension_customer .

    Snímek obrazovky, kde můžete vybrat tabulky, které chcete přidat do sémantického modelu

Vytvoření sestavy

V této části sestavíte sestavu z načtených dat.

  1. Vyberte sémantický model v pracovním prostoru, vyberte rozevírací seznam Prozkoumat tato data a pak vyberte Automaticky vytvořit sestavu. V dalším kurzu vytvoříme sestavu úplně od začátku.

    Snímek obrazovky stránky s podrobnostmi sémantického modelu, který ukazuje, kde zvolit možnost Vytvořit sestavu.

  2. Tabulka je dimenze a v ní nejsou žádné metriky. Power BI vytvoří míru pro počet řádků, agreguje ho napříč různými sloupci a vytvoří různé grafy, jak je znázorněno na následujícím obrázku.

    Snímek obrazovky se stránkou Rychlé shrnutí zobrazující čtyři různé pruhové grafy

  3. Tuto sestavu můžete uložit pro budoucnost výběrem možnosti Uložit na horním pásu karet. V této sestavě můžete provádět další změny tak, aby splňovaly vaše požadavky zahrnutím nebo vyloučením jiných tabulek nebo sloupců.

Další krok