Kurz k Lakehouse: Vytvoření jezera, ingestování ukázkových dat a sestavení sestavy
V tomto kurzu vytvoříte lakehouse, ingestujete ukázková data do tabulky Delta, použijete transformace tam, kde je to potřeba, a pak vytvoříte sestavy.
Požadavky
- Vytvoření pracovního prostoru Fabric
- V tomto článku postupujte podle kroků k ingestování souboru CSV, který vyžaduje, abyste nakonfigurovali OneDrive. Pokud nemáte nakonfigurovaný OneDrive, zaregistrujte si bezplatnou zkušební verzi Microsoftu 365: bezplatnou zkušební verzi – Vyzkoušejte Microsoft 365 za měsíc.
Vytvoření jezerahouse
V služba Power BI vyberte v nabídce vlevo pracovní prostory.
Pokud chcete otevřít pracovní prostor, zadejte jeho název do vyhledávacího textového pole umístěného nahoře a vyberte ho z výsledků hledání.
V přepínači prostředí v levém dolním rohu vyberte Datoví technici ing.
Na kartě Datoví technici vyberte Lakehouse a vytvořte jezero.
V dialogovém okně New lakehouse zadejte do pole Název wwilakehouse.
Výběrem možnosti Vytvořit vytvořte a otevřete nový jezerní dům.
Ingestace ukázkových dat
Poznámka:
Pokud nemáte nakonfigurovaný OneDrive, zaregistrujte si bezplatnou zkušební verzi Microsoftu 365: bezplatnou zkušební verzi – Vyzkoušejte Microsoft 365 za měsíc.
Stáhněte si soubor dimension_customer.csv z úložiště ukázek prostředků infrastruktury.
V Průzkumníku Lakehouse uvidíte možnosti načtení dat do lakehouse. Vyberte Nový tok dat Gen2.
V novém podokně toku dat vyberte Importovat ze souboru Text/CSV.
V podokně Připojení do zdroje dat vyberte přepínač Nahrát soubor. Přetáhněte dimension_customer.csv soubor, který jste stáhli v kroku 1. Po nahrání souboru vyberte Další.
Na stránce Náhled dat souboru si prohlédněte náhled dat a výběrem možnosti Vytvořit pokračujte a vraťte se zpět na plátno toku dat.
V podokně Nastavení dotazu aktualizujte pole Název na dimension_customer.
Poznámka:
Prostředky infrastruktury ve výchozím nastavení přidají na konec názvu tabulky mezeru a číslo. Názvy tabulek musí být malé a nesmí obsahovat mezery. Přejmenujte ho odpovídajícím způsobem a odeberte všechny mezery z názvu tabulky.
V tomto kurzu jste už přidružovali zákaznická data k jezeru. V případě, že máte další datové položky, které chcete přidružit k jezeře, je můžete přidat pomocí následujícího postupu:
V položkách nabídky vyberte Přidat cíl dat a vyberte Lakehouse. Na obrazovce Připojení k cílovému cíli dat se v případě potřeby přihlaste ke svému účtu a vyberte Další.
Přejděte do wwilakehouse v pracovním prostoru.
Pokud tabulka dimension_customer neexistuje, vyberte nastavení Nová tabulka a zadejte název tabulky dimension_customer. Pokud tabulka již existuje, vyberte nastavení Existující tabulka a v seznamu tabulek v Průzkumníku objektů zvolte dimension_customer . Vyberte Další.
V podokně Zvolit nastavení cíle vyberte Nahradit jako metodu aktualizace. Výběrem možnosti Uložit nastavení se vrátíte na plátno toku dat.
Na plátně toku dat můžete data snadno transformovat na základě vašich obchodních požadavků. Pro zjednodušení neprobínáme žádné změny v tomto kurzu. Pokračujte výběrem možnosti Publikovat v pravém dolním rohu obrazovky.
Rotující kruh vedle názvu toku dat označuje, že publikování probíhá v zobrazení položky. Po dokončení publikování vyberte ... a vyberte Vlastnosti. Přejmenujte tok dat na Load Lakehouse Table a vyberte Uložit.
Výběrem možnosti Aktualizovat hned vedle názvu toku dat aktualizujte tok dat. Spustí tok dat a přesune data ze zdrojového souboru do tabulky Lakehouse. Zatímco probíhá, uvidíte v zobrazení položky rotující kruh pod obnoveným sloupcem.
Po aktualizaci toku dat vyberte nový jezerní dům na levém navigačním panelu a zobrazte tabulku dimension_customer delta.
Výběrem tabulky zobrazíte náhled dat. K dotazování dat pomocí příkazů SQL můžete také použít koncový bod analýzy SQL lakehouse. V rozevírací nabídce Lakehouse v pravém horním rohu obrazovky vyberte koncový bod SQL Analytics.
Výběrem tabulky dimension_customer zobrazíte náhled svých dat, nebo vyberte Nový dotaz SQL pro zápis příkazů SQL.
Následující ukázkový dotaz agreguje počet řádků na základě sloupce BuyingGroup v tabulce dimension_customer . Soubory dotazů SQL se automaticky ukládají pro budoucí referenci a tyto soubory můžete podle potřeby přejmenovat nebo odstranit.
Pokud chcete skript spustit, vyberte ikonu Spustit v horní části souboru skriptu.
SELECT BuyingGroup, Count(*) AS Total FROM dimension_customer GROUP BY BuyingGroup
Vytvoření sestavy
V zobrazení položky pracovního prostoru vyberte výchozí sémantický model wwilakehouse . Tento sémantický model se vytvoří automaticky a má stejný název jako jezero.
V podokně sémantický model můžete zobrazit všechny tabulky. Můžete vytvářet sestavy úplně od začátku, stránkované sestavy nebo nechat Power BI automaticky vytvořit sestavu na základě vašich dat. Pro účely tohoto kurzu vyberte v části Prozkoumat tato data možnost Automaticky vytvořit sestavu. V dalším kurzu vytvoříme sestavu úplně od začátku.
Vzhledem k tomu, že tabulka je dimenze a v ní nejsou žádné míry, Vytvoří Power BI míru pro počet řádků a agreguje ji napříč různými sloupci a vytvoří různé grafy, jak je znázorněno na následujícím obrázku. Tuto sestavu můžete uložit pro budoucnost výběrem možnosti Uložit na horním pásu karet. Pokud chcete splnit váš požadavek, můžete v této sestavě provést další změny tím, že zahrnete nebo vyloučíte jiné tabulky nebo sloupce.
Další krok
Váš názor
https://aka.ms/ContentUserFeedback.
Připravujeme: V průběhu roku 2024 budeme postupně vyřazovat Problémy GitHubu jako mechanismus zpětné vazby pro obsah a nahradíme ho novým systémem zpětné vazby. Další informace najdete tady:Odeslat a zobrazit názory pro