Příprava systému na kurz datových věd
Než začnete s kompletními výukovými moduly datových věd, seznamte se s požadavky, ukázkovou datovou sadou, které poznámkové bloky se mají importovat a jak k těmto poznámkovým blokům připojit lakehouse.
Důležité
Microsoft Fabric je ve verzi Preview.
Požadavky
Power BI Premium předplatného. Další informace najdete v tématu Zakoupení Power BI Premium.
Pracovní prostor Power BI s přiřazenou kapacitou Premium.
Existující Microsoft Fabric Lakehouse. Vytvořte lakehouse podle kroků v tématu Vytvoření lakehouse v Microsoft Fabric.
Ukázková datová sada
V tomto kurzu použijeme žlutou datovou sadu NYC Taxi a Limousine, což je rozsáhlá datová sada obsahující jízdy taxíkem ve městě od roku 2009 do roku 2018. Datová sada obsahuje různé funkce, jako jsou data vyzvednutí a vyzvednutí, časy, místa, ceny jízdného, typy plateb a počty cestujících. Datovou sadu je možné použít k různým účelům, jako je analýza vzorců provozu, trendů poptávky, cenových strategií a chování ovladačů.
Import výukových poznámkových bloků
Položku poznámkového bloku v prostředí Datová Věda používáme k předvedení různých možností prostředků infrastruktury. Poznámkové bloky jsou k dispozici jako soubory poznámkových bloků Jupyter, které je možné importovat do pracovního prostoru s podporou prostředků infrastruktury.
Stáhněte si soubory notebook(.ipynb) pro tento kurz z nadřazené složky: Datová Věda zdrojový kód kurzu. Nezapomeňte si soubory stáhnout pomocí odkazu na nezpracovaný soubor na GitHubu.
Přepněte do prostředí Datová Věda pomocí ikony přepínače prostředí v levém rohu domovské stránky.
Na domovské stránce prostředí pro datové vědy vyberte Importovat poznámkový blok a nahrajte soubory poznámkových bloků pro moduly 1 až 5, které jste stáhli v kroku 1.
Po importu poznámkových bloků v dialogovém okně importu vyberte Přejít do pracovního prostoru .
Importované poznámkové bloky jsou teď k dispozici ve vašem pracovním prostoru pro použití.
Připojení lakehouse k poznámkovým blokům
K předvedení funkcí Fabric lakehouse vyžaduje prvních pět modulů v tomto kurzu připojení výchozího lakehouse k poznámkovým blokům. Následující kroky ukazují, jak přidat existující lakehouse do poznámkového bloku v pracovním prostoru s podporou prostředků infrastruktury.
Otevřete poznámkový blok pro první modul 01 Ingestování dat do Lakehouse pomocí Apache Sparku v pracovním prostoru.
V levém podokně vyberte Přidat lakehouse a výběrem existujícího lakehouse otevřete dialogové okno Centrum dat .
Vyberte pracovní prostor a lakehouse, který chcete použít v těchto kurzech, a vyberte Přidat.
Po přidání je lakehouse viditelný v podokně lakehouse v uživatelském rozhraní poznámkového bloku, kde se dají zobrazit tabulky a soubory uložené v lakehouse.
Poznámka
Před spuštěním všech poznámkových bloků je potřeba provést tyto kroky pro každý poznámkový blok v tomto kurzu.