Příprava systému na kurz datových věd

Než začnete s kompletními výukovými moduly datových věd, seznamte se s požadavky, ukázkovou datovou sadou, které poznámkové bloky se mají importovat a jak k těmto poznámkovým blokům připojit lakehouse.

Důležité

Microsoft Fabric je ve verzi Preview.

Požadavky

  1. Power BI Premium předplatného. Další informace najdete v tématu Zakoupení Power BI Premium.

  2. Pracovní prostor Power BI s přiřazenou kapacitou Premium.

  3. Existující Microsoft Fabric Lakehouse. Vytvořte lakehouse podle kroků v tématu Vytvoření lakehouse v Microsoft Fabric.

Ukázková datová sada

V tomto kurzu použijeme žlutou datovou sadu NYC Taxi a Limousine, což je rozsáhlá datová sada obsahující jízdy taxíkem ve městě od roku 2009 do roku 2018. Datová sada obsahuje různé funkce, jako jsou data vyzvednutí a vyzvednutí, časy, místa, ceny jízdného, typy plateb a počty cestujících. Datovou sadu je možné použít k různým účelům, jako je analýza vzorců provozu, trendů poptávky, cenových strategií a chování ovladačů.

Import výukových poznámkových bloků

Položku poznámkového bloku v prostředí Datová Věda používáme k předvedení různých možností prostředků infrastruktury. Poznámkové bloky jsou k dispozici jako soubory poznámkových bloků Jupyter, které je možné importovat do pracovního prostoru s podporou prostředků infrastruktury.

  1. Stáhněte si soubory notebook(.ipynb) pro tento kurz z nadřazené složky: Datová Věda zdrojový kód kurzu. Nezapomeňte si soubory stáhnout pomocí odkazu na nezpracovaný soubor na GitHubu.

  2. Přepněte do prostředí Datová Věda pomocí ikony přepínače prostředí v levém rohu domovské stránky.

    Snímek obrazovky s nabídkou přepínače prostředí, kde vybrat Datová Věda

  3. Na domovské stránce prostředí pro datové vědy vyberte Importovat poznámkový blok a nahrajte soubory poznámkových bloků pro moduly 1 až 5, které jste stáhli v kroku 1.

    Snímek obrazovky znázorňující, kde na domovské stránce Datové vědy vybrat Importovat poznámkový blok

    Snímek obrazovky s dialogovým oknem Stav importu, kde vybrat Nahrát

  4. Po importu poznámkových bloků v dialogovém okně importu vyberte Přejít do pracovního prostoru .

    Snímek obrazovky s dialogovým oknem úspěšného importu, kde vybrat Přejít do pracovního prostoru

  5. Importované poznámkové bloky jsou teď k dispozici ve vašem pracovním prostoru pro použití.

    Snímek obrazovky se seznamem dostupných poznámkových bloků v pracovním prostoru

Připojení lakehouse k poznámkovým blokům

K předvedení funkcí Fabric lakehouse vyžaduje prvních pět modulů v tomto kurzu připojení výchozího lakehouse k poznámkovým blokům. Následující kroky ukazují, jak přidat existující lakehouse do poznámkového bloku v pracovním prostoru s podporou prostředků infrastruktury.

  1. Otevřete poznámkový blok pro první modul 01 Ingestování dat do Lakehouse pomocí Apache Sparku v pracovním prostoru.

  2. V levém podokně vyberte Přidat lakehouse a výběrem existujícího lakehouse otevřete dialogové okno Centrum dat .

  3. Vyberte pracovní prostor a lakehouse, který chcete použít v těchto kurzech, a vyberte Přidat.

  4. Po přidání je lakehouse viditelný v podokně lakehouse v uživatelském rozhraní poznámkového bloku, kde se dají zobrazit tabulky a soubory uložené v lakehouse.

Poznámka

Před spuštěním všech poznámkových bloků je potřeba provést tyto kroky pro každý poznámkový blok v tomto kurzu.

Diagram kroků procesu připojení lakehouse k poznámkovému bloku

Další kroky