Kurz: Analýza dat pomocí poznámkového bloku

Platí pro: SQL Endpoint and Warehouse v Microsoft Fabric

V tomto kurzu se dozvíte, jak můžete data uložit jednou a pak je použít s mnoha dalšími službami. Pro data uložená v Azure Data Lake Storage a S3 je také možné vytvořit zástupce, abyste měli přímý přístup k rozdílovým tabulkám z externích systémů.

Důležité

Microsoft Fabric je v současné době ve verzi PREVIEW. Tyto informace se týkají předběžného vydání produktu, který může být před vydáním podstatně změněn. Společnost Microsoft neposkytuje na zde uvedené informace žádné záruky, ať už vyjádřené nebo předpokládané.

Vytvoření lakehouse

Nejprve vytvoříme nový lakehouse. Vytvoření nového lakehouse v pracovním prostoru Microsoft Fabric:

  1. Data Warehouse Tutorial V navigační nabídce vyberte pracovní prostor.

  2. Vyberte + Nový>Lakehouse (Preview).

    Snímek obrazovky z portálu Fabric s nabídkou + Nový Lakehouse (Preview) je označen červeně.

  3. Do pole Název zadejte ShortcutExercise a vyberte Vytvořit.

    Snímek obrazovky z portálu Fabric s polem názvu nového lakehouse Zadaný název je ShortcutExercise.

  4. Nový lakehouse se načte a otevře se zobrazení Průzkumník s nabídkou Získat data v nabídce lakehouse . V části Načíst data v lakehouse vyberte tlačítko Nový zástupce .

    Snímek obrazovky z portálu Prostředky infrastruktury zobrazující na cílové stránce načíst data v nabídce lakehouse Tlačítko Nový zástupce je červeně zaškrtnuté.

  5. V okně Nový zástupce vyberte tlačítko Microsoft OneLake.

    Snímek obrazovky z portálu Prostředky infrastruktury zobrazující okno Nový zástupce Tlačítko Pro Microsoft OneLake je červeně zaškrtnuté.

  6. V okně Vybrat typ zdroje dat procházejte seznam, dokud nenajdete sklad s názvem WideWorldImporters , který jste vytvořili dříve. Vyberte ji a pak vyberte Další.

  7. V prohlížeči objektů OneLake rozbalte tabulky, rozbalte dbo schéma a pak vyberte přepínač vedle dimension_customer. Vyberte tlačítko Vytvořit.

    Snímek obrazovky z portálu Fabric zobrazující prohlížeč objektů OneLake V části WideWorldImporters, Tables, dbo je dimension_customer označeno červeně.

  8. Pokud se v části Tabulky zobrazí složka s názvemUnidentified, vyberte ve vodorovném řádku nabídek ikonu Aktualizovat.

    Snímek obrazovky z portálu Prostředky infrastruktury zobrazující tlačítko aktualizovat na vodorovném řádku nabídek a tabulky Unidentified v části ShortcutExercise v průzkumníku Lakehouse

  9. Výběrem položky dimension_customer v seznamu Tabulka zobrazte náhled dat. Všimněte si, že lakehouse zobrazuje data z dimension_customer tabulky ze skladu.

    Snímek obrazovky z portálu Fabric zobrazující náhled dat tabulky dimension_customer

  10. Dále vytvořte nový poznámkový blok pro dotazování tabulky dimension_customer . Na pásu karet Domů vyberte rozevírací seznam Otevřít poznámkový blok a zvolte Nový poznámkový blok.

    Snímek obrazovky z portálu Prostředky infrastruktury zobrazující stisknuté tlačítko Otevřít poznámkový blok a vybranou možnost Nový poznámkový blok.

  11. Vyberte a pak přetáhněte dimension_customer položku ze seznamu Tabulky do buňky otevřeného poznámkového bloku. Můžete vidět, že byl napsán dotaz PySpark pro dotazování na všechna data z ShortcutExercise.dimension_customer. Toto prostředí poznámkového bloku je podobné prostředí poznámkového bloku v editoru Visual Studio Code Jupyter. Poznámkový blok můžete otevřít také v editoru VS Code.

    Snímek obrazovky ze zobrazení poznámkového bloku portálu Fabric Šipka označuje cestu k výběru dimension_customer a přetáhněte ji do otevřené buňky poznámkového bloku.

  12. Na pásu karet Domů vyberte tlačítko Spustit vše . Po dokončení dotazu uvidíte, že můžete snadno použít PySpark k dotazování tabulek Warehouse.

    Snímek obrazovky z portálu Fabric zobrazující výsledky spuštění poznámkového bloku pro zobrazení dat z dimension_customer

Další kroky