Kurz: Analýza dat pomocí poznámkového bloku
Platí pro: SQL Endpoint and Warehouse v Microsoft Fabric
V tomto kurzu se dozvíte, jak můžete data uložit jednou a pak je použít s mnoha dalšími službami. Pro data uložená v Azure Data Lake Storage a S3 je také možné vytvořit zástupce, abyste měli přímý přístup k rozdílovým tabulkám z externích systémů.
Důležité
Microsoft Fabric je v současné době ve verzi PREVIEW. Tyto informace se týkají předběžného vydání produktu, který může být před vydáním podstatně změněn. Společnost Microsoft neposkytuje na zde uvedené informace žádné záruky, ať už vyjádřené nebo předpokládané.
Vytvoření lakehouse
Nejprve vytvoříme nový lakehouse. Vytvoření nového lakehouse v pracovním prostoru Microsoft Fabric:
Data Warehouse Tutorial
V navigační nabídce vyberte pracovní prostor.Vyberte + Nový>Lakehouse (Preview).
Do pole Název zadejte
ShortcutExercise
a vyberte Vytvořit.Nový lakehouse se načte a otevře se zobrazení Průzkumník s nabídkou Získat data v nabídce lakehouse . V části Načíst data v lakehouse vyberte tlačítko Nový zástupce .
V okně Nový zástupce vyberte tlačítko Microsoft OneLake.
V okně Vybrat typ zdroje dat procházejte seznam, dokud nenajdete sklad s názvem
WideWorldImporters
, který jste vytvořili dříve. Vyberte ji a pak vyberte Další.V prohlížeči objektů OneLake rozbalte tabulky, rozbalte
dbo
schéma a pak vyberte přepínač vedledimension_customer
. Vyberte tlačítko Vytvořit.Pokud se v části Tabulky zobrazí složka s názvem
Unidentified
, vyberte ve vodorovném řádku nabídek ikonu Aktualizovat.Výběrem položky
dimension_customer
v seznamu Tabulka zobrazte náhled dat. Všimněte si, že lakehouse zobrazuje data zdimension_customer
tabulky ze skladu.Dále vytvořte nový poznámkový blok pro dotazování tabulky
dimension_customer
. Na pásu karet Domů vyberte rozevírací seznam Otevřít poznámkový blok a zvolte Nový poznámkový blok.Vyberte a pak přetáhněte
dimension_customer
položku ze seznamu Tabulky do buňky otevřeného poznámkového bloku. Můžete vidět, že byl napsán dotaz PySpark pro dotazování na všechna data zShortcutExercise.dimension_customer
. Toto prostředí poznámkového bloku je podobné prostředí poznámkového bloku v editoru Visual Studio Code Jupyter. Poznámkový blok můžete otevřít také v editoru VS Code.Na pásu karet Domů vyberte tlačítko Spustit vše . Po dokončení dotazu uvidíte, že můžete snadno použít PySpark k dotazování tabulek Warehouse.