Co je příprava dat v Microsoft Fabric?

Příprava dat v Microsoft Fabric umožňuje uživatelům navrhovat, sestavovat a udržovat infrastruktury a systémy, které jejich organizacím umožňují shromažďovat, ukládat, zpracovávat a analyzovat velké objemy dat.

Microsoft Fabric poskytuje různé možnosti přípravy dat, které zajišťují, že vaše data jsou snadno přístupná, dobře uspořádaná a vysoce kvalitní. Na domovské stránce přípravy dat můžete:

  • Vytvoření a správa dat pomocí jezerahouse

  • Návrh kanálů pro kopírování dat do jezerahouse

  • Použití definic úloh Sparku k odeslání dávkové úlohy nebo úlohy streamování do clusteru Spark

  • Psaní kódu pro příjem dat, přípravu a transformaci pomocí poznámkových bloků

    Snímek obrazovky znázorňující Datoví technici objektů

Jezero

Lakehouses jsou datové architektury, které organizacím umožňují ukládat a spravovat strukturovaná a nestrukturovaná data v jednom umístění pomocí různých nástrojů a architektur pro zpracování a analýzu dat. Tyto nástroje a architektury můžou zahrnovat dotazy a analýzy založené na SQL a také strojové učení a další pokročilé analytické techniky.

Definice úlohy Apache Sparku

Definice úloh Sparku jsou sada instrukcí, které definují, jak spustit úlohu v clusteru Spark. Obsahuje informace, jako jsou vstupní a výstupní zdroje dat, transformace a nastavení konfigurace pro aplikaci Spark. Definice úlohy Sparku umožňuje odeslat úlohu dávkového streamování do clusteru Spark, použít jinou logiku transformace na data hostovaná v jezeře spolu s mnoha dalšími věcmi.

Poznámkový blok

Poznámkové bloky jsou interaktivní výpočetní prostředí, které umožňuje uživatelům vytvářet a sdílet dokumenty, které obsahují živý kód, rovnice, vizualizace a text vyprávění. Umožňují uživatelům psát a spouštět kód v různých programovacích jazycích, včetně Pythonu, R a Scaly. Poznámkové bloky můžete použít k příjmu dat, přípravě, analýze a dalším úlohám souvisejícím s daty.

Datový kanál

Datové kanály představují řadu kroků, které můžou shromažďovat, zpracovávat a transformovat data z nezpracované formy do formátu, který můžete použít k analýze a rozhodování. Jsou důležitou součástí přípravy dat, protože poskytují způsob, jak přesouvat data ze zdroje do cíle spolehlivým, škálovatelným a efektivním způsobem.

Při registraci ke zkušební verzi Fabric můžete používat Datoví technici v Microsoft Fabric zdarma. Můžete si také koupit kapacitu Microsoft Fabric nebo rezervovanou kapacitu Fabric.

Začínáme s prostředím pro Datoví technici: