Cvičení – použití transformace dat ve službě Azure Data Factory

Dokončeno

Funkce Power Query ve službě Azure Data Factory umožňuje pracovat s daty a měnit je. Jedná se o objekt, který je možné přidat do návrháře plátna jako aktivitu v kanálu Azure Data Factory pro provedení bezplatné přípravy dat kódu. Umožňuje jednotlivcům, kteří se neshodují s tradičními technologiemi přípravy dat, jako je Spark nebo SQL Server, a jazyky, jako je Python a T-SQL, připravit data v iterativním měřítku v cloudovém měřítku.

Funkce Power Query používá pro základní přípravu dat rozhraní typu mřížky, které se podobá estetické stránce Excelu, označované jako Online Mashup Editor. Editor také umožňuje pokročilejším uživatelům provádět složitější přípravu dat pomocí vzorců. Než budete mít přístup k datům, musíte nejprve vytvořit propojenou službu ke zdroji dat.

Online Mashup Editor

Vzorce fungují s Power Query Online a zpřístupňuje funkce Power Query M pro uživatele datové továrny. Power Query pak přeloží jazyk M vygenerovaný online mashupovým editorem do kódu Sparku pro spouštění cloudového škálování.

Tato funkce umožňuje datovým inženýrům i datovým analytikům interaktivně zkoumat a připravovat datové sady. Kromě toho můžou interaktivně pracovat s jazykem M a zobrazit náhled výsledku před zobrazením v kontextu širšího kanálu.

Pokud chcete přidat aktivitu Power Query ve službě Azure Data Factory, klikněte na ikonu plus a v podokně prostředků továrny vyberte Power Query.

Create a Power Query activity

Přidejte zdrojovou datovou sadu pro tok dat transformace a vyberte datovou sadu jímky. Podporují se následující zdroje dat.

Konektor Formát dat Authentication type
Azure Blob Storage CSV, Parquet Klíč účtu
Azure Data Lake Storage Gen1 CSV Instanční objekt
Azure Data Lake Storage Gen2 CSV, Parquet Klíč účtu, instanční objekt
Azure SQL Database Ověřování SQL
Azure Synapse Analytics Ověřování SQL

Jakmile vyberete zdroj, klikněte na vytvořit.

Adding source datasets to wrangling data flow

Tím se otevře Online Mashup Editor.

Navigating the wrangling data flow

Skládá se z následujících součástí:

  1. Seznam datových sad

    Tím se zobrazí datové sady, které byly definovány jako zdroj pro transformaci dat.

  2. Panel nástrojů funkce Wrangling.

    Panel nástrojů obsahuje řadu funkcí transformace dat, ke kterým má uživatel přístup, aby mohl pracovat s daty, mezi které patří:

    • Správa sloupců
    • Transformace tabulek
    • Zmenšení řádků
    • Přidávání sloupců
    • Kombinování tabulek

    Každá položka je citlivá na kontext a obsahuje dílčí funkce specifické pro ni.

  3. Záhlaví sloupců

    Stejně jako možnost přejmenovat sloupce, kliknutí pravým tlačítkem myši na sloupec vyvolá kontextově citlivé položky pro správu sloupců.

  4. Nastavení.

    To umožňuje přidávat nebo upravovat zdroje dat a jímky dat a měnit nastavení pro úlohu transformace dat.

  5. Okno Kroky

    V tomto okně se zobrazí kroky použité u výstupu transformace. V příkladu v obrázku byl krok s názvem Source použit výstup transformace s názvem UserQuery.

  6. Výstupní seznam Power Query

    Zobrazí seznam výstupu transformace dat, který byl definován.

  7. Tlačítko Publikovat

    Umožňuje publikovat vytvořenou práci.

Úlohu Power Query je možné přidat v návrháři plátna stejně jako úkol aktivity kopírování nebo mapování Tok dat úkolu a dá se spravovat a monitorovat stejným způsobem.

completing the wrangling data flow