Cvičení – použití transformace dat ve službě Azure Data Factory
Funkce Power Query ve službě Azure Data Factory umožňuje pracovat s daty a měnit je. Jedná se o objekt, který je možné přidat do návrháře plátna jako aktivitu v kanálu Azure Data Factory pro provedení bezplatné přípravy dat kódu. Umožňuje jednotlivcům, kteří se neshodují s tradičními technologiemi přípravy dat, jako je Spark nebo SQL Server, a jazyky, jako je Python a T-SQL, připravit data v iterativním měřítku v cloudovém měřítku.
Funkce Power Query používá pro základní přípravu dat rozhraní typu mřížky, které se podobá estetické stránce Excelu, označované jako Online Mashup Editor. Editor také umožňuje pokročilejším uživatelům provádět složitější přípravu dat pomocí vzorců. Než budete mít přístup k datům, musíte nejprve vytvořit propojenou službu ke zdroji dat.
Vzorce fungují s Power Query Online a zpřístupňuje funkce Power Query M pro uživatele datové továrny. Power Query pak přeloží jazyk M vygenerovaný online mashupovým editorem do kódu Sparku pro spouštění cloudového škálování.
Tato funkce umožňuje datovým inženýrům i datovým analytikům interaktivně zkoumat a připravovat datové sady. Kromě toho můžou interaktivně pracovat s jazykem M a zobrazit náhled výsledku před zobrazením v kontextu širšího kanálu.
Pokud chcete přidat aktivitu Power Query ve službě Azure Data Factory, klikněte na ikonu plus a v podokně prostředků továrny vyberte Power Query.
Přidejte zdrojovou datovou sadu pro tok dat transformace a vyberte datovou sadu jímky. Podporují se následující zdroje dat.
Konektor | Formát dat | Authentication type |
---|---|---|
Azure Blob Storage | CSV, Parquet | Klíč účtu |
Azure Data Lake Storage Gen1 | CSV | Instanční objekt |
Azure Data Lake Storage Gen2 | CSV, Parquet | Klíč účtu, instanční objekt |
Azure SQL Database | Ověřování SQL | |
Azure Synapse Analytics | Ověřování SQL |
Jakmile vyberete zdroj, klikněte na vytvořit.
Tím se otevře Online Mashup Editor.
Skládá se z následujících součástí:
Seznam datových sad
Tím se zobrazí datové sady, které byly definovány jako zdroj pro transformaci dat.
Panel nástrojů funkce Wrangling.
Panel nástrojů obsahuje řadu funkcí transformace dat, ke kterým má uživatel přístup, aby mohl pracovat s daty, mezi které patří:
- Správa sloupců
- Transformace tabulek
- Zmenšení řádků
- Přidávání sloupců
- Kombinování tabulek
Každá položka je citlivá na kontext a obsahuje dílčí funkce specifické pro ni.
Záhlaví sloupců
Stejně jako možnost přejmenovat sloupce, kliknutí pravým tlačítkem myši na sloupec vyvolá kontextově citlivé položky pro správu sloupců.
Nastavení.
To umožňuje přidávat nebo upravovat zdroje dat a jímky dat a měnit nastavení pro úlohu transformace dat.
Okno Kroky
V tomto okně se zobrazí kroky použité u výstupu transformace. V příkladu v obrázku byl krok s názvem Source použit výstup transformace s názvem UserQuery.
Výstupní seznam Power Query
Zobrazí seznam výstupu transformace dat, který byl definován.
Tlačítko Publikovat
Umožňuje publikovat vytvořenou práci.
Úlohu Power Query je možné přidat v návrháři plátna stejně jako úkol aktivity kopírování nebo mapování Tok dat úkolu a dá se spravovat a monitorovat stejným způsobem.