Sdílet prostřednictvím


Příprava dat pomocí zpracování dat

PLATÍ PRO: Azure Data Factory Azure Synapse Analytics

Tip

Vyzkoušejte si službu Data Factory v Microsoft Fabric, řešení pro analýzy typu all-in-one pro podniky. Microsoft Fabric zahrnuje všechno od pohybu dat až po datovou vědu, analýzy v reálném čase, business intelligence a reporting. Přečtěte si, jak začít používat novou zkušební verzi zdarma.

Úprava dat v datové továrně umožňuje vytvářet interaktivní mashupy Power Query přímo v ADF a pak je spouštět ve velkém měřítku v rámci kanálu ADF.

Vytvoření aktivity Power Query

Power Query ve službě Azure Data Factory můžete vytvořit dvěma způsoby. Jedním ze způsobů je kliknout na ikonu plus a vybrat Power Query v podokně prostředků továrny.

Snímek obrazovky znázorňující Power Query v podokně továrních zdrojů

Druhá metoda je v podokně aktivit plátna potrubí. Otevřete accordion Power Query a přetáhněte aktivitu Power Query na plátno.

Snímek obrazovky se zvýrazněnou možností transformace dat

Sestavit aktivitu zpracování dat Power Query

Přidejte zdrojovou datovou sadu pro mash-up Power Query. Můžete zvolit existující datovou sadu nebo vytvořit novou. Po uložení mash-upu můžete vytvořit datový kanál, přidat aktivitu Power Query pro zpracování dat do kanálu a vybrat cílovou datovou sadu, abyste ADF určili, kam mají být data uložena. I když si můžete vybrat jednu nebo více zdrojových datových sad, v tuto chvíli je povolená jenom jedna jímka. Volba datové sady jímky je volitelná, ale vyžaduje se aspoň jedna zdrojová datová sada.

Změna uspořádání

Kliknutím na Vytvořit otevřete editor mashupu Power Query Online.

Nejprve zvolíte zdroj datové sady pro editor mashupu.

Zdroj Power Query

Jakmile dokončíte vytváření Power Query, můžete ho uložit a pak vytvořit kanál. Do pipeline musíte přidat mashup jako aktivitu. Tehdy vytvoříte nebo vyberete datovou sadu zásobníku pro uložení vašich dat. Vlastnosti datové sady jímky můžete nastavit také kliknutím na druhé tlačítko na pravé straně datové sady s jímkou. Pokud chcete získat pouze jeden výstupní soubor, nezapomeňte změnit možnost oddílu v části Optimalizovat na Jeden oddíl.

Cílový bod Power Query

Připravte svá data v Power Query bez potřeby programování. Seznam dostupných funkcí najdete v tématu Transformační funkce. ADF přeloží skript M do skriptu toku dat, abyste mohli Power Query spustit ve velkém měřítku pomocí prostředí Spark v rámci toku dat Azure Data Factory.

Snímek obrazovky znázorňující proces úpravy vašich dat v Power Query.

Spuštění a monitorování aktivity transformace dat Power Query

Pokud chcete spustit spuštění ladění kanálu aktivity Power Query, klikněte na tlačítko Ladit na plátně kanálu. Jakmile publikujete své potrubí, Spustit teď provede na vyžádání běh posledního publikovaného potrubí. Kanály Power Query je možné naplánovat se všemi existujícími triggery služby Azure Data Factory.

Snímek obrazovky znázorňující, jak přidat aktivitu transformace dat Power Query

Přejděte na kartu Monitorování, abyste mohli vizualizovat výstup spuštění aktivované aktivity Power Query.

Snímek obrazovky, který ukazuje výstup spuštěné aktivity Power Query pro zpracování dat.

Zjistěte, jak vytvořit mapovací tok dat.