Zdieľať cez


Čo je Data Factory v službe Microsoft Fabric?

Služba Data Factory vám poskytuje moderné prostredie na integráciu údajov pri ingeste, príprave a transformácii údajov z množstva zdrojov údajov (napríklad databáz, skladu údajov, služby Lakehouse, údajov v reálnom čase a ďalších). Bez ohľadu na to, či ste občan alebo profesionálny vývojár, budete môcť transformovať údaje inteligentnými transformáciami a využívať bohatú množinu aktivít. Kanály môžeme vytvárať na vykonávanie jednej alebo viacerých aktivít, prístup k zdrojom údajov alebo službám prostredníctvom prepojených služieb. Po vytvorení kanála môžeme pridať spúšťače na automatické spúšťanie procesov v určitých časoch alebo ako odpoveď na meniace sa scenáre. Vďaka službe Data Factory v službe Microsoft Fabric prinášame možnosti rýchleho kopírovania (premiestnenia údajov) do tokov údajov aj kanálov údajov. S funkciou Rýchla kópia môžete údaje medzi obľúbenými ukladacími zariadeniami údajov rýchlo presúvať. A čo je najdôležitejšie, rýchla kópia vám umožňuje preniesť údaje do svojich domovov Lakehouse a Data Warehouse v službe Microsoft Fabric na analýzu.

Existujú dve primárne funkcie, ktoré môže Data Factory implementovať: toky údajov a kanály.

  • Toky údajov umožňujú v návrhárovi tokov údajov využiť viac ako 300 transformácií, vďaka čomu môžete transformovať údaje jednoduchšie a s väčšou flexibilitou ako ktorýkoľvek iný nástroj vrátane inteligentných transformácií údajov založených na umelej inteligencii.
  • Kanály údajov vám umožňujú využiť funkcie bohatej prípravy údajov na vytváranie flexibilných pracovných postupov údajov, ktoré spĺňajú vaše podnikové potreby.

Toky údajov

Toky údajov poskytujú rozhranie s minimálnym použitím kódu na spracovanie údajov zo stoviek zdrojov údajov a transformáciu údajov pomocou viac ako 300 transformácií údajov. Výsledné údaje potom môžete načítať do viacerých cieľov, ako sú napríklad databázy Azure SQL a ďalšie. Toky údajov sa môžu spúšťať opakovane pomocou manuálneho alebo plánovaného obnovenia alebo ako súčasť orchestrácie kanála údajov.

Toky údajov sú vytvorené pomocou známeho prostredia Power Query , ktoré je dnes k dispozícii v rámci viacerých produktov a služieb od spoločnosti Microsoft, ako napríklad Excel, Power BI, aplikácie Power Platform, Dynamics 365 Insights a ďalšie. Power Query umožňuje všetkým používateľom ( od občianskych až po profesionálnych integrátorov údajov) vykonávať príjem údajov a transformácie údajov v rámci ich údajovej oblasti. Používajte spojenia, agregácie, čistenie údajov, vlastné transformácie a ešte oveľa viac – od jednoducho použiteľného, vysoko vizuálneho používateľského rozhrania s minimálnym použitím kódu.

Snímka obrazovky používateľského rozhrania služby Power BI zobrazujúca prostredie toku údajov.

Kanály údajov

Kanály údajov umožňujú výkonné funkcie pracovných postupov v cloude. Pomocou kanálov údajov môžete vytvárať komplexné pracovné postupy, ktoré dokážu obnoviť váš tok údajov, presunúť údaje veľkosti PB a definovať sofistikované kanály toku riadenia.

Použite údajové kanály na vytváranie komplexných pracovných postupov ETL a tovární údajov, ktoré dokážu vykonávať množstvo rôznych úloh na škálovanie. Funkcie toku riadenia sú zabudované v kanáloch údajov, ktoré umožňujú vytvárať logiku pracovného postupu, ktorá poskytuje slučky a podmienky.

Pridajte aktivitu kopírovania riadenú konfiguráciou spolu s obnovením toku údajov s minimálnym použitím kódu v jednom kanáli pre koncový kanál údajov ETL. Môžete dokonca pridať prvé aktivity kódu pre poznámkové bloky Spark, skripty SQL, uložené počítače a ďalšie.

Snímka obrazovky používateľského rozhrania zobrazujúca kopírovanú aktivitu.

Ak chcete začať pracovať so službou Microsoft Fabric, prejdite na položku Rýchly začiatok: Vytvorte svoj prvý tok údajov Gen2 na získanie a transformáciu údajov.