Čo sú toky údajov?

Prepitné

Vyskúšajte službu Dataflow Gen2 v službe Data Factory v službe Microsoft Fabric, ide o analytické riešenie typu všetko v jednom pre podniky. Microsoft Fabric zahŕňa všetko od pohybu údajov až po dátovú vedu, analýzu v reálnom čase, BI a vytváranie zostáv. Naučte sa , ako začať novú skúšobnú verziu zdarma!

Toky údajov predstavujú samoobslužnú cloudovú technológiu prípravy údajov. Toky údajov umožňujú zákazníkom preniesť, transformovať a načítať údaje do prostredí Microsoft Dataverse, pracovných priestorov služby Power BI alebo konta Azure Data Lake Storage vašej organizácie. Toky údajov sú vytvorené pomocou doplnku Power Query. Ide o zjednotené možnosti pripojenia a prípravy údajov, ktoré sú už uvedené v mnohých produktoch spoločnosti Microsoft vrátane Excelu a služby Power BI. Zákazníci môžu spúšťať toky údajov, aby sa spúšťali na požiadanie alebo automaticky podľa plánu. údaje sú vždy aktuálne.

Toky údajov je možné vytvoriť vo viacerých produktoch spoločnosti Microsoft.

Toky údajov sú odporúčané vo viacerých produktoch spoločnosti Microsoft a nevyžadujú vytvorenie alebo spustenie licencie špecifickej pre tok údajov. Toky údajov sú k dispozícii v službách Power Apps, Power BI a Dynamics 365 Customer Prehľady. Možnosť vytvárať a spúšťať toky údajov sa spája s licenciami týchto produktov. Funkcie toku údajov sú väčšinou bežné vo všetkých produktoch, v ktorých sú uvedené, ale niektoré funkcie špecifické pre produkt môžu existovať v tokoch údajov vytvorených v jednom produkte v porovnaní s iným.

Ako funguje tok údajov?

Image of how dataflows function, from the source data, to the transformation process, and then to storage.

Na predchádzajúcom obrázku je znázornené celkové zobrazenie toho, ako je tok údajov definovaný. Tok údajov získa údaje z rôznych zdrojov údajov (podporovaných je už viac ako 80 zdrojov údajov). Na základe transformácií nakonfigurovaných pomocou prostredia na tvorbu v doplnku Power Query potom tok údajov transformuje údaje pomocou nástroja toku údajov. Nakoniec sa údaje načítajú do výstupného cieľa, ktorým môže byť prostredie Microsoft Power Platform, pracovný priestor Power BI alebo konto Azure Data Lake Storage organizácie.

Toky údajov sa spúšťajú v cloude

Toky údajov sú cloudové. Keď je tok údajov vytvorený a uložený, definícia sa uloží v cloude. Tok údajov sa spúšťa aj v cloude. Ak je však zdroj údajov lokálny, môžete na extrahovanie údajov do cloudu použiť lokálnu bránu údajov. Pri spustení toku údajov sa transformácia údajov a výpočet prejavia v cloude a cieľ je vždy v cloude.

Image of how dataflows run in the cloud, from the data source, to the dataflow running in the cloud, and then to storage.

Toky údajov používajú výkonný transformačný nástroj

Power Query je nástroj na transformáciu údajov, ktorý sa používa v toku údajov. Tento nástroj je schopný podporovať mnohé pokročilé transformácie. Používa tiež jednoduché, ale výkonné grafické používateľské rozhranie nazývané Editor Power Query. Toky údajov môžete s týmto editorom použiť na rýchlejší a jednoduchší vývoj riešení integrácie údajov.

Screenshot showing an example of Power Query transformations.

Integrácia toku údajov so službami Microsoft Power Platform a Dynamics 365

Keďže tok údajov ukladá výsledné tabuľky do cloudového úložiska, iné služby môžu pracovať s údajmi vytvorenými tokmi údajov.

Image of how a dataflow integrates with Microsoft Power Platform and Dynamics 365.

Aplikácie služieb Power BI, Power Apps, Power Automate, Power Virtual Agents a Dynamics 365 môžu napríklad získať údaje vytvorené tokom údajov pripojením k službe Dataverse, konektoru toku údajov Power Platformy alebo priamo cez jazero v závislosti od cieľa nakonfigurovaného v čase vytvorenia toku údajov.

Výhody tokov údajov

V nasledujúcom zozname sú zvýraznené niektoré z výhod používania tokov údajov:

  • Tok údajov dekóduje vrstvu transformácie údajov z vrstvy modelovania a vizualizácie v riešení služby Power BI.

  • Kód transformácie údajov sa môže nachádzať na centrálnom mieste, čo je tok údajov, a nie rozložiť medzi viacerými artefaktmi.

  • Tvorca toku údajov potrebuje len zručnosti v službe Power Query. V prostredí s viacerými tvorcami môže byť tvorca toku údajov súčasťou tímu, ktorý spolu vytvára celé riešenie BI alebo prevádzkovú aplikáciu.

  • Tok údajov je produktom agnostik. Nie je to len súčasť služby Power BI, je to súčasť služby Power BI. údaje môžete získať v iných nástrojoch a službách.

  • Toky údajov využívajú Power Query, ktorý predstavuje výkonné grafické samoobslužné prostredie na transformáciu údajov.

  • Toky údajov sa celé spúšťajú v cloude. Nevyžaduje sa žiadna ďalšia infraštruktúra.

  • Na začatie práce s tokmi údajov máte viacero možností, ako používať licencie na Power Apps, Power BI a Customer Prehľady.

  • Hoci toky údajov dokážu pokročilú transformáciu, sú navrhnuté pre samoobslužné scenáre a nevyžadujú žiadne it prostredie ani pozadie pre vývojárov.

Scenáre použitia prípadu pre toky údajov

Toky údajov môžete používať na mnohé účely. Nasledujúce scenáre uvádzajú niekoľko príkladov bežných prípadov použitia tokov údajov.

Migrácia údajov zo starších systémov

V tomto scenári organizácia prijala rozhodnutie použiť službu Power Apps na nové používateľské rozhranie, a nie pre starší lokálny systém. Služby Power Apps, Power Automate a AI Builder používajú dataverse ako primárny systém úložiska údajov. Aktuálne údaje z existujúceho lokálneho systému možno migrovať do služby Dataverse pomocou toku údajov a potom tieto produkty môžu tieto údaje použiť.

Použitie tokov údajov na vytvorenie skladu údajov

Toky údajov môžete použiť ako náhradu za iné nástroje na extrahovanie, transformáciu, načítanie (ETL) a vytvorenie skladu údajov. V tomto scenári sa dátoví inžinieri spoločnosti rozhodli použiť toky údajov na vytvorenie svojho skladu údajov navrhnutých hviezdicovou schémou vrátane tabuliek faktov a dimenzií v úložisku Data Lake Storage. Služba Power BI sa potom používa na generovanie zostáv a tabúľ tak, že získava údaje z tokov údajov.

Image of how to build a data warehouse using dataflows.

Použitie tokov údajov na vytvorenie dimenzionálneho modelu

Toky údajov môžete použiť ako náhradu za iné nástroje ETL na vytvorenie dimenzionálneho modelu. Dátoví inžinieri spoločnosti sa napríklad rozhodli použiť toky údajov na vytvorenie hviezdicovej schémy navrhnutej dimenzionálneho modelu vrátane tabuliek faktov a dimenzií v službe Azure Data Lake Storage Gen2. Služba Power BI sa potom používa na generovanie zostáv a tabúľ tak, že získava údaje z tokov údajov.

Image of how to build a dimensional model using dataflows.

Centralizácia prípravy údajov a opätovného použitia sémantických modelov v rámci viacerých riešení služby Power BI

Ak viaceré riešenia Power BI používajú rovnakú transformované verzie tabuľky, proces vytvorenia tabuľky sa zopakuje viackrát. Zvýši sa tým zaťaženie zdrojového systému, spotrebúva viac zdrojov a vytvára duplicitné údaje s viacerými bodmi zlyhania. Namiesto toho je možné vytvoriť jeden tok údajov na výpočet údajov pre všetky riešenia. Power BI potom môže opätovne použiť výsledok transformácie vo všetkých riešeniach. Tok údajov, ak sa používa takýmto spôsobom, môže byť súčasťou robustnej architektúry implementácie služby Power BI, ktorá vyhýba duplikátom kódu Power Query a znižuje náklady na údržbu vrstvy integrácie údajov.

Image of how tables can be reused across multiple solutions.

Ďalšie kroky

Nasledujúce články obsahujú ďalšie študijné materiály o tokoch údajov.