Zdieľať cez


Rýchla konfigurácia: Premiestnenie a transformácia údajov pomocou tokov údajov a kanálov údajov

V tomto kurze zistíte, ako môže prostredie toku údajov a kanála údajov vytvoriť výkonné a komplexné riešenie služby Data Factory.

Predpoklady

Na začiatok musíte mať nasledujúce predpoklady:

Toky údajov v porovnaní s kanálmi

Toky údajov Gen2 vám umožňujú používať rozhranie s minimálnym použitím kódu a viac ako 300 transformácií údajov a transformácií založených na umelej inteligencii, ktoré vám umožnia jednoducho čistiť, pripravovať a transformovať údaje s väčšou flexibilitou ako ktorýkoľvek iný nástroj. Kanály údajov umožňujú komplexné preddeľovacie funkcie prípravy údajov na vytváranie flexibilných pracovných postupov údajov, ktoré spĺňajú vaše podnikové potreby. V kanáli môžete vytvárať logické zoskupenia aktivít, ktoré vykonávajú úlohu, medzi ktoré môže patriť volanie toku údajov na vyčistenie a prípravu údajov. Hoci sa tieto dve funkcie prekrývajú, výber funkcie, ktorú chcete použiť pre konkrétny scenár, závisí od toho, či budete potrebovať úplné bohatstvo kanálov, alebo môžete použiť jednoduchšie, ale obmedzenejšie možnosti tokov údajov. Ďalšie informácie nájdete v príručke k rozhodnutiu pre Fabric

Transformácia údajov pomocou tokov údajov

Ak chcete nastaviť tok údajov, postupujte podľa týchto krokov.

Krok č. 1: Vytvorenie toku údajov

  1. Vyberte pracovný priestor povolený v službe Fabric a potom vyberte položku Nový. Potom vyberte Tok údajov Gen2.

    Snímka obrazovky zobrazujúca, kde začať vytvárať tok údajov Gen2.

  2. Zobrazí sa okno editora toku údajov. Vyberte kartu Importovať z aplikácie SQL Server.

    Snímka obrazovky zobrazujúca okno editora toku údajov.

Krok č. 2: Získanie údajov

  1. V dialógovom okne Pripojiť k zdroju údajov dialógovom okne zadajte podrobnosti, ktoré chcete pripojiť k databáze Azure SQL, a potom vyberte položku Ďalšie. V tomto príklade použijete AdventureWorksLT vzorovú databázu nakonfigurovanú pri nastavovaní databázy Azure SQL na splnenie požiadaviek.

    Snímka obrazovky zobrazujúca spôsob pripojenia k databáze Azure SQL.

  2. Vyberte údaje, ktoré chcete transformovať, a potom vyberte položky Vytvoriť. V tomto stručnom úvode vyberte SalesLT.Customer z AdventureWorksLT vzorové údaje poskytnuté pre databázu Azure SQL a potom tlačidlo Vybrať súvisiace tabuľky automaticky zahrnúť dve ďalšie súvisiace tabuľky.

    Snímka obrazovky zobrazujúca, kde si môžete vybrať z dostupných údajov.

Krok č. 3: Transformácia údajov

  1. Ak nie je vybratá, vyberte tlačidlo zobrazenia diagramu v stavovom riadku v dolnej časti stránky alebo vyberte položku Zobrazenie diagramu v ponuke Zobraziť v hornej časti editora Power Query. Pomocou niektorej z týchto možností môžete prepínať zobrazenie diagramu.

    Snímka obrazovky zobrazujúca miesto, kde vybrať zobrazenie diagramu.

  2. Kliknite pravým tlačidlom myši na dotaz SalesLT Customer, alebo vyberte zvislé tri bodky napravo od dotazu a potom vyberte položku Zlúčiť dotazy.

    Snímka obrazovky zobrazujúca, kde nájsť možnosť Zlúčiť dotazy.

  3. Zlúčenie nakonfigurujte výberom tabuľky SalesLTOrderHeader ako pravej tabuľky na zlúčenie, stĺpca CustomerID z každej tabuľky ako stĺpca spojenia a ľavý vonkajší ako druh spojenia. Potom vyberte OK a pridajte zlučovací dotaz.

    snímka obrazovky zlučovania konfiguračnej obrazovky.

  4. V novom zlučovacích dotazoch, ktorý ste vytvorili, vyberte tlačidlo Pridať cieľové údajov, ktoré vyzerá ako symbol databázy so šípkou nad ním. Ako typ cieľa potom vyberte možnosť databázu Azure SQL.

    Snímka obrazovky so zvýraznením tlačidla Pridať cieľové umiestnenie údajov v novovytvorenom dotaze na zlúčenie.

  5. Zadajte podrobnosti pre pripojenie k databáze Azure SQL, v ktorej sa má zlučovací dotaz publikovať. V tomto príklade môžete použiť databázu AdventureWorksLT, ktorú sme použili aj ako zdroj údajov pre cieľ.

    Snímka obrazovky znázorňujúca dialógové okno Pripojenie k cieľu údajov s vyplnenými vzorovými hodnotami.

  6. Vyberte databázu na uloženie údajov a zadajte názov tabuľky. Potom vyberte položky Ďalej.

    Snímka obrazovky zobrazujúca okno Vybrať cieľový cieľ.

  7. Predvolené nastavenia môžete dialógovom okne Vybrať cieľové nastavenia ponechať v a jednoducho vybrať Uložiť nastavenia bez toho, aby ste tu vykonať nejaké zmeny.

    Snímka obrazovky zobrazujúca dialógové okno Vybrať cieľové nastavenia.

  8. Vyberte položku Publikovať späť na stránke editora toku údajov a publikujte tok údajov.

    Snímka obrazovky so zvýraznením tlačidla Publikovať v editore toku údajov Gen2.

Premiestnenie údajov pomocou kanálov údajov

Teraz, keď ste vytvorili tok údajov Gen2, môžete s ním pracovať v kanáli. V tomto príklade skopírujete údaje vygenerované z toku údajov do textového formátu v konte ukladacieho priestoru objektu BLOB platformy Azure.

Krok č. 1: Vytvorenie nového kanála údajov

  1. V pracovnom priestore vyberte položku Novéa potom vyberte položku Kanál údajov.

    Snímka obrazovky zobrazujúca, kde sa má spustiť nový kanál údajov.

  2. Pomenujte kanál a potom vyberte položky Vytvoriť.

    Snímka obrazovky zobrazujúca výzvu na vytvorenie nového kanála s názvom ukážky kanála.

Krok č. 2: Konfigurácia toku údajov

  1. Pridajte do kanála údajov novú aktivitu toku údajov výberom Tok údajov na karte aktivity aktivity.

    Snímka obrazovky zobrazujúca, kde vybrať možnosť Tok údajov.

  2. Na plátne kanála vyberte tok údajov a potom kartu nastavenia Nastavenia. Z rozbaľovacieho zoznamu vyberte tok údajov, ktorý ste predtým vytvorili.

    Snímka obrazovky zobrazujúca spôsob výberu vytvoreného toku údajov.

  3. Vyberte položku Uložiťa potom Spustiť spustite tok údajov, aby sa na začiatku vyplnila jeho zlúčená tabuľka dotazov, ktorú ste navrhli v predchádzajúcom kroku.

    Snímka obrazovky zobrazujúca miesto, kde vybrať položku Spustiť.

Krok č. 3: Pridanie aktivity kopírovania pomocou asistenta kopírovania

  1. Začnite výberom položky Kopírovanie údajov na plátne a otvorte nástroj Copy Assistant. Prípadne vyberte položku Použiť asistenta kopírovania v rozbaľovacom zozname Kopírovať údaje na karte Aktivity na páse s nástrojmi.

    Snímka obrazovky zobrazujúca dva spôsoby, ako získať prístup k asistentovi kopírovania.

  2. Výberom typu zdroja údajov vyberte zdroj údajov. V tomto kurze použijete databázu Azure SQL, ktorá sa používala predtým pri vytváraní toku údajov na generovanie nového zlučovacieho dotazu. Posuňte sa nadol pod ponuku vzorových údajov a vyberte kartu Azure a potom databázu Azure SQL. Potom pokračujte výberom položky Ďalšie.

    Snímka obrazovky zobrazujúca, kde vybrať zdroj údajov.

  3. Vytvorte pripojenie k svojmu zdroju údajov výberom položky Vytvoriť nové pripojenie. Vyplňte požadované informácie o pripojení na paneli a zadajte AdventureWorksLT pre databázu, v ktorej sme vygenerovali zlučovací dotaz v toku údajov. Potom vyberte Ďalšie.

    Snímka obrazovky zobrazujúca miesto vytvorenia nového pripojenia.

  4. Vyberte tabuľku, ktorú ste vygenerovali v kroku toku údajov predtým, a potom vyberte položku Ďalej.

    Snímka obrazovky zobrazujúca spôsob výberu z dostupných tabuliek.

  5. Pre svoj cieľ vyberte ukladací priestor objektu BLOB platformy Azure a potom vyberte Ďalej.

    Snímka obrazovky zobrazujúca cieľ údajov ukladacieho priestoru objektu BLOB platformy Azure.

  6. Vytvorte pripojenie k cieľu výberom položky Vytvoriť nové pripojenie. Zadajte podrobnosti o pripojení a potom vyberte Ďalej.

    Snímka obrazovky zobrazujúca spôsob vytvorenia pripojenia.

  7. Vyberte cestu k priečinku a zadajte Názov súboru, potom vyberte položky Ďalej.

    Snímka obrazovky zobrazujúca spôsob výberu cesty k priečinku a názvu súboru.

  8. Opätovným výberom položky Ďalej vyjadrite súhlas s predvoleným formátom súboru, oddeľovačom stĺpcov, oddeľovačom riadkov a typom kompresie, prípadne zahrnutím hlavičky.

    Snímka obrazovky zobrazujúca možnosti konfigurácie súboru v službe Azure Blob Storage.

  9. Finalizujte nastavenia. Potom proces dokončite výberom položky Uložiť a spustiť.

    Snímka obrazovky zobrazujúca spôsob kontroly nastavení kopírovania údajov.

Krok č. 5: Návrh údajového kanála a uloženie na spustenie a načítanie údajov

  1. Ak chcete spustiť aktivitu Kopírovaťpo aktivite Tok údajov, presuňte položku Úspešné v Tok údajov aktivitu do aktivity Kopírovať. Aktivita kopírovania sa spustí až po úspešnej aktivite toku údajov.

    Snímka obrazovky zobrazujúca, ako spustiť tok údajov po kopírovaní.

  2. Ak chcete uložiť kanál údajov, vyberte položku Uložiť. Potom vyberte položku Spustiť spustíte údajový kanál a načítajte údaje.

    Snímka obrazovky zobrazujúca miesto, kde môžete vybrať položku Uložiť a spustiť.

Naplánovanie spustenia kanála

Keď dokončíte vývoj a testovanie kanála, môžete naplánovať jeho automatické spustenie.

  1. Na karte Domov okna editora kanála vyberte položky Naplánovať.

    Snímka obrazovky tlačidla Plán v ponuke karty Domov v editore kanála.

  2. Podľa potreby nakonfigurujte plán. V tomto príklade sa kanál vykonáva denne o 20:00 až do konca roka.

    Snímka obrazovky znázorňujúca konfiguráciu plánu kanála, ktorý sa má spustiť denne o 20:00 až do konca roka.

V tejto ukážke sa dozviete, ako vytvoriť a nakonfigurovať tok údajov Gen2 na vytvorenie zlučovacieho dotazu a jeho uloženie do databázy Azure SQL. Potom skopírujte údaje z databázy do textového súboru v službe Azure Blob Storage. Naučili ste sa:

  • Vytvorte tok údajov.
  • Transformovať údaje pomocou toku údajov.
  • Vytvorte kanál údajov pomocou toku údajov.
  • Zoradte vykonanie krokov v kanáli.
  • Kopírovanie údajov pomocou Copy Assistant (Kopírovať asistenta).
  • Spustite a naplánujte svoj údajový kanál.

V ďalšom kroku sa dozviete viac o monitorovaní spustení kanála.