Gyakorlat – Az adat-előállító másolási tevékenységének használata

Befejeződött

Miután a Data Factory-példány létrehozása befejeződött, lépjen arra az erőforrásra, ahol megkezdheti az adatfolyamok létrehozását a Szerző és figyelés gombra kattintva. Ekkor megnyílik a következő képernyő:

Authoring in Azure Data Factory

A folyamat első lépése egy másolási tevékenység létrehozása, amely adatokat másol a forrás és a cél között az alábbi lépések végrehajtásával.

  1. A rajzvászon megnyitásához kattintson a bal oldali oldalsáv ceruza ikonra , vagy a folyamat létrehozása gombra a szerzői vászon megnyitásához.

    Screenshot that shows the Create pipeline option highlighted.

  2. Hozza létre a folyamatot. Kattintson a + Gyári erőforrások panel gombra, és válassza a Folyamat lehetőséget.

    Screenshot that shows Factory Resources under the Data Factory tab. The plus symbol is selected, exposing Pipeline, both are highlighted.

  3. Másolási tevékenység hozzáadása. A Tevékenységek panelen nyissa meg az Áthelyezés és átalakításharmonikát, és húzza az Adatok másolása tevékenységet a folyamatvászonra.

    Using the Copy Activity

A másolási tevékenység hozzáadása után elkezdi meghatározni a forrásadatokat

  1. A Másolási tevékenység beállításainak Forrás lapján kattintson az + Új gombra egy adatforrás kiválasztásához.

    Creating as data source

  2. Az adattárak listájában például válassza ki az Amazon S3 csempét, és kattintson a Folytatás gombra

    Select Amazon S3 as a data source

  3. A fájlformátumok listájában válassza a DelimitedText formátum csempét, és kattintson a Folytatás gombra

    Screenshot that shows Delimited Text selected in the Select format list.

  4. A Tulajdonságok beállítása ablakban adjon érthető nevet az adathalmaznak, és kattintson a Társított szolgáltatás legördülő listára. Ha még nem hozta létre az S3 társított szolgáltatást, válassza az Új lehetőséget.

    Screenshot that shows the Set Properties window, with filter highlighted under Linked service.

  5. Az S3 társított szolgáltatás konfigurációs paneljén adja meg az S3 hozzáférési kulcsát és titkos kulcsát. A Data Factory szolgáltatás a Microsoft által kezelt tanúsítványokkal titkosítja a hitelesítő adatokat. További információ: Adatáthelyezési biztonsági szempontok. A hitelesítő adatok érvényességének ellenőrzéséhez kattintson a Tesztelés Csatlakozás ion elemre. Ha végzett, kattintson a Létrehozás gombra.

    Setting data source access with keys

  6. Miután létrehozta és kiválasztotta a csatolt szolgáltatást, adja meg az adathalmaz többi beállítását. Ezek a beállítások határozzák meg, hogy a kapcsolaton belül hogyan és hol szeretné lekérni az adatokat. Ha végzett, kattintson a Befejezés gombra.

    Finishing up data source settings

  7. Ha ellenőrizni szeretné, hogy az adathalmaz megfelelően van-e konfigurálva, kattintson az Adatok előnézete elemre a Másolási tevékenység Forrás lapján, és készítsen egy kis pillanatképet az adatokról.

    Previewing data

A forrásadatok definiálása után meg kell határoznia azt a fogadót, amelybe az adatok betöltésre kerülnek. Ebben a példában a fogadó az Azure Data Lake Storage Gen2 lesz az alábbi lépések végrehajtásával:

  1. A Fogadó lapon kattintson az + Új gombra

    Defining a data sink in the Copy Activity

  2. Válassza ki az Azure Data lake Storage Gen2 csempét, és kattintson a Folytatás gombra

    Defining the dataset

  3. A Tulajdonságok beállítása oldalon adjon érthető nevet az adathalmaznak, és kattintson a Társított szolgáltatás legördülő listára. Ha még nem hozta létre az ADLS társított szolgáltatást, válassza az Új lehetőséget.

    Setting the dataset properties

  4. Az ADLS társított szolgáltatás konfigurációs paneljén válassza ki a hitelesítési módszert , és adja meg a hitelesítő adatait. Az alábbi példában egy fiókkulcsot, és a legördülő listából kiválasztotta a tárfiókomat.

    Finalizing the dataset properties

  5. Miután konfigurálta a társított szolgáltatást, adja meg az ADLS-adatkészlet konfigurációját. Kattintson a befejezés gombra a befejezés után.

    Finish the dataset properties

Ezen a ponton teljes mértékben konfigurálta a másolási tevékenységet.

  1. A teszteléshez kattintson a folyamatvászon tetején található Hibakeresés gombra. Ezzel elindítja a folyamat hibakeresési futtatását.

    Testing the Copy Activity

  2. A folyamat hibakeresési futtatásának előrehaladásának figyeléséhez kattintson a folyamat Kimenet lapjára

    Monitoring the Copy Activity

  3. A tevékenység kimenetének részletesebb leírásához kattintson a szemüveg ikonra. Ekkor megnyílik a másolásfigyelési képernyő, amely olyan hasznos metrikákat biztosít, mint az olvasási/írási adatok, az átviteli sebesség és a részletes időtartamstatisztikák.

    Viewing the Copy Activity Results

Annak ellenőrzéséhez, hogy a másolat a várt módon működött-e, nyissa meg az ADLS gen2-tárfiókot, és ellenőrizze, hogy a fájl a várt módon lett-e megírva