1. modul: Folyamat létrehozása a Data Factoryvel

Ez a modul 10 percet vesz igénybe, amikor nyers adatokat vesz fel a forrástárból egy data Lakehouse Bronz táblájába a folyamat Copy tevékenység használatával.

Az 1. modul magas szintű lépései a következők:

  1. Hozzon létre egy adatfolyamot.
  2. A folyamat másolási tevékenységével betölthet mintaadatokat egy data Lakehouse-ba.

Adatfolyam létrehozása

  1. Aktív előfizetéssel rendelkező Microsoft Fabric-bérlői fiók szükséges. Hozzon létre egy ingyenes fiókot.

  2. Győződjön meg arról, hogy rendelkezik Microsoft Fabric-kompatibilis munkaterületekkel: Hozzon létre egy munkaterületet.

  3. Jelentkezzen be a Power BI-ba.

  4. Válassza az alapértelmezett Power BI ikont a képernyő bal alsó részén, és váltson a Data Factory felületére.

    Screenshot showing the selection of the Data Factory experience.

  5. Válassza ki az adatfolyamatot , és adjon meg egy folyamatnevet. Válassza a Létrehozás parancsot.

    Screenshot of the Data Factory start page with the button to create a new data pipeline selected.

    Screenshot showing the dialog to give the new pipeline a name.

Mintaadatok betöltése a folyamat Copy tevékenység használatával egy data Lakehouse-ba

1. lépés: Másolási tevékenység konfigurálása a másolási segéd használatával.

Válassza az Adatok másolása lehetőséget a másolási segéd eszköz megnyitásához.

Screenshot showing the selection of the Copy data activity from the new pipeline start page.

2. lépés: A beállítások konfigurálása a másolási segédben.

  1. Megjelenik az Adatok másolása párbeszédpanel az első lépéssel, az Adatforrás kiválasztása elem kiemelésével. Ha szükséges, görgessen le az Adatforrások szakaszhoz, és válassza ki az Azure Blob Storage-adatforrás típusát. Ezután válassza a Tovább gombra.

    Screenshot showing the selection of the Azure Blob Storage data source type in the copy assistant on the Choose data source tab.

  2. A következő lépésben válassza az Új kapcsolat létrehozása lehetőséget, majd adja meg az oktatóanyaghoz megadott mintaadatokat tároló blobtároló URL-címét a következő helyen https://nyctaxisample.blob.core.windows.net/sample: . A hitelesítési típus névtelen. Az URL-cím megadása után válassza a Tovább gombot.

    Screenshot showing the creation of a new Azure Blob Storage connection with the URL for the sample data in the tutorial.

  3. Megjelenik az adatforrásra Csatlakozás lépés, és kezdetben hibaüzenet jelenik meg, amely nem tudja listázni a fájlokat, mert az engedélyek csak a blobtároló mintamappájának lettek megadva. Adja meg a mappa nevét, mintáját, és válassza az Újrapróbálkozás lehetőséget.

    Screenshot showing the Unable to list files error with the folder name Sample provided.

    Feljegyzés

    A blobtároló mappa megkülönbözteti a kis- és nagybetűkét, és kisbetűsnek kell lennie.

  4. Ekkor megjelenik a Blob Storage böngésző. Válassza ki a NYC-Taxi-Green-2015-01.parquet fájlt, és várja meg, amíg az adatok előnézete megjelenik. Ezután válassza a Tovább gombra.

    Screenshot showing the preview data for the NYC-Taxi-Green-2015-01.parquet file.

  5. A másolási segéd Adat célhelyének kiválasztása lépéséhez válassza a Lakehouse , majd a Tovább lehetőséget.

    Screenshot showing the selection of the Lakehouse destination on the Choose data destination tab of the Copy data assistant.

  6. Válassza az Új Lakehouse létrehozása lehetőséget a megjelenő adat célkonfigurációs lapon, és adja meg az új Lakehouse nevét. Ezután kattintson ismét a Tovább gombra.

    Screenshot showing the data destination configuration page of the Copy assistant, choosing the Create new Lakehouse option and providing a Lakehouse name.

  7. Most konfigurálja a Lakehouse-cél adatait a Kiválasztás és a mappa elérési útjának vagy táblázatának leképezése lapon. Válassza a Gyökérmappa Táblák elemét, adjon meg egy táblanevet, és válassza a Felülírás műveletet. Ne jelölje be a Partíció engedélyezése jelölőnégyzetet, amely a Felülírás táblaművelet kiválasztása után jelenik meg.

    Screenshot showing the Connect to data destination tab of the Copy data assistant, on the Select and map to folder path or table step.

  8. Végül tekintse át a konfigurációt a másolási adatsegéd Áttekintés + mentés lapján. Ebben az oktatóanyagban törölje a jelet azonnal az adatátvitel indítása jelölőnégyzetből, mivel a következő lépésben manuálisan futtatjuk a tevékenységet. Ezután válassza az OK gombra.

    Screenshot showing the Copy data assistant on the Review + save page.

3. lépés: Futtassa és tekintse meg a Copy tevékenység eredményeit.

  1. Válassza a Futtatás lapot a folyamatszerkesztőben. Ezután válassza a Futtatás gombot, majd a Mentés és futtatás a parancssorban a Copy tevékenység futtatásához.

    Screenshot showing the pipeline Run tab with the Run button highlighted.

    Screenshot showing the Save and run dialog with the Save and run button highlighted.

  2. Figyelheti a futtatásokat, és ellenőrizheti az eredményeket a folyamatvászon alatti Kimenet lapon. A futtatás részleteinek megtekintéséhez válassza a Futtatás részletei gombot (a futó folyamat futtatásakor megjelenő "szemüveg" ikont).

    Screenshot showing the run details button in the pipeline Output tab.

  3. A futtatás részletei 1 508 501 sor olvasását és írását jelenítik meg.

    Screenshot of the Copy data details for the pipeline run.

  4. Bontsa ki az Időtartam részletezés szakaszt a Copy tevékenység egyes szakaszainak időtartamához. A másolás részleteinek áttekintése után válassza a Bezárás lehetőséget.

    Screenshot showing the duration breakdown of the Copy activity run.

Ebben az első modulban, amely az első adatintegrációhoz készült, a Microsoft Fabricben a Data Factory használatával történő adatintegrációt bemutató oktatóanyagunk első moduljában elsajátította a következőket:

  • Hozzon létre egy adatfolyamot.
  • Adjon hozzá egy Copy tevékenység a folyamathoz.
  • Használjon mintaadatokat, és hozzon létre egy data Lakehouse-t az adatok új táblába való tárolásához.
  • Futtassa a folyamatot, és tekintse meg annak részleteit és időtartamának lebontását.

Folytassa a következő szakaszt az adatfolyam létrehozásához.