Lakehouse-oktatóanyag: Adatok betöltése a lakehouse-ba

Ebben az oktatóanyagban további dimenzió- és ténytáblákat fog beszedni a Wide World Importersből (WWI) a tóházba.

Előfeltételek

Adatok betöltése

Ebben a szakaszban a Data Factory-folyamat adatmásolási tevékenységével betölti a mintaadatokat egy Azure Storage-fiókból a korábban létrehozott tóház Fájlok szakaszába.

  1. A bal oldali navigációs panelen válassza a Munkaterületek lehetőséget, majd a Munkaterületek menüből válassza ki az új munkaterületet . Megjelenik a munkaterület elemnézete.

  2. A munkaterület lap +Új gombján válassza az Adatfolyamat lehetőséget.

    Screenshot showing how to create a new data pipeline.

  3. Az Új folyamat párbeszédpanelen adja meg az IngestDataFromSourceToLakehouse nevet, és válassza a Létrehozás lehetőséget. Létrejön és megnyílik egy új data factory-folyamat.

  4. Az újonnan létrehozott data factory-folyamaton válassza a Folyamattevékenység hozzáadása lehetőséget, hogy hozzáadjon egy tevékenységet a folyamathoz, és válassza az Adatok másolása lehetőséget. Ez a művelet másolási adattevékenységet ad hozzá a folyamatvászonhoz.

    Screenshot showing where to select Add pipeline activity and Copy data.

  5. Válassza ki az újonnan hozzáadott másolási adattevékenységet a vászonról. A tevékenységtulajdonságok a vászon alatti panelen jelennek meg (előfordulhat, hogy felfelé kell bontania az ablaktáblát a felső szél húzásával). A tulajdonságok panel Általános lapján adja meg a másolási adattevékenység nevét.

    Screenshot showing where to add the copy activity name on the General tab.

  6. A kijelölt másolási adattevékenység Forrás lapján válassza a Külsőadattároló típus , majd az + Új lehetőséget az adatforráshoz való új kapcsolat létrehozásához.

    Screenshot showing where to select External and + New on the Source tab.

  7. Ebben az oktatóanyagban az összes mintaadat elérhető az Azure Blob Storage nyilvános tárolójában. Ehhez a tárolóhoz csatlakozva adatokat másolhat belőle. Az Új kapcsolat varázslóban válassza az Azure Blob Storage lehetőséget, majd a Folytatás lehetőséget.

    Screenshot of the New connection wizard, showing where to select Azure Blob Storage.

  8. Az Új kapcsolat varázsló következő képernyőjén adja meg az alábbi adatokat, és válassza a Létrehozás lehetőséget az adatforráshoz való kapcsolat létrehozásához.

    Tulajdonság Érték
    Fióknév vagy URI https://azuresynapsestorage.blob.core.windows.net/sampledata
    Kapcsolat Új kapcsolat létrehozása
    Kapcsolat neve wwisampledata
    Hitelesítési típus Névtelen

    Screenshot of the Connection settings screen, showing where to enter the details and select Create.

  9. Az új kapcsolat létrehozása után térjen vissza a másolási adattevékenység Forrás lapjára, és alapértelmezés szerint az újonnan létrehozott kapcsolat van kiválasztva. A célbeállításokra való áttérés előtt adja meg a következő tulajdonságokat.

    Tulajdonság Érték
    Adattár típusa Külső
    Kapcsolat wwisampledata
    Fájl elérési útja Fájl elérési útja
    Fájl elérési útja Tároló neve (első szövegmező): sampledata
    Könyvtár neve (második szövegmező): WideWorldImportersDW/parquet
    Rekurzív Jelölje be
    Fájlformátum Bináris

    Screenshot of the source tab showing where to enter the specific details.

  10. A kijelölt másolási adattevékenység Cél lapján adja meg a következő tulajdonságokat:

    Tulajdonság Érték
    Adattár típusa Munkaterület
    Munkaterület adattártípusa Lakehouse
    Lakehouse wwilakehouse
    Gyökérmappa Fájlok
    Fájl elérési útja Címtár neve (első szövegmező): wwi-raw-data
    Fájlformátum Bináris

    Screenshot of the Destination tab, showing where to enter specific details.

  11. Befejezte a másolási adattevékenység konfigurálását. A módosítások mentéséhez kattintson a felső menüszalag Mentés gombjára (a Kezdőlap alatt), majd a Futtatás gombra a folyamat és a tevékenység végrehajtásához. A folyamatokat úgy is ütemezheti, hogy meghatározott időközönként frissítsenek adatokat az üzleti követelményeknek megfelelően. Ebben az oktatóanyagban csak egyszer futtatjuk a folyamatot a Futtatás gombra kattintva.

    Ez a művelet elindítja az adatmásolást a mögöttes adatforrásból a megadott tóházba, és akár egy percet is igénybe vehet. A folyamat és a tevékenység végrehajtását a Kimenet lapon követheti nyomon, amely akkor jelenik meg, ha a vászon bármely pontjára kattint. Ha szeretné, kiválaszthatja a szemüveg ikont, amely a név fölé mutatva jelenik meg az adatátvitel részleteinek megtekintéséhez.

    Screenshot showing where to select Save and Run, and where to find the run details and glasses icon on the Output tab.

  12. Az adatok másolása után lépjen a munkaterület elemnézetére, és válassza ki az új tóházat (wwilakehouse) a Lakehouse Explorer elindításához.

    Screenshot showing where to select the lakehouse to launch the Lakehouse explorer.

  13. Ellenőrizze, hogy a Lakehouse Explorer nézetben létre lett-e hozva egy új mappa wwi-raw-data , és az összes tábla adatai oda lettek másolva.

    Screenshot showing the source data is copied into the Lakehouse explorer.

Következő lépés