Opplæring i Lakehouse: Innta data i lakehouse

I denne opplæringen inntar du flere dimensjonale tabeller og faktatabeller fra Wide World Importers (WWI) inn i lakehouse.

Forutsetning

Hent inn data

I denne delen bruker du kopier dataaktiviteten til Data Factory-datasamlebåndet til å innta eksempeldata fra en Azure-lagringskonto til Filer-delen av lakehouse du opprettet tidligere.

  1. Velg Arbeidsområder i venstre navigasjonsrute, og velg deretter det nye arbeidsområdet fra Arbeidsområder-menyen . Elementer-visningen av arbeidsområdet vises.

  2. Velg Dataforløp fra +Ny-knappen på arbeidsområdesiden.

    Screenshot showing how to create a new data pipeline.

  3. Angi navnet som IngestDataFromSourceToLakehouse i dialogboksen Ny datasamlebånd, og velg Opprett. Et nytt datafabrikkforløp opprettes og åpnes.

  4. På det nyopprettede datafabrikkforløpet velger du Legg til datasamlebåndaktivitet for å legge til en aktivitet i datasamlebåndet og velge Kopier data. Denne handlingen legger til kopiering av dataaktivitet på datasamlebåndlerretet.

    Screenshot showing where to select Add pipeline activity and Copy data.

  5. Velg den nylig lagt til kopierte dataaktiviteten fra lerretet. Aktivitetsegenskaper vises i en rute under lerretet (du må kanskje utvide ruten oppover ved å dra den øverste kanten). Angi navnet på kopieringsdataaktiviteten Datakopi til Lakehouse under Fanen Generelt i egenskapsruten.

    Screenshot showing where to add the copy activity name on the General tab.

  6. Velg Ekstern som datalagertype under Kilde-fanen for den valgte kopieringsdataaktiviteten, og velg deretter + Ny for å opprette en ny tilkobling til datakilden.

    Screenshot showing where to select External and + New on the Source tab.

  7. For denne opplæringen er alle eksempeldataene tilgjengelige i en offentlig beholder med Azure blob storage. Du kobler til denne beholderen for å kopiere data fra den. Velg Azure Blob Storage i veiviseren for ny tilkobling, og velg deretter Fortsett.

    Screenshot of the New connection wizard, showing where to select Azure Blob Storage.

  8. Skriv inn følgende detaljer på neste skjermbilde i veiviseren for ny tilkobling , og velg Opprett for å opprette tilkoblingen til datakilden.

    Egenskap Verdi
    Kontonavn eller URI https://azuresynapsestorage.blob.core.windows.net/sampledata
    Connection Opprett ny tilkobling
    Koble til ionnavn wwisampledata
    Godkjenningstype Anonym

    Screenshot of the Connection settings screen, showing where to enter the details and select Create.

  9. Når den nye tilkoblingen er opprettet, går du tilbake til Kilde-fanen for kopieringsdataaktiviteten, og den nylig opprettede tilkoblingen velges som standard. Angi følgende egenskaper før du går over til målinnstillingene.

    Egenskap Verdi
    Datalagertype Ekstern
    Connection wwisampledata
    Filtype Filbane
    Filbane Beholdernavn (første tekstboks): eksempeldata
    Katalognavn (andre tekstboks): WideWorldImportersDW/parquet
    Rekursivt Avmerket
    File format Binær

    Screenshot of the source tab showing where to enter the specific details.

  10. Angi følgende egenskaper under Mål-fanen for den valgte kopidataaktiviteten:

    Egenskap Verdi
    Datalagertype Arbeidsområde
    Datalagertype for arbeidsområde Lakehouse
    Lakehouse wwilakehouse
    Rotmappe Files
    Filbane Katalognavn (første tekstboks): wwi-raw-data
    File format Binær

    Screenshot of the Destination tab, showing where to enter specific details.

  11. Du er ferdig med å konfigurere kopieringsdataaktiviteten. Velg Lagre-knappen på det øverste båndet (under Hjem) for å lagre endringene, og velg Kjør for å kjøre datasamlebåndet og aktiviteten. Du kan også planlegge datasamlebånd for å oppdatere data med definerte intervaller for å oppfylle forretningskravene dine. For denne opplæringen kjører vi datasamlebåndet bare én gang ved å klikke Kjør-knappen.

    Denne handlingen utløser datakopi fra den underliggende datakilden til det angitte lakehouse og kan ta opptil ett minutt å fullføre. Du kan overvåke kjøringen av datasamlebåndet og aktiviteten under Utdata-fanen , som vises når du klikker hvor som helst på lerretet. Du kan også velge briller-ikonet, som vises når du holder pekeren over navnet, for å se på detaljene for dataoverføringen.

    Screenshot showing where to select Save and Run, and where to find the run details and glasses icon on the Output tab.

  12. Når dataene er kopiert, går du til elementer-visningen av arbeidsområdet og velger det nye lakehouse (wwilakehouse) for å starte Lakehouse Explorer.

    Screenshot showing where to select the lakehouse to launch the Lakehouse explorer.

  13. Valider at i Utforsker-visningen i Lakehouse er det opprettet en ny mappe med wwi-raw-data , og at data for alle tabellene er kopiert der.

    Screenshot showing the source data is copied into the Lakehouse explorer.

Neste trinn