Del via


Opplæring i Lakehouse: Innta data i lakehouse

I denne opplæringen inntar du mer dimensjonale tabeller og faktatabeller fra Wide World Importers (WWI) til lakehouse.

Forutsetning

Hent inn data

I denne delen bruker du kopier dataaktiviteten til Data Factory-datasamlebåndet til å innta eksempeldata fra en Azure-lagringskonto til Filer-delen av lakehouse du opprettet tidligere.

  1. Velg Arbeidsområder i venstre navigasjonsrute, og velg deretter det nye arbeidsområdet fra Arbeidsområder-menyen . Elementer-visningen av arbeidsområdet vises.

  2. Fra alternativet Nytt element på arbeidsområdebåndet velger du Pipeline.

  3. Angi navnet som IngestDataFromSourceToLakehouse i dialogboksen Ny datasamlebånd, og velg Opprett.

  4. Velg Datasamlebåndaktivitet fra det nyopprettede datasamlebåndet for å legge til en aktivitet i datasamlebåndet, og velg Kopier data. Denne handlingen legger til kopieringsdataaktivitet på pipelinelerretet.

    Skjermbilde som viser hvor du kan velge Pipeline-aktivitet og Kopier data.

  5. Velg den nylig tilføyde kopieringsdataaktiviteten fra lerretet. Aktivitetsegenskaper vises i en rute under lerretet (du må kanskje utvide ruten oppover ved å dra den øvre kanten). Fra kategorien Generelt i egenskapsruten skriver du inn Datakopi til Lakehouse i Navn-feltet . La de gjenværende egenskapene være standardverdiene.

    Skjermbilde som viser hvor du skal legge til navnet på kopieringsaktiviteten i kategorien Generelt.

  6. Fra Kilde-fanen for den valgte kopieringsdataaktiviteten åpner du Tilkobling-feltet og velger Bla gjennom alle. Velg datakildevindu dukker opp, søk og velg Azure-blober. I denne opplæringen er alle eksempeldataene tilgjengelige i en offentlig beholder for Azure Blob Storage. Du kobler til denne beholderen for å kopiere data fra den.

  7. Skriv inn følgende detaljer i vinduet Tilkoblingsinnstillinger , og velg Koble til for å opprette tilkoblingen til datakilden.

    Egenskap Verdi
    Kontonavn eller URL-adresse https://fabrictutorialdata.blob.core.windows.net/sampledata/
    Connection Opprett ny tilkobling
    Tilkoblingsnavn wwisampledata
    Godkjenningstype Anonym

    Skjermbilde som viser hvor du kan velge Blob Storage-tilkobling.

  8. Når den nye tilkoblingen er opprettet, går du tilbake til Kilde-fanen for kopieringsdataaktiviteten, og den nyopprettede tilkoblingen velges som standard. Angi følgende egenskaper før du går til målinnstillingene.

    Egenskap Verdi
    Connection wwisampledata
    Type filbane Filbane
    Filbane Beholdernavn (første tekstboks): eksempeldata
    Katalognavn (andre tekstboks): WideWorldImportersDW/parkett
    Rekursivt Rutet
    Filformat Binary

    Skjermbilde som viser tilkoblingsinnstillingene for Blob Storage.

  9. Fra Mål-fanen for den valgte kopieringsdataaktiviteten angir du følgende egenskaper:

    Egenskap Verdi
    Connection wwilakehouse (velg ditt lakehouse hvis du kalte det annerledes)
    Rotmappen Files
    Filbane Katalognavn (første tekstboks): wwi-raw-data
    Filformat Binary

    Skjermbilde av destinasjonsfanen, som viser hvor du skal angi spesifikke detaljer.

  10. Du har konfigurert kopieringsdataaktiviteten. Velg Lagre-ikonet på det øverste båndet (under Hjem) for å lagre endringene, og velg Kjør for å kjøre datasamlebåndet og aktiviteten. Du kan også planlegge pipeliner for å oppdatere data med definerte intervaller for å oppfylle forretningskravene dine. I denne opplæringen kjører vi pipelinen bare én gang ved å velge Kjør.

  11. Denne handlingen utløser datakopiering fra den underliggende datakilden til det angitte innsjøhuset og kan ta opptil ett minutt å fullføre. Du kan overvåke kjøringen av pipelinen og aktiviteten under Output-fanen. Aktivitetsstatusen endres fraPågår> i >Vellykket.

    Skjermbilde som viser hvor du skal velge Lagre og kjør datasamlebåndet.

  12. Når kopieringsaktiviteten er vellykket, åpner du innsjøen (wwilakehouse) for å vise dataene. Oppdater Filer-delen for å se de inntatte dataene. En ny mappe wwi-raw-data vises i fildelen, og data fra Azure Blob-tabeller kopieres dit.

    Skjermbilde som viser blob-data kopiert til destinasjon lakehouse.

Neste trinn