Opplæring i Lakehouse: Innta data i lakehouse
I denne opplæringen inntar du flere dimensjonale tabeller og faktatabeller fra Wide World Importers (WWI) inn i lakehouse.
Forutsetning
Hent inn data
I denne delen bruker du kopier dataaktiviteten til Data Factory-datasamlebåndet til å innta eksempeldata fra en Azure-lagringskonto til Filer-delen av lakehouse du opprettet tidligere.
Velg Arbeidsområder i venstre navigasjonsrute, og velg deretter det nye arbeidsområdet fra Arbeidsområder-menyen . Elementer-visningen av arbeidsområdet vises.
Velg Dataforløp fra +Ny-knappen på arbeidsområdesiden.
Angi navnet som IngestDataFromSourceToLakehouse i dialogboksen Ny datasamlebånd, og velg Opprett. Et nytt datafabrikkforløp opprettes og åpnes.
På det nyopprettede datafabrikkforløpet velger du Legg til datasamlebåndaktivitet for å legge til en aktivitet i datasamlebåndet og velge Kopier data. Denne handlingen legger til kopiering av dataaktivitet på datasamlebåndlerretet.
Velg den nylig lagt til kopierte dataaktiviteten fra lerretet. Aktivitetsegenskaper vises i en rute under lerretet (du må kanskje utvide ruten oppover ved å dra den øverste kanten). Angi navnet på kopieringsdataaktiviteten Datakopi til Lakehouse under Fanen Generelt i egenskapsruten.
Velg Ekstern som datalagertype under Kilde-fanen for den valgte kopieringsdataaktiviteten, og velg deretter + Ny for å opprette en ny tilkobling til datakilden.
For denne opplæringen er alle eksempeldataene tilgjengelige i en offentlig beholder med Azure blob storage. Du kobler til denne beholderen for å kopiere data fra den. Velg Azure Blob Storage i veiviseren for ny tilkobling, og velg deretter Fortsett.
Skriv inn følgende detaljer på neste skjermbilde i veiviseren for ny tilkobling , og velg Opprett for å opprette tilkoblingen til datakilden.
Egenskap Verdi Kontonavn eller URI https://azuresynapsestorage.blob.core.windows.net/sampledata
Connection Opprett ny tilkobling Koble til ionnavn wwisampledata Godkjenningstype Anonym Når den nye tilkoblingen er opprettet, går du tilbake til Kilde-fanen for kopieringsdataaktiviteten, og den nylig opprettede tilkoblingen velges som standard. Angi følgende egenskaper før du går over til målinnstillingene.
Egenskap Verdi Datalagertype Ekstern Connection wwisampledata Filtype Filbane Filbane Beholdernavn (første tekstboks): eksempeldata
Katalognavn (andre tekstboks): WideWorldImportersDW/parquetRekursivt Avmerket File format Binær Angi følgende egenskaper under Mål-fanen for den valgte kopidataaktiviteten:
Egenskap Verdi Datalagertype Arbeidsområde Datalagertype for arbeidsområde Lakehouse Lakehouse wwilakehouse Rotmappe Files Filbane Katalognavn (første tekstboks): wwi-raw-data File format Binær Du er ferdig med å konfigurere kopieringsdataaktiviteten. Velg Lagre-knappen på det øverste båndet (under Hjem) for å lagre endringene, og velg Kjør for å kjøre datasamlebåndet og aktiviteten. Du kan også planlegge datasamlebånd for å oppdatere data med definerte intervaller for å oppfylle forretningskravene dine. For denne opplæringen kjører vi datasamlebåndet bare én gang ved å klikke Kjør-knappen.
Denne handlingen utløser datakopi fra den underliggende datakilden til det angitte lakehouse og kan ta opptil ett minutt å fullføre. Du kan overvåke kjøringen av datasamlebåndet og aktiviteten under Utdata-fanen , som vises når du klikker hvor som helst på lerretet. Du kan også velge briller-ikonet, som vises når du holder pekeren over navnet, for å se på detaljene for dataoverføringen.
Når dataene er kopiert, går du til elementer-visningen av arbeidsområdet og velger det nye lakehouse (wwilakehouse) for å starte Lakehouse Explorer.
Valider at i Utforsker-visningen i Lakehouse er det opprettet en ny mappe med wwi-raw-data , og at data for alle tabellene er kopiert der.
Neste trinn
Tilbakemeldinger
https://aka.ms/ContentUserFeedback.
Kommer snart: Gjennom 2024 faser vi ut GitHub Issues som tilbakemeldingsmekanisme for innhold, og erstatter det med et nytt system for tilbakemeldinger. Hvis du vil ha mer informasjon, kan du se:Send inn og vis tilbakemelding for