Modul 1: Opprette et datasamlebånd med Data Factory

Denne modulen tar 10 minutter, og inntar rådata fra kildelageret til bronsetabellen i et data Lakehouse ved hjelp av Kopier-aktiviteten i et datasamlebånd.

Trinnene på høyt nivå i modul 1 er som følger:

  1. Opprett et datasamlebånd.
  2. Bruk en kopieringsaktivitet i datasamlebåndet til å laste inn eksempeldata i et data Lakehouse.

Opprette et datasamlebånd

  1. En Microsoft Fabric-leierkonto med et aktivt abonnement kreves. Opprett en gratis konto.

  2. Kontroller at du har et Microsoft Fabric-aktivert arbeidsområde: Opprett et arbeidsområde.

  3. Logg på Power BI.

  4. Velg standard Power BI-ikon nederst til venstre på skjermen, og bytt til Data Factory-opplevelsen .

    Screenshot showing the selection of the Data Factory experience.

  5. Velg Datasamlebånd , og angi et datasamlebåndnavn. Velg deretter Opprett.

    Screenshot of the Data Factory start page with the button to create a new data pipeline selected.

    Screenshot showing the dialog to give the new pipeline a name.

Bruke en kopieringsaktivitet i datasamlebåndet til å laste inn eksempeldata til et data Lakehouse

Trinn 1: Bruk kopieringsassistenten til å konfigurere en kopiaktivitet.

Velg Kopier data for å åpne kopier assistentverktøyet.

Screenshot showing the selection of the Copy data activity from the new pipeline start page.

Trinn 2: Konfigurere innstillingene i kopieringsassistenten.

  1. Dialogboksen Kopier data vises med det første trinnet, Velg datakilde, uthevet. Rull ned om nødvendig til datakildedelen , og velg datakildetypen Azure Blob Storage . Velg deretter Neste.

    Screenshot showing the selection of the Azure Blob Storage data source type in the copy assistant on the Choose data source tab.

  2. I neste trinn velger du Opprett ny tilkobling , og deretter oppgir du nettadressen for bloblagringen som er vert for eksempeldataene som er angitt for denne opplæringen, på https://nyctaxisample.blob.core.windows.net/sample. Godkjenningstype er anonym. Velg Neste når url-adressen er angitt.

    Screenshot showing the creation of a new Azure Blob Storage connection with the URL for the sample data in the tutorial.

  3. Koble til til datakildetrinnet vises, og i utgangspunktet ser du en feil Som ikke kan føre opp filer, fordi tillatelser bare er gitt til eksempelmappen i blob-lagringsplassen. Angi mappenavn, eksempel, og velg Prøv på nytt.

    Screenshot showing the Unable to list files error with the folder name Sample provided.

    Merk

    Blob-lagringsmappen skiller mellom store og små bokstaver.

  4. Blob-lagringsleseren vises neste. Velg FILEN NYC-Taxi-Green-2015-01.parquet, og vent til forhåndsvisningen av data vises. Velg deretter Neste.

    Screenshot showing the preview data for the NYC-Taxi-Green-2015-01.parquet file.

  5. Velg Lakehouse og deretter Neste for å velge datamåltrinnet for kopieringsassistenten.

    Screenshot showing the selection of the Lakehouse destination on the Choose data destination tab of the Copy data assistant.

  6. Velg Opprett nytt Lakehouse på konfigurasjonssiden for datamål som vises, og skriv inn et navn for det nye Lakehouse. Velg deretter Neste på nytt.

    Screenshot showing the data destination configuration page of the Copy assistant, choosing the Create new Lakehouse option and providing a Lakehouse name.

  7. Konfigurer nå detaljene for Lakehouse-målet på siden Velg og tilordne til mappebane eller tabell. Velg Tabeller for rotmappen, angi et tabellnavn, og velg overskrivingshandlingen. Ikke merk av for Aktiver partisjon som vises når du har valgt handlingen Overskriv tabell.

    Screenshot showing the Connect to data destination tab of the Copy data assistant, on the Select and map to folder path or table step.

  8. Til slutt, på siden Se gjennom + lagre i kopieringsdataassistenten, kan du se gjennom konfigurasjonen. Fjern merket for Start dataoverføring umiddelbart for denne opplæringen, siden vi kjører aktiviteten manuelt i neste trinn. Velg deretter OK.

    Screenshot showing the Copy data assistant on the Review + save page.

Trinn 3: Kjør og vis resultatene av kopieringsaktiviteten.

  1. Velg Kjør-fanen i redigeringsprogrammet for datasamlebånd. Deretter velger du Kjør-knappen , og deretter lagrer og kjører du ved ledeteksten for å kjøre Kopier-aktiviteten.

    Screenshot showing the pipeline Run tab with the Run button highlighted.

    Screenshot showing the Save and run dialog with the Save and run button highlighted.

  2. Du kan overvåke kjøringen og kontrollere resultatene på Utdata-fanen under datasamlebåndlerretet. Velg kjør detaljer-knappen (briller-ikonet som vises når du holder pekeren over kjøringen av datasamlebåndet) for å vise kjøredetaljene.

    Screenshot showing the run details button in the pipeline Output tab.

  3. Kjøredetaljene viser 1 508 501 rader lest og skrevet.

    Screenshot of the Copy data details for the pipeline run.

  4. Utvid inndelingen varighetsfordeling for å se varigheten for hver fase av kopieringsaktiviteten. Når du har gjennomgått kopidetaljene, velger du Lukk.

    Screenshot showing the duration breakdown of the Copy activity run.

I denne første modulen til vår ende-til-ende-opplæring for din første dataintegrering ved hjelp av Data Factory i Microsoft Fabric, lærte du hvordan du gjør følgende:

  • Opprett et datasamlebånd.
  • Legg til en kopieringsaktivitet i datasamlebåndet.
  • Bruk eksempeldata og opprett et data Lakehouse for å lagre dataene i en ny tabell.
  • Kjør datasamlebåndet og vis detaljene og varighetsfordelingen.

Fortsett til neste del nå for å opprette dataflyten.