Del via


Kopiér fra Azure Blob Storage til Lakehouse

I dette selvstudium opretter du en datapipeline for at flytte en CSV-fil fra en inputmappe i en Azure Blob Storage-kilde til en Lakehouse-destination.

Forudsætninger

For at komme i gang skal du fuldføre følgende forudsætninger:

  • Sørg for, at du har et Project Microsoft Fabric-aktiveret arbejdsområde: Opret et arbejdsområde.

  • Vælg knappen Prøv det nu! for at forberede Azure Blob Storage-datakilden for Kopiér. Opret en ny ressourcegruppe for dette Azure Blob Storage, og vælg Gennemse + Opret>opret.

    Prøv din første demo af datafabrikken

    Skærmbillede af skærmen Projektdetaljer.

    Derefter oprettes der et Azure Blob Storage, og moviesDB2.csv uploadet til inputmappen for det oprettede Azure Blob Storage.

    Skærmbillede, der viser, hvor nyt lager vises i mappen.

Opret en datapipeline

  1. Skift til Data factory på siden app.powerbi.com.

    Skærmbillede af menuen, hvor indstillingen Data factory vises.

  2. Opret et nyt arbejdsområde til denne demo.

    Skærmbillede af skærmbilledet Arbejdsområde.

  3. Vælg Ny, og vælg derefter Datapipeline.

    Skærmbillede af menuen Ny.

Kopiér data ved hjælp af Kopiér assistent

I denne session begynder du at bygge en datapipeline ved hjælp af følgende trin. Disse trin kopierer en CSV-fil fra en inputmappe i et Azure Blob Storage til en Lakehouse-destination ved hjælp af kopiassistenten.

Trin 1: Start med kopiassistenten

  1. Vælg Kopiér dataassistent på lærredet for at åbne kopiassistentværktøjet for at komme i gang. Eller vælg Brug kopiassistentrullelisten Kopiér data under fanen Aktiviteter på båndet.

    Skærmbillede af to muligheder for at vælge kopiassistent.

Trin 2: Konfigurer din kilde

  1. Skriv blob i markeringsfilteret, vælg derefter Azure Blobs, og vælg Næste.

    Skærmbillede, der viser, hvor du skal vælge Azure Blob Storage som datakilde.

  2. Angiv dit kontonavn eller din URL-adresse, og opret en forbindelse til datakilden ved at vælge Opret ny forbindelse under rullelisten Forbind ion.

    Skærmbillede, der viser, hvor du skal vælge Ny forbindelse.

    1. Når du har valgt Opret ny forbindelse med din lagerkonto angivet, skal du kun udfylde Godkendelsestype. I denne demo vælger vi Kontonøgle , men du kan vælge en anden godkendelsestype , afhængigt af dine præferencer.

      Skærmbillede, der viser skærmen Forbind til datakilden i kopiér dataassistenten.

    2. Når forbindelsen er oprettet, skal du kun vælge Næste for at Forbind til datakilden.

  3. Vælg den fil moviesDB2.csv i kildekonfigurationen, der skal vises, og vælg derefter Næste.

    Skærmbillede, der viser, hvordan du vælger datakilde.

Trin 3: Konfigurer din destination

  1. Vælg Lakehouse.

    Skærmbillede, der viser dialogboksen Vælg datadestination med Lakehouse valgt.

  2. Angiv et navn til det nye Lakehouse. Vælg derefter Opret og opret forbindelse.

    Skærmbillede, der viser dialogboksen Vælg datadestination med indstillingen Ny lakehouse valgt.

  3. Konfigurer og knyt kildedataene til destinationen. Vælg derefter Næste for at afslutte dine destinationskonfigurationer.

    Skærmbillede, der viser dialogboksen Forbind til datadestination i kopiér dataassistenten med tabelnavnet MoviesDB udfyldt.

Trin 4: Gennemse og opret din kopiaktivitet

  1. Gennemse indstillingerne for kopiaktivitet i de forrige trin, og vælg Gem + kør for at afslutte. Du kan også gå tilbage til de forrige trin for at redigere dine indstillinger, hvis det er nødvendigt i værktøjet.

    Skærmbillede, der viser skærmen Gennemse + opret i dialogboksen Kopiér dataassistent.

  2. Når du er færdig, føjes kopiaktiviteten til dit datapipelinelærred og kører direkte, hvis du har forladt afkrydsningsfeltet Start dataoverførsel med det samme markeret.

    Skærmbillede, der viser den færdige kopiaktivitet.

Kør og planlæg din datapipeline

  1. Hvis du ikke forlod afkrydsningsfeltet Start dataoverførsel med det sammesiden Gennemse + opret , skal du skifte til fanen Hjem og vælge Kør. Vælg derefter Gem og kør.

    Skærmbillede, der viser knappen Kør for aktiviteten på fanen Hjem.

    Skærmbillede, der viser dialogboksen Gem og kør for kopieringsaktiviteten.

  2. Under fanen Output skal du vælge linket med navnet på din kopiaktivitet for at overvåge status og kontrollere resultaterne af kørslen.

    Skærmbillede, der viser knappen Kør detaljer.

  3. Dialogboksen Kopiér datadetaljer viser resultaterne af kørslen, herunder status, mængden af data, der er læst og skrevet, start- og stoptider og varighed.

    Skærmbillede, der viser dialogboksen Kopiér datadetaljer.

  4. Du kan også planlægge, at pipelinen skal køre med en bestemt hyppighed efter behov. I følgende eksempel kan du se, hvordan du planlægger, at pipelinen skal køre hvert 15. minut.

    Skærmbillede, der viser dialogboksen til konfiguration af tidsplan.

    Skærmbillede, der viser en pipeline med en konfigureret tidsplan til at køre hvert 15. minut.

Pipelinen i dette eksempel viser, hvordan du kopierer data fra Azure Blob Storage til Lakehouse. Du har lært, hvordan du:

  • Opret en datapipeline.
  • Kopiér data med Kopiér assistent.
  • Kør og planlæg din datapipeline.

Gå derefter videre for at få mere at vide om overvågning af dine pipelinekørsler.