Kopiér fra Azure Blob Storage til Lakehouse

I dette selvstudium skal du oprette en datapipeline for at flytte en CSV-fil fra en inputmappe i en Azure Blob Storage kilde til en Lakehouse-destination.

Vigtigt

Microsoft Fabric findes i øjeblikket i PRØVEVERSION. Disse oplysninger er relateret til et foreløbig produkt, der kan blive ændret væsentligt, før det udgives. Microsoft giver ingen garantier, udtrykt eller stiltiende, med hensyn til de oplysninger, der er angivet her. Se Azure Data Factory dokumentation for tjenesten i Azure.

Forudsætninger

Du skal fuldføre følgende forudsætninger for at komme i gang:

  • Sørg for, at du har et Project Microsoft Fabric-aktiveret arbejdsområde: Opret et arbejdsområde.

  • Vælg knappen Prøv det nu! for at forberede den Azure Blob Storage datakilde for Kopiér. Opret en ny ressourcegruppe for denne Azure Blob Storage, og vælg Gennemse + Opret>opret.

    Prøv din første demo af datafabrikken

    Skærmbillede af skærmen Project details.

    Derefter oprettes der en Azure Blob Storage, og moviesDB2.csv overføres til inputmappen for den oprettede Azure Blob Storage.

    Skærmbillede, der viser, hvor nyt lager vises i mappen.

Opret en datapipeline

  1. Skift til Data factory på siden app.powerbi.com.

    Skærmbillede af menu, hvor indstillingen Data factory vises.

  2. Opret et nyt arbejdsområde til denne demo.

    Skærmbillede af skærmbilledet Arbejdsområde.

  3. Vælg Ny, og vælg derefter Datapipeline.

    Skærmbillede af menuen Ny.

Kopiér data ved hjælp af Kopiér assistent

I denne session skal du begynde at oprette en datapipeline ved hjælp af følgende trin. Disse trin kopierer en CSV-fil fra en inputmappe i en Azure Blob Storage til en Lakehouse-destination ved hjælp af kopiassistenten.

Trin 1: Start med kopiassistent

  1. Vælg Kopiér data på lærredet for at åbne værktøjet kopiassistent for at komme i gang. Eller vælg Brug kopieringsassistent på rullelisten Kopiér data under fanen Aktiviteter på båndet.

    Skærmbillede af to indstillinger til valg af kopiassistent.

Trin 2: Konfigurer din kilde

  1. Vælg Azure Blob Storage, og vælg derefter Næste.

    Skærmbillede, der viser, hvor du kan vælge Azure Blob Storage som datakilde.

  2. Opret en forbindelse til datakilden ved at vælge Ny forbindelse.

    Skærmbillede, der viser, hvor du kan vælge Ny forbindelse.

    1. Når du har valgt Opret ny forbindelse, skal du kun udfylde Kontonavn eller URL-adresse og Godkendelsestype. Hvis du angiver Kontonavn eller URL-adresse ved hjælp af dit Azure Blob Storage kontonavn, udfyldes forbindelsen automatisk. I denne demo vælger vi Kontonøgle , men du kan vælge en anden godkendelsestype vedrørende dine præferencer. Når du har valgt Log på, skal du kun logge på én konto, der har denne tilladelse til bloblager.

      Skærmbillede, der viser skærmbilledet Opret forbindelse til datakilde i kopiér dataassistenten.

    2. Når forbindelsen er oprettet, skal du kun vælge Næste for at oprette forbindelse til datakilde.

  3. Vælg den filmoviesDB2.csv i kildekonfigurationen, der skal vises, og vælg derefter Næste.

    Skærmbillede, der viser, hvordan du vælger datakilde.

Trin 3: Konfigurer din destination

  1. Vælg Lakehouse og derefter Næste.

    Skærmbillede, der viser dialogboksen Vælg datadestination med Lakehouse valgt.

  2. Opret et nyt Lakehouse, og skriv navnet på Lakehouse. Vælg derefter Næste.

    Skærmbillede, der viser dialogboksen Vælg datadestination med indstillingen Nyt lakehouse valgt.

  3. Konfigurer og knyt kildedataene til destinationen. vælg derefter Næste for at afslutte dine destinationskonfigurationer.

    Skærmbillede, der viser dialogboksen Opret forbindelse til datadestination i kopiér dataassistenten med tabelnavnet FilmDB udfyldt.

Trin 4: Gennemse og opret din kopiaktivitet

  1. Gennemse indstillingerne for kopieringsaktivitet i de forrige trin, og vælg OK for at afslutte. Du kan også gå tilbage til de forrige trin for at redigere dine indstillinger, hvis det er nødvendigt i værktøjet.

    Skærmbillede, der viser skærmbilledet Gennemse + opret i dialogboksen Kopiér dataassistent.

  2. Når du er færdig, føjes kopiaktiviteten derefter til dit datapipelinelærred. Alle indstillinger, herunder avancerede indstillinger for denne kopiaktivitet, er tilgængelige under fanerne nedenfor, når den er valgt.

    Skærmbillede, der viser den færdige kopiaktivitet.

Kør og planlæg din datapipeline

  1. Skift til fanen Hjem, og vælg Kør. Vælg derefter Gem og kør.

    Skærmbillede, der viser knappen Kør for aktiviteten under fanen Hjem.

    Skærmbillede, der viser dialogboksen Gem og kør for kopieringsaktiviteten.

  2. Vælg knappen Detaljer for at overvåge status og kontrollere resultaterne af kørslen.

    Skærmbillede, der viser knappen Kør detaljer.

  3. I dialogboksen Kopiér datadetaljer vises resultaterne af kørslen, herunder status, mængden af data, der er læst og skrevet, start- og stoptider og varighed.

    Skærmbillede, der viser dialogboksen Kopiér dataoplysninger.

  4. Du kan også planlægge, at pipelinen skal køre med en bestemt hyppighed efter behov. Nedenfor kan du se eksemplet på, hvordan pipelinen skal køre hvert 15. minut.

    Skærmbillede, der viser dialogboksen til konfiguration af tidsplan.

    Skærmbillede, der viser en pipeline med en konfigureret tidsplan, der skal køres hvert 15. minut.

Næste trin

Pipelinen i dette eksempel viser, hvordan du kopierer data fra Azure Blob Storage til Lakehouse. Du har lært, hvordan du:

  • Opret en datapipeline.
  • Kopiér data med Kopiér assistent.
  • Kør og planlæg din datapipeline.

Gå derefter videre for at få mere at vide om overvågning af dine pipelinekørsler.