Sådan kopierer du data ved hjælp af kopiaktivitet

I Datapipeline kan du bruge aktiviteten Kopiér til at kopiere data mellem datalagre, der er placeret i cloudmiljøet.

Når du har kopieret dataene, kan du bruge andre aktiviteter til yderligere at transformere og analysere dem. Du kan også bruge kopieringsaktiviteten til at publicere transformations- og analyseresultater for business intelligence (BI) og programforbrug.

Hvis du vil kopiere data fra en kilde til en destination, skal den tjeneste, der kører aktiviteten Kopiér, udføre disse trin:

  1. Læser data fra et kildedatalager.
  2. Udfører serialisering/deserialisering, komprimering/dekomprimering, kolonnetilknytning osv. Den udfører disse handlinger baseret på konfigurationen.
  3. Skriver data til destinationsdatalageret.

Forudsætninger

For at komme i gang skal du fuldføre følgende forudsætninger:

  • En Microsoft Fabric-lejerkonto med et aktivt abonnement. Opret en konto gratis.

  • Sørg for, at du har et Microsoft Fabric-aktiveret arbejdsområde.

Tilføj en kopiaktivitet ved hjælp af kopiassistenten

Følg disse trin for at konfigurere din kopiaktivitet ved hjælp af kopiassistenten.

Start med kopiassistent

  1. Åbn en eksisterende datapipeline, eller opret en ny datapipeline.

  2. Vælg Kopiér data på lærredet for at åbne værktøjet Kopiér assistent for at komme i gang. Eller vælg Brug kopiassistentrullelisten Kopiér data under fanen Aktiviteter på båndet.

    Screenshot showing options for opening the copy assistant.

Konfigurer din kilde

  1. Vælg en datakildetype i kategorien. Du skal bruge Azure Blob Storage som eksempel. Vælg Azure Blob Storage, og vælg derefter Næste.

    Screenshot of Choose data source screen.

    Screenshot showing where to select the correct data source.

  2. Opret en forbindelse til datakilden ved at vælge Opret ny forbindelse.

    Screenshot showing where to select New connection.

    Når du har valgt Opret ny forbindelse, skal du udfylde de påkrævede forbindelsesoplysninger og derefter vælge Næste. Du kan finde flere oplysninger om oprettelse af forbindelse for hver type datakilde i hver connectorartikel.

    Hvis du har eksisterende forbindelser, kan du vælge Eksisterende forbindelse og vælge din forbindelse på rullelisten.

    Screenshot showing the existing connection.

  3. Vælg den fil eller mappe, der skal kopieres i dette kildekonfigurationstrin, og vælg derefter Næste.

    Screenshot showing where to select the data to be copied.

Konfigurer din destination

  1. Vælg en datakildetype i kategorien. Du skal bruge Azure Blob Storage som eksempel. Vælg Azure Blob Storage, og vælg derefter Næste.

    Screenshot showing how to select Azure Blob Storage.

  2. Du kan enten oprette en ny forbindelse, der linker til en ny Azure Blob Storage-konto, ved at følge trinnene i forrige afsnit eller bruge en eksisterende forbindelse fra rullelisten forbindelse. Funktionerne i Testforbindelse og Rediger er tilgængelige for hver valgte forbindelse.

    Screenshot showing data connection options.

  3. Konfigurer og knyt kildedataene til destinationen. Vælg derefter Næste for at afslutte dine destinationskonfigurationer.

    Screenshot of Map to destination screen.

    Screenshot of Connect to data destination.

Gennemse og opret din kopiaktivitet

  1. Gennemse indstillingerne for kopiaktivitet i de forrige trin, og vælg OK for at afslutte. Du kan også gå tilbage til de forrige trin for at redigere dine indstillinger, hvis det er nødvendigt i værktøjet.

    Screenshot showing the Review and create screen.

Når kopiaktiviteten er fuldført, føjes den derefter til dit datapipelinelærred. Alle indstillinger, herunder avancerede indstillinger for denne kopiaktivitet, er tilgængelige under fanerne, når den er valgt.

Screenshot showing a copy activity on the data pipeline canvas.

Nu kan du enten gemme din datapipeline med denne aktivitet med en enkelt kopi eller fortsætte med at designe din datapipeline.

Tilføj en kopiaktivitet direkte

Følg disse trin for at tilføje en kopiaktivitet direkte.

Tilføj en kopiaktivitet

  1. Åbn en eksisterende datapipeline, eller opret en ny datapipeline.

  2. Tilføj en kopiaktivitet ved enten at vælge Tilføj pipelineaktivitet>Kopiér aktivitet eller ved at vælge Kopiér data>Føj til lærredetunder fanen Aktiviteter.

    Screenshot showing two ways to add a copy activity.

Konfigurer dine generelle indstillinger under fanen Generelt

Du kan få mere at vide om, hvordan du konfigurerer dine generelle indstillinger, under Generelt.

Konfigurer din kilde under kildefanen

  1. Vælg + Ny ud for Forbind ion for at oprette en forbindelse til datakilden.

    Screenshot showing where to select New.

    1. Vælg datakildetypen i pop op-vinduet. Du skal bruge Azure SQL Database som et eksempel. Vælg Azure SQL Database, og vælg derefter Fortsæt.

      Screenshot showing how to select the data source.

    2. Den navigerer til siden til oprettelse af forbindelse. Udfyld de nødvendige forbindelsesoplysninger i panelet, og vælg derefter Opret. Du kan finde flere oplysninger om oprettelse af forbindelse for hver type datakilde i hver connectorartikel.

      Screenshot showing New connection page.

    3. Når forbindelsen er oprettet, føres du tilbage til siden med datapipelines. Vælg derefter Opdater for at hente den forbindelse, du har oprettet, på rullelisten. Du kan også vælge en eksisterende Azure SQL Database-forbindelse direkte på rullelisten, hvis du allerede har oprettet den før. Funktionerne i Testforbindelse og Rediger er tilgængelige for hver valgte forbindelse. Vælg derefter Azure SQL Database i Forbind ionstype.

      Screenshot showing where to refresh your connection.

  2. Angiv en tabel, der skal kopieres. Vælg Vis eksempeldata for at få vist en eksempelvisning af kildetabellen. Du kan også bruge Forespørgsel og Lagret procedure til at læse data fra din kilde.

    Screenshot showing source table settings options.

  3. Udvid Avanceret for at få mere avancerede indstillinger.

    Screenshot of advanced settings.

Konfigurer din destination under fanen Destination

  1. Vælg destinationstypen. Det kan enten være dit interne første klasses datalager fra dit arbejdsområde, f.eks. Lakehouse, eller dine eksterne datalagre. Du skal f.eks. bruge Lakehouse.

    Screenshot showing where to select destination type.

  2. Vælg at bruge Lakehouse i datalagertypen Arbejdsområde. Vælg + Ny, og den navigerer dig til oprettelsessiden for Lakehouse. Angiv navnet på Lakehouse, og vælg derefter Opret.

    Screenshot showing Lakehouse creation.

  3. Når forbindelsen er oprettet, føres du tilbage til siden med datapipelines. Vælg derefter Opdater for at hente den forbindelse, du har oprettet, på rullelisten. Du kan også vælge en eksisterende Lakehouse-forbindelse direkte på rullelisten, hvis du allerede har oprettet den før.

    Screenshot showing selecting connection.

  4. Angiv en tabel, eller konfigurer filstien for at definere filen eller mappen som destination. Her skal du vælge Tabeller og angive en tabel til at skrive data.

    Screenshot showing where to find Table settings.

  5. Udvid Avanceret for at få mere avancerede indstillinger.

    Screenshot of Advanced options.

Nu kan du enten gemme din datapipeline med denne aktivitet med en enkelt kopi eller fortsætte med at designe din datapipeline.

Konfigurer dine tilknytninger under tilknytningsfanen

Hvis den connector, du anvender, understøtter tilknytning, kan du gå til fanen Tilknytning for at konfigurere din tilknytning.

  1. Vælg Importér skemaer for at importere dataskemaet.

    Screenshot of mapping settings 1.

  2. Du kan se, at den automatiske tilknytning vises. Angiv kolonnen Kilde og Destinationskolonne . Hvis du opretter en ny tabel i destinationen, kan du tilpasse navnet på kolonnen Destination her. Hvis du vil skrive data til den eksisterende destinationstabel, kan du ikke ændre navnet på den eksisterende destinationskolonne . Du kan også få vist kilde- og destinationskolonnernes type .

    Screenshot of mapping settings 2.

Desuden kan du vælge + Ny tilknytning for at tilføje ny tilknytning, vælge Ryd for at rydde alle tilknytningsindstillinger og vælge Nulstil for at nulstille alle tilknytningskildekolonner.

Konfigurer din typekonvertering

Udvid Indstillinger for typekonvertering for at konfigurere typekonverteringen, hvis det er nødvendigt.

Screenshot of mapping type conversion.

Se følgende tabel for at få oplysninger om indstillingen.

Indstilling Beskrivelse
Tillad data afkortning Tillad data afkortning ved konvertering af kildedata til destination med en anden type under kopiering. Fra decimal til heltal fra DatetimeOffset til Datetime.
Behandl boolesk som tal Behandl boolesk som tal. Behandl f.eks. true som 1.
DateTime-format Formatér streng, når der konverteres mellem datoer uden tidszoneforskydning og strenge. For eksempel "åååå-MM-dd HH:mm:ss.fff".
DateTimeOffset-format Formatér streng, når der konverteres mellem datoer med tidszoneforskydning og strenge. For eksempel "åååå-MM-dd HH:mm:ss.fff zzz".
Klokkeslætsformat Formatér streng, når der konverteres mellem tidsperioder og strenge. F.eks. "dd.hh:mm:ss".
Kultur Kulturoplysninger, der skal bruges ved konvertering af typer. For eksempel "en-us", "fr-fr".

Konfigurer dine andre indstillinger under fanen Indstillinger

Fanen Indstillinger indeholder indstillinger for ydeevne, midlertidig lagring osv.

Screenshot of Settings tab.

Se følgende tabel for at få en beskrivelse af hver indstilling.

Indstilling Beskrivelse
Intelligent optimering af dataoverførselshastighed Angiv for at optimere gennemløbet. Du kan vælge mellem:
Automatisk
Standard
Balanceret
Maksimum
Når du vælger Auto, anvendes den optimale indstilling dynamisk baseret på dit kildedestinationspar og datamønster. Du kan også tilpasse dit gennemløb, og den brugerdefinerede værdi kan være 2-256, mens højere værdi indebærer flere gevinster.
Graden af kopi parallelitet Angiv, hvor meget parallelitet dataindlæsningen skal bruge.
Fejltolerance Når du vælger denne indstilling, kan du ignorere nogle fejl, der opstod midt i kopieringsprocessen. Inkompatible rækker mellem kilde- og destinationslager, fil, der slettes under dataflytning osv.
Aktivér logføring Når du vælger denne indstilling, kan du logge kopierede filer, sprunget filer og rækker over
Aktivér midlertidig lagring Angiv, om data skal kopieres via et midlertidigt midlertidigt lagringslager. Aktivér kun midlertidig lagring for de fordelagtige scenarier.
Midlertidig kontoforbindelse Når du vælger Aktivér midlertidig lagring, skal du angive forbindelsen til en Azure Storage-datakilde som et midlertidigt midlertidigt lagringslager. Vælg + Ny for at oprette en midlertidig forbindelse, hvis du ikke har den.

Konfigurer parametre i en kopiaktivitet

Parametre kan bruges til at styre funktionsmåden for en pipeline og dens aktiviteter. Du kan bruge Tilføj dynamisk indhold til at angive parametre for dine egenskaber for kopiaktivitet. Lad os tage angivelse af Lakehouse/Data Warehouse/KQL Database som et eksempel for at se, hvordan du bruger den.

  1. Når du i din kilde eller destination har valgt Arbejdsområde som datalagertype og angivet Lakehouse/Data Warehouse KQL-database/ som datalagertype for arbejdsområde, skal du vælge Tilføj dynamisk indhold på rullelisten over Lakehouse eller Data Warehouse eller KQL-database.

  2. Vælg +under fanen Parametre i ruden Tilføj dynamisk indhold i pop op-vinduet.

    Screenshot showing the Add dynamic content page.

  3. Angiv navnet på parameteren, og giv den en standardværdi, hvis du vil, eller du kan angive værdien for parameteren, når du har valgt Kør i pipelinen.

    Screenshot shows creating a new parameter.

    Bemærk, at parameterværdien skal være Objekt-id for Lakehouse/Data Warehouse/KQL Database. Hvis du vil hente dit Lakehouse/Data Warehouse/KQL Database-objekt-id, skal du åbne din Lakehouse/Data Warehouse/KQL-database i dit arbejdsområde, og id'et er efter /lakehouses/eller /datawarehouses//databases/ i din URL-adresse.

    • Lakehouse-objekt-id:

      Screenshot showing the Lakehouse object ID.

    • Data Warehouse-objekt-id:

      Screenshot showing the Data Warehouse object ID.

    • KQL Database-objekt-id:

      Screenshot showing the KQL Database object ID.

  4. Vælg Gem for at gå tilbage til ruden Tilføj dynamisk indhold . Vælg derefter din parameter, så den vises i udtryksfeltet. Vælg derefter OK. Du går tilbage til pipelinesiden og kan se, at parameterudtrykket er angivet efter Lakehouse-objekt-id'et/Data Warehouse-objekt-id/KQL Database-objekt-id.

    Screenshot showing selecting parameter.