Slik kopierer du data ved hjelp av kopieringsaktivitet

I datasamlebåndet kan du bruke Kopier-aktiviteten til å kopiere data mellom datalagre som er plassert i skyen.

Når du har kopiert dataene, kan du bruke andre aktiviteter til å transformere og analysere dem ytterligere. Du kan også bruke Kopier-aktiviteten til å publisere transformasjons- og analyseresultater for forretningsintelligens (BI) og programforbruk.

Hvis du vil kopiere data fra en kilde til et mål, utfører tjenesten som kjører Kopier-aktiviteten, disse trinnene:

  1. Leser data fra et kildedatalager.
  2. Utfører serialisering/deserialisering, komprimering/dekompresjon, kolonnetilordning og så videre. Den utfører disse operasjonene basert på konfigurasjonen.
  3. Skriver data til måldatalageret.

Forutsetning

Du må fullføre følgende forutsetninger for å komme i gang:

  • En Microsoft Fabric-leierkonto med et aktivt abonnement. Opprett en konto gratis.

  • Kontroller at du har et Microsoft Fabric-aktivert arbeidsområde.

Legge til en kopiaktivitet ved hjelp av kopieringsassistent

Følg disse trinnene for å konfigurere kopiaktiviteten ved hjelp av kopieringsassistenten.

Start med kopieringsassistent

  1. Åpne et eksisterende datasamlebånd eller opprett et nytt datasamlebånd.

  2. Velg Kopier data på lerretet for å åpne kopier assistentverktøyet for å komme i gang. Eller velg Bruk kopier assistent fra rullegardinlisten Kopier data under Aktiviteter-fanen på båndet.

    Screenshot showing options for opening the copy assistant.

Konfigurer kilden

  1. Velg en datakildetype fra kategorien. Du bruker Azure Blob Storage som eksempel. Velg Azure Blob Storage , og velg deretter Neste.

    Screenshot of Choose data source screen.

    Screenshot showing where to select the correct data source.

  2. Opprett en tilkobling til datakilden ved å velge Opprett ny tilkobling.

    Screenshot showing where to select New connection.

    Når du har valgt Opprett ny tilkobling, fyller du ut den nødvendige tilkoblingsinformasjonen, og deretter velger du Neste. Hvis du vil ha mer informasjon om oppretting av tilkobling for hver type datakilde, kan du referere til hver koblingsartikkel.

    Hvis du har eksisterende tilkoblinger, kan du velge Eksisterende tilkobling og velge tilkoblingen fra rullegardinlisten.

    Screenshot showing the existing connection.

  3. Velg filen eller mappen som skal kopieres i dette kildekonfigurasjonstrinnet, og velg deretter Neste.

    Screenshot showing where to select the data to be copied.

Konfigurer målet

  1. Velg en datakildetype fra kategorien. Du bruker Azure Blob Storage som eksempel. Velg Azure Blob Storage, og velg deretter Neste.

    Screenshot showing how to select Azure Blob Storage.

  2. Du kan enten opprette en ny tilkobling som kobler til en ny Azure Blob Storage-konto ved å følge trinnene i forrige del eller bruke en eksisterende tilkobling fra rullegardinlisten for tilkobling. Funksjonene for Testtilkobling og Rediger er tilgjengelige for hver valgte tilkobling.

    Screenshot showing data connection options.

  3. Konfigurer og tilordne kildedataene til målet. Velg deretter Neste for å fullføre målkonfigurasjonene.

    Screenshot of Map to destination screen.

    Screenshot of Connect to data destination.

Se gjennom og opprett kopiaktiviteten

  1. Se gjennom innstillingene for kopieringsaktivitet i de forrige trinnene, og velg OK for å fullføre. Du kan også gå tilbake til de forrige trinnene for å redigere innstillingene ved behov i verktøyet.

    Screenshot showing the Review and create screen.

Når du er ferdig, legges kopieringsaktiviteten til datasamlebåndlerretet. Alle innstillinger, inkludert avanserte innstillinger for denne kopiaktiviteten, er tilgjengelige under fanene når den er valgt.

Screenshot showing a copy activity on the data pipeline canvas.

Nå kan du enten lagre datasamlebåndet med denne enkeltkopiaktiviteten eller fortsette å utforme datasamlebåndet.

Legge til en kopiaktivitet direkte

Følg disse trinnene for å legge til en kopiaktivitet direkte.

Legge til en kopiaktivitet

  1. Åpne et eksisterende datasamlebånd eller opprett et nytt datasamlebånd.

  2. Legg til en kopiaktivitet enten ved å velge Legg til aktivitet for datasamlebånd>, kopier aktivitet eller ved å velge Kopier data>Legg til på lerret under Aktiviteter-fanen.

    Screenshot showing two ways to add a copy activity.

Konfigurer generelle innstillinger under generelt-fanen

Hvis du vil lære hvordan du konfigurerer de generelle innstillingene, kan du se Generelt.

Konfigurer kilden under kildefanen

  1. Velg + Ny ved siden av Koble til ion for å opprette en tilkobling til datakilden.

    Screenshot showing where to select New.

    1. Velg datakildetypen fra popup-vinduet. Du bruker Azure SQL Database som et eksempel. Velg Azure SQL Database, og velg deretter Fortsett.

      Screenshot showing how to select the data source.

    2. Den navigerer til opprettelsessiden for tilkoblingen. Fyll ut den nødvendige tilkoblingsinformasjonen i panelet, og velg deretter Opprett. Hvis du vil ha mer informasjon om oppretting av tilkobling for hver type datakilde, kan du referere til hver koblingsartikkel.

      Screenshot showing New connection page.

    3. Når tilkoblingen er opprettet, tar den deg tilbake til datasamlebåndsiden. Velg deretter Oppdater for å hente tilkoblingen du opprettet fra rullegardinlisten. Du kan også velge en eksisterende Azure SQL Database-tilkobling fra rullegardinlisten direkte hvis du allerede har opprettet den før. Funksjonene for Testtilkobling og Rediger er tilgjengelige for hver valgte tilkobling. Velg deretter Azure SQL Database i Koble til iontype.

      Screenshot showing where to refresh your connection.

  2. Angi en tabell som skal kopieres. Velg Forhåndsvis data for å forhåndsvise kildetabellen. Du kan også bruke spørrings- og lagret prosedyre til å lese data fra kilden.

    Screenshot showing source table settings options.

  3. Utvid Avansert for mer avanserte innstillinger.

    Screenshot of advanced settings.

Konfigurer målet under målfanen

  1. Velg måltype. Det kan enten være det interne førsteklasses datalageret fra arbeidsområdet, for eksempel Lakehouse eller de eksterne datalagrene. Du bruker Lakehouse som eksempel.

    Screenshot showing where to select destination type.

  2. Velg å bruke Lakehouse i datalagertypen Arbeidsområde. Velg + Ny, og den navigerer deg til opprettingssiden for Lakehouse. Angi Navnet på Lakehouse, og velg deretter Opprett.

    Screenshot showing Lakehouse creation.

  3. Når tilkoblingen er opprettet, tar den deg tilbake til datasamlebåndsiden. Velg deretter Oppdater for å hente tilkoblingen du opprettet fra rullegardinlisten. Du kan også velge en eksisterende Lakehouse-tilkobling fra rullegardinlisten direkte hvis du allerede har opprettet den før.

    Screenshot showing selecting connection.

  4. Angi en tabell, eller konfigurer filbanen for å definere filen eller mappen som mål. Her velger du Tabeller og angir en tabell for å skrive data.

    Screenshot showing where to find Table settings.

  5. Utvid Avansert for mer avanserte innstillinger.

    Screenshot of Advanced options.

Nå kan du enten lagre datasamlebåndet med denne enkeltkopiaktiviteten eller fortsette å utforme datasamlebåndet.

Konfigurer tilordningene under tilordningsfanen

Hvis koblingen du bruker støtter tilordning, kan du gå til Tilordning-fanen for å konfigurere tilordningen.

  1. Velg Importer skjemaer for å importere dataskjemaet.

    Screenshot of mapping settings 1.

  2. Du kan se at automatisk tilordning vises. Angi kildekolonnen og målkolonnen. Hvis du oppretter en ny tabell i målet, kan du tilpasse navnet på målkolonnen her. Hvis du vil skrive data inn i den eksisterende måltabellen, kan du ikke endre det eksisterende navnet på målkolonnen . Du kan også vise typen kilde- og målkolonner.

    Screenshot of mapping settings 2.

Dessuten kan du velge + Ny tilordning for å legge til ny tilordning, velge Fjern for å fjerne alle tilordningsinnstillinger og velge Tilbakestill for å tilbakestille alle tilordningskildekolonnene.

Konfigurer typekonverteringen

Utvid innstillingene for typekonvertering for å konfigurere typekonverteringen om nødvendig.

Screenshot of mapping type conversion.

Se tabellen nedenfor for å få informasjon om innstillingene.

Innstilling Bekrivelse
Tillat dataavkorting Tillat dataavkorting når du konverterer kildedata til mål med forskjellig type under kopiering. For eksempel fra desimal til heltall, fra DatetimeOffset til Datetime.
Behandle boolsk som tall Behandle boolsk som tall. Behandle for eksempel sann som 1.
DateTime-format Formater streng når du konverterer mellom datoer uten tidssoneforskyvning og strenger. For eksempel "åååååå-MM-dd HH:mm:ss.fff".
DateTimeOffset-format Formater streng når du konverterer mellom datoer med tidssoneforskyvning og strenger. For eksempel "åååååå-MM-dd HH:mm:ss.fff zzz".
TimeSpan-format Formater streng når du konverterer mellom tidsperioder og strenger. For eksempel "dd.hh:mm:ss".
Kultur Kulturinformasjon som skal brukes når du konverterer typer. Eksempel: «en-us», «fr-fr».

Konfigurer de andre innstillingene under innstillinger-fanen

Fanen Innstillinger inneholder innstillingene for ytelse, oppsamling og så videre.

Screenshot of Settings tab.

Se tabellen nedenfor for å se beskrivelsen av hver innstilling.

Innstilling Bekrivelse
Intelligent gjennomstrømmingsoptimalisering Angi for å optimalisere gjennomstrømmingen. Du kan velge mellom:
Auto
Standard
Balansert
Maksimum
Når du velger Auto, brukes den optimale innstillingen dynamisk basert på kildemålparet og datamønsteret. Du kan også tilpasse gjennomstrømmingen, og egendefinert verdi kan være 2-256, mens høyere verdi innebærer flere gevinster.
Grad av kopi parallellisme Angi graden av parallellitet som datainnlastingen skal bruke.
Feiltoleranse Når du velger dette alternativet, kan du ignorere noen feil midt i kopieringsprosessen. For eksempel inkompatible rader mellom kilde- og mållager, fil som slettes under dataflytting osv.
Aktiver logging Når du velger dette alternativet, kan du logge kopierte filer, hoppet over filer og rader
Aktiver oppsamling Angi om data skal kopieres via et midlertidig oppsamlingslager. Aktiver oppsamling bare for de fordelaktige scenariene.
Sette opp kontotilkobling Når du velger Aktiver oppsamling, angir du tilkoblingen til en Azure-lagringsdatakilde som en midlertidig oppsamlingslager. Velg + Ny for å opprette en oppsamlingstilkobling hvis du ikke har den.

Konfigurere parametere i en kopiaktivitet

Parametere kan brukes til å kontrollere virkemåten til et datasamlebånd og tilhørende aktiviteter. Du kan bruke Legg til dynamisk innhold til å angi parametere for egenskapene for kopieringsaktivitet. La oss angi Lakehouse/Data Warehouse/KQL Database som et eksempel for å se hvordan du bruker den.

  1. Når du har valgt Arbeidsområde som datalagertype og angitt KQL-database for Lakehouse/Data Warehouse/som datalagertype for arbeidsområdet, velger du Legg til dynamisk innhold i rullegardinlisten over Lakehouse eller Data Warehouse eller KQL Database.

  2. Velg i popup-vinduet Legg til dynamisk innhold-ruten under Parametere-fanen.+

    Screenshot showing the Add dynamic content page.

  3. Angi navnet på parameteren og gi den en standardverdi hvis du vil, eller angi verdien for parameteren etter at du har valgt Kjør i datasamlebåndet.

    Screenshot shows creating a new parameter.

    Vær oppmerksom på at parameterverdien skal være Objekt-ID for Lakehouse/Data Warehouse/KQL-database. Hvis du vil ha objekt-ID-en for Lakehouse/Data Warehouse/KQL-databasen, åpner du Lakehouse/Data Warehouse/KQL-databasen i arbeidsområdet, og ID-en er etter /lakehouses/eller /datawarehouses/ eller /databases/ i nettadressen.

    • Objekt-ID for Lakehouse:

      Screenshot showing the Lakehouse object ID.

    • Objekt-ID for datalager:

      Screenshot showing the Data Warehouse object ID.

    • Objekt-ID for KQL-database:

      Screenshot showing the KQL Database object ID.

  4. Velg Lagre for å gå tilbake til ruten Legg til dynamisk innhold . Velg deretter parameteren slik at den vises i uttrykksboksen. Velg deretter OK. Du går tilbake til datasamlebåndsiden og kan se at parameteruttrykket er angitt etter objekt-ID-en/ for Objekt-ID for Objekt-ID for Lakehouse-objektet ID/KQL-database.

    Screenshot showing selecting parameter.