Så här kopierar du data med kopieringsaktivitet

I Datapipeline kan du använda aktiviteten Kopiera för att kopiera data mellan datalager som finns i molnet.

När du har kopierat data kan du använda andra aktiviteter för att transformera och analysera dem ytterligare. Du kan också använda aktiviteten Kopiera för att publicera transformerings- och analysresultat för Business Intelligence (BI) och programförbrukning.

För att kopiera data från en källa till ett mål utför tjänsten som kör aktiviteten Kopiera följande steg:

  1. Läser data från ett källdatalager.
  2. Utför serialisering/deserialisering, komprimering/dekomprimering, kolumnmappning och så vidare. Den utför dessa åtgärder baserat på konfigurationen.
  3. Skriver data till måldatalagret.

Förutsättningar

För att komma igång måste du uppfylla följande krav:

  • Ett Microsoft Fabric-klientkonto med en aktiv prenumeration. Skapa ett konto utan kostnad.

  • Kontrollera att du har en Microsoft Fabric-aktiverad arbetsyta.

Lägga till en kopieringsaktivitet med hjälp av kopieringsassistenten

Följ de här stegen för att konfigurera kopieringsaktiviteten med hjälp av kopieringsassistenten.

Börja med kopieringsassistenten

  1. Öppna en befintlig datapipeline eller skapa en ny datapipeline.

  2. Välj Kopiera data på arbetsytan för att öppna verktyget Kopieringsassistenten för att komma igång. Eller välj Använd kopieringsassistenten i listrutan Kopiera data under fliken Aktiviteter i menyfliksområdet.

    Screenshot showing options for opening the copy assistant.

Konfigurera din källa

  1. Välj en datakällatyp i kategorin. Du använder Azure Blob Storage som exempel. Välj Azure Blob Storage och välj sedan Nästa.

    Screenshot of Choose data source screen.

    Screenshot showing where to select the correct data source.

  2. Skapa en anslutning till datakällan genom att välja Skapa ny anslutning.

    Screenshot showing where to select New connection.

    När du har valt Skapa ny anslutning fyller du i nödvändig anslutningsinformation och väljer sedan Nästa. Information om hur du skapar anslutningar för varje typ av datakälla finns i artikeln om varje anslutningsapp.

    Om du har befintliga anslutningar kan du välja Befintlig anslutning och välja din anslutning i listrutan.

    Screenshot showing the existing connection.

  3. Välj den fil eller mapp som ska kopieras i det här källkonfigurationssteget och välj sedan Nästa.

    Screenshot showing where to select the data to be copied.

Konfigurera målet

  1. Välj en datakällatyp i kategorin. Du använder Azure Blob Storage som exempel. Välj Azure Blob Storage och välj sedan Nästa.

    Screenshot showing how to select Azure Blob Storage.

  2. Du kan antingen skapa en ny anslutning som länkar till ett nytt Azure Blob Storage-konto genom att följa stegen i föregående avsnitt eller använda en befintlig anslutning från listrutan för anslutning. Funktionerna i Testanslutning och Redigera är tillgängliga för varje vald anslutning.

    Screenshot showing data connection options.

  3. Konfigurera och mappa dina källdata till målet. Välj sedan Nästa för att slutföra målkonfigurationerna.

    Screenshot of Map to destination screen.

    Screenshot of Connect to data destination.

Granska och skapa kopieringsaktiviteten

  1. Granska inställningarna för kopieringsaktiviteten i föregående steg och välj OK för att slutföra. Eller så kan du gå tillbaka till föregående steg för att redigera inställningarna om det behövs i verktyget.

    Screenshot showing the Review and create screen.

När kopieringsaktiviteten är klar läggs den sedan till i din datapipelinearbetsyta. Alla inställningar, inklusive avancerade inställningar för den här kopieringsaktiviteten, är tillgängliga under flikarna när den väljs.

Screenshot showing a copy activity on the data pipeline canvas.

Nu kan du antingen spara din datapipeline med den här enkla kopieringsaktiviteten eller fortsätta att utforma din datapipeline.

Lägga till en kopieringsaktivitet direkt

Följ de här stegen för att lägga till en kopieringsaktivitet direkt.

Lägga till en kopieringsaktivitet

  1. Öppna en befintlig datapipeline eller skapa en ny datapipeline.

  2. Lägg till en kopieringsaktivitet antingen genom att välja Lägg till pipelineaktivitet> aktiviteten Kopiera eller genom att välja Kopiera data>Lägg till på arbetsytan under fliken Aktiviteter.

    Screenshot showing two ways to add a copy activity.

Konfigurera dina allmänna inställningar under fliken Allmänt

Information om hur du konfigurerar dina allmänna inställningar finns i Allmänt.

Konfigurera källan på källfliken

  1. Välj + Ny bredvid Anslut ion för att skapa en anslutning till datakällan.

    Screenshot showing where to select New.

    1. Välj datakälltypen i popup-fönstret. Du använder Azure SQL Database som exempel. Välj Azure SQL Database och välj sedan Fortsätt.

      Screenshot showing how to select the data source.

    2. Den navigerar till sidan för att skapa anslutningen. Fyll i nödvändig anslutningsinformation på panelen och välj sedan Skapa. Information om hur du skapar anslutningar för varje typ av datakälla finns i artikeln om varje anslutningsapp.

      Screenshot showing New connection page.

    3. När anslutningen har skapats tar den dig tillbaka till datapipelinesidan. Välj sedan Uppdatera för att hämta anslutningen som du skapade i listrutan. Du kan också välja en befintlig Azure SQL Database-anslutning från listrutan direkt om du redan har skapat den tidigare. Funktionerna i Testanslutning och Redigera är tillgängliga för varje vald anslutning. Välj sedan Azure SQL Database i Anslut ionstyp.

      Screenshot showing where to refresh your connection.

  2. Ange en tabell som ska kopieras. Välj Förhandsgranska data för att förhandsgranska källtabellen. Du kan också använda fråga och lagrad procedur för att läsa data från din källa.

    Screenshot showing source table settings options.

  3. Expandera Avancerat för mer avancerade inställningar.

    Screenshot of advanced settings.

Konfigurera målet under målfliken

  1. Välj måltyp. Det kan vara antingen ditt interna förstklassiga datalager från din arbetsyta, till exempel Lakehouse, eller dina externa datalager. Du använder Lakehouse som exempel.

    Screenshot showing where to select destination type.

  2. Välj att använda Lakehouse i datalagertypen Arbetsyta. Välj + Ny och navigerar till sidan För att skapa Lakehouse. Ange namnet på Lakehouse och välj sedan Skapa.

    Screenshot showing Lakehouse creation.

  3. När anslutningen har skapats tar den dig tillbaka till datapipelinesidan. Välj sedan Uppdatera för att hämta anslutningen som du skapade i listrutan. Du kan också välja en befintlig Lakehouse-anslutning från listrutan direkt om du redan har skapat den tidigare.

    Screenshot showing selecting connection.

  4. Ange en tabell eller konfigurera filsökvägen för att definiera filen eller mappen som mål. Välj Tabeller och ange en tabell för att skriva data.

    Screenshot showing where to find Table settings.

  5. Expandera Avancerat för mer avancerade inställningar.

    Screenshot of Advanced options.

Nu kan du antingen spara din datapipeline med den här enkla kopieringsaktiviteten eller fortsätta att utforma din datapipeline.

Konfigurera dina mappningar under mappningsfliken

Om anslutningsappen som du använder stöder mappning kan du gå till fliken Mappning för att konfigurera mappningen.

  1. Välj Importera scheman för att importera dataschemat.

    Screenshot of mapping settings 1.

  2. Du kan se att den automatiska mappningen visas. Ange källkolumnen och målkolumnen. Om du skapar en ny tabell i målet kan du anpassa namnet på målkolumnen här. Om du vill skriva data till den befintliga måltabellen kan du inte ändra det befintliga målkolumnnamnet . Du kan också visa typen av käll- och målkolumner.

    Screenshot of mapping settings 2.

Dessutom kan du välja + Ny mappning för att lägga till ny mappning, välja Rensa för att rensa alla mappningsinställningar och välja Återställ för att återställa alla mappningskolumner för källa .

Konfigurera din typkonvertering

Expandera Inställningar för typkonvertering för att konfigurera typkonverteringen om det behövs.

Screenshot of mapping type conversion.

Se följande tabell för inställningsinformationen.

Inställning beskrivning
Tillåt datatrunkering Tillåt datatrunkering när du konverterar källdata till mål med en annan typ under kopieringen. Till exempel från decimal till heltal, från DatetimeOffset till Datetime.
Behandla booleskt värde som tal Behandla booleskt värde som tal. Du kan till exempel behandla sant som 1.
DateTime-format Formatera sträng när du konverterar mellan datum utan tidszonsförskjutning och strängar. Till exempel "åååå-MM-dd HH:mm:ss.fff".
DateTimeOffset-format Formatera sträng när du konverterar mellan datum med tidszonsförskjutning och strängar. Till exempel "åååå-MM-dd HH:mm:ss.fff zzz".
TimeSpan-format Formatera sträng när du konverterar mellan tidsperioder och strängar. Till exempel "dd.hh:mm:ss".
Kultur Kulturinformation som ska användas vid konvertering av typer. Till exempel "en-us", "fr-fr".

Konfigurera dina andra inställningar under fliken Inställningar

Fliken Inställningar innehåller inställningar för prestanda, mellanlagring och så vidare.

Screenshot of Settings tab.

Se följande tabell för beskrivningen av varje inställning.

Inställning beskrivning
Intelligent dataflödesoptimering Ange för att optimera dataflödet. Du kan välja mellan:
Automatisk
Standard
Balanserad
Maximalt
När du väljer Auto tillämpas den optimala inställningen dynamiskt baserat på ditt källmålspar och datamönster. Du kan också anpassa dataflödet och det anpassade värdet kan vara 2–256 medan högre värde innebär fler vinster.
Grad av kopieringsparallellitet Ange graden av parallellitet som datainläsningen skulle använda.
Feltolerans När du väljer det här alternativet kan du ignorera vissa fel som inträffat mitt i kopieringsprocessen. Till exempel inkompatibla rader mellan käll- och målarkiv, fil som tas bort under dataflytt osv.
Aktivera loggning När du väljer det här alternativet kan du logga kopierade filer, överhoppade filer och rader
Aktivera mellanlagring Ange om data ska kopieras via ett mellanlagringslager. Aktivera endast mellanlagring för de fördelaktiga scenarierna.
Mellanlagringskontoanslutning När du väljer Aktivera mellanlagring anger du anslutningen för en Azure Storage-datakälla som ett mellanlagringslager. Välj + Ny för att skapa en mellanlagringsanslutning om du inte har den.

Konfigurera parametrar i en kopieringsaktivitet

Parametrar kan användas för att styra beteendet för en pipeline och dess aktiviteter. Du kan använda Lägg till dynamiskt innehåll för att ange parametrar för dina egenskaper för kopieringsaktivitet. Nu ska vi ange Lakehouse/Data Warehouse/KQL Database som ett exempel för att se hur du använder den.

  1. När du har valt Arbetsyta som datalagertyp och markerat Lakehouse/Data Warehouse/KQL Database som datalagertyp för arbetsytan väljer du Lägg till dynamiskt innehåll i listrutan i Lakehouse, Data Warehouse eller KQL Database.

  2. I popup-fönstret Lägg till dynamiskt innehåll går du till fliken Parametrar och väljer +.

    Screenshot showing the Add dynamic content page.

  3. Ange namnet på parametern och ge den ett standardvärde om du vill, eller så kan du ange värdet för parametern när du har valt Kör i pipelinen.

    Screenshot shows creating a new parameter.

    Observera att parametervärdet ska vara Lakehouse/Data Warehouse/KQL Database-objekt-ID. Om du vill hämta ditt Objekt-ID för Lakehouse/Data Warehouse/KQL Database öppnar du Lakehouse/Data Warehouse/KQL-databasen på arbetsytan och ID:t är efter /lakehouses/eller /datawarehouses/ i /databases/ din URL.

    • Lakehouse-objekt-ID:

      Screenshot showing the Lakehouse object ID.

    • Data Warehouse-objekt-ID:

      Screenshot showing the Data Warehouse object ID.

    • KQL Database-objekt-ID:

      Screenshot showing the KQL Database object ID.

  4. Välj Spara för att gå tillbaka till fönstret Lägg till dynamiskt innehåll . Välj sedan parametern så att den visas i uttrycksrutan. Välj sedan OK. Du går tillbaka till pipelinesidan och kan se att parameteruttrycket har angetts efter Lakehouse-objekt-ID/:t Data Warehouse-objekt-ID/:t KQL Database-objekt-ID.

    Screenshot showing selecting parameter.