Dela via


Transformering av härledda kolumner i dataflödesmappning

GÄLLER FÖR: Azure Data Factory Azure Synapse Analytics

Dricks

Prova Data Factory i Microsoft Fabric, en allt-i-ett-analyslösning för företag. Microsoft Fabric omfattar allt från dataflytt till datavetenskap, realtidsanalys, business intelligence och rapportering. Lär dig hur du startar en ny utvärderingsversion kostnadsfritt!

Dataflöden är tillgängliga både i Azure Data Factory och Azure Synapse Pipelines. Den här artikeln gäller för mappning av dataflöden. Om du är nybörjare på transformeringar kan du läsa den inledande artikeln Transformera data med hjälp av ett mappningsdataflöde.

Använd omvandlingen av härledda kolumner för att generera nya kolumner i dataflödet eller för att ändra befintliga fält.

Skapa och uppdatera kolumner

När du skapar en härledd kolumn kan du antingen generera en ny kolumn eller uppdatera en befintlig kolumn. I textrutan Kolumn anger du i den kolumn som du skapar. Om du vill åsidosätta en befintlig kolumn i schemat kan du använda listrutan kolumn. Om du vill skapa uttrycket för den härledda kolumnen klickar du på textrutan Returuttryck . Du kan antingen börja skriva uttrycket eller öppna uttrycksverktyget för att konstruera logiken.

Inställningar för härledda kolumner

Om du vill lägga till fler härledda kolumner klickar du på Lägg till ovanför kolumnlistan eller plusikonen bredvid en befintlig härledd kolumn. Välj antingen Lägg till kolumn eller Lägg till kolumnmönster.

Ny härledd kolumnmarkering

Kolumnmönster

Om schemat inte uttryckligen har definierats eller om du vill uppdatera en uppsättning kolumner i bulk vill du skapa kolumnmönster. Med kolumnmönster kan du matcha kolumner med hjälp av regler baserat på kolumnmetadata och skapa härledda kolumner för varje matchad kolumn. Mer information finns i skapa kolumnmönster i omvandlingen av härledda kolumner.

Kolumnmönster

Skapa scheman med hjälp av uttrycksverktyget

När du använder uttrycksverktyget för mappningsdataflöde kan du skapa, redigera och hantera dina härledda kolumner i avsnittet Härledda kolumner. Alla kolumner som skapas eller ändras i omvandlingen visas. Välj interaktivt vilken kolumn eller vilket mönster du redigerar genom att klicka på kolumnnamnet. Om du vill lägga till ytterligare en kolumn väljer du Skapa ny och väljer om du vill lägga till en enskild kolumn eller ett mönster.

Skapa ny kolumn

När du arbetar med komplexa kolumner kan du skapa underkolumner. Det gör du genom att klicka på plusikonen bredvid valfri kolumn och välja Lägg till underkolumn. Mer information om hur du hanterar komplexa typer i dataflödet finns i JSON-hantering i mappning av dataflöde.

Lägg till underkolumn

Mer information om hur du hanterar komplexa typer i dataflödet finns i JSON-hantering i mappning av dataflöde.

Lägg till komplex kolumn

Dataflödesskript

Syntax

<incomingStream>
    derive(
           <columnName1> = <expression1>,
           <columnName2> = <expression2>,
           each(
                match(matchExpression),
                <metadataColumn1> = <metadataExpression1>,
                <metadataColumn2> = <metadataExpression2>
               )
          ) ~> <deriveTransformationName>

Exempel

Exemplet nedan är en härledd kolumn med namnet CleanData som tar en inkommande ström MoviesYear och skapar två härledda kolumner. Den första härledda kolumnen ersätter kolumnen Rating med omdömets värde som en heltalstyp. Den andra härledda kolumnen är ett mönster som matchar varje kolumn vars namn börjar med "filmer". För varje matchad kolumn skapas en kolumn movie som är lika med värdet för den matchade kolumnen med prefixet "movie_".

I användargränssnittet ser den här omvandlingen ut som bilden nedan:

Härled exempel

Dataflödesskriptet för den här omvandlingen finns i kodfragmentet nedan:

MoviesYear derive(
                Rating = toInteger(Rating),
		        each(
                    match(startsWith(name,'movies')),
                    'movie' = 'movie_' + toString($$)
                )
            ) ~> CleanData
  • Läs mer om uttrycksspråket Mappa dataflöde.