Transformace odvozeného sloupce při mapování toku dat

VZTAHUJE SE NA: Azure Data Factory Azure Synapse Analytics

Tip

Data Factory v Microsoft Fabric je nová generace Azure Data Factory s jednodušší architekturou, integrovanou AI a novými funkcemi. Pokud s integrací dat začínáte, začněte Fabric Data Factory. Stávající úlohy ADF lze upgradovat na Fabric pro přístup k novým funkcím v oblastech datové vědy, analýz v reálném čase a vytváření sestav.

Toky dat jsou k dispozici v kanálech Azure Data Factory i v kanálech Azure Synapse Analytics. Tento článek se týká mapování toků dat. Pokud s transformacemi začínáte, přečtěte si úvodní článek Transformace dat pomocí mapování toků dat.

Tip

Ekvivalentní transformaci (vlastní sloupec) v toku dat Gen2 najdete v průvodci tokem dat Gen2 pro mapování uživatelů toku dat.

Pomocí transformace odvozeného sloupce můžete vygenerovat nové sloupce ve vašem toku dat nebo upravit existující pole.

Vytváření a aktualizace sloupců

Při vytváření odvozeného sloupce můžete buď vygenerovat nový sloupec, nebo aktualizovat existující sloupec. Do textového pole Sloupec zadejte sloupec, který vytváříte. Pokud chcete přepsat existující sloupec ve schématu, můžete použít rozevírací seznam sloupců. Pokud chcete vytvořit výraz odvozeného sloupce, vyberte v textovém poli Výraz Enter . Můžete začít psát výraz nebo otevřít tvůrce výrazů pro vytvoření logiky.

Nastavení odvozeného sloupce

Pokud chcete přidat další odvozené sloupce, vyberte možnost Přidat nad seznam sloupců nebo ikonu plus vedle existujícího odvozeného sloupce. Zvolte buď Přidat sloupec , nebo Přidat vzor sloupce.

Výběr nového odvozeného sloupce

Vzory sloupců

V případech, kdy schéma není explicitně definované nebo pokud chcete hromadně aktualizovat sadu sloupců, budete chtít vytvořit vzory sloupců. Vzory sloupců umožňují spárovat sloupce pomocí pravidel založených na metadatech sloupců a vytvářet odvozené sloupce pro každý odpovídající sloupec. Další informace najdete v tématu vytváření vzorů sloupců v odvozené transformaci sloupce.

Vzory sloupců

Vytváření schémat pomocí tvůrce výrazů

Při použití tvůrce výrazů pro mapování datového toku můžete vytvářet, upravovat a spravovat odvozené sloupce v oddílu Odvozené sloupce. Zobrazí se všechny sloupce vytvořené nebo změněné v transformaci. Interaktivně vyberte sloupec nebo vzor, který upravujete, výběrem názvu sloupce. Pokud chcete přidat další sloupec, vyberte Vytvořit nový a zvolte, jestli chcete přidat jeden sloupec nebo vzor.

Vytvořit nový sloupec

Při práci se složitými sloupci můžete vytvořit podsloupce. Uděláte to tak, že vyberete ikonu plus vedle libovolného sloupce a vyberete Přidat dílčí sloupec. Další informace o zpracování složitých typů v toku dat najdete v tématu Zpracování JSON v mapování toku dat.

Přidání dílčího sloupce

Další informace o zpracování složitých typů v toku dat najdete v tématu Zpracování JSON v mapování toku dat.

Přidání komplexního sloupce

Skript toku dat

Syntaxe

<incomingStream>
    derive(
           <columnName1> = <expression1>,
           <columnName2> = <expression2>,
           each(
                match(matchExpression),
                <metadataColumn1> = <metadataExpression1>,
                <metadataColumn2> = <metadataExpression2>
               )
          ) ~> <deriveTransformationName>

Příklad

Následující příklad je odvozený sloupec s názvem CleanData , který přebírá příchozí datový proud MoviesYear a vytvoří dva odvozené sloupce. První odvozený sloupec nahradí sloupec Rating hodnotou ratingu jako celočíselného typu. Druhý odvozený sloupec je vzor, který odpovídá každému sloupci, jehož název začíná "filmy". Pro každý odpovídající sloupec vytvoří sloupec movie , který se rovná hodnotě odpovídajícího sloupce s předponou "movie_".

V uživatelském rozhraní vypadá tato transformace jako na následujícím obrázku:

Odvození příkladu

Skript toku dat pro tuto transformaci je v následujícím fragmentu kódu:

MoviesYear derive(
                Rating = toInteger(Rating),
		        each(
                    match(startsWith(name,'movies')),
                    'movie' = 'movie_' + toString($$)
                )
            ) ~> CleanData
  • Přečtěte si další informace o jazyce výrazů Tok dat Mapping.