Transformace odvozeného sloupce při mapování toku dat

PLATÍ PRO: Azure Data Factory Azure Synapse Analytics

Tip

Vyzkoušejte si službu Data Factory v Microsoft Fabric, řešení pro analýzy typu all-in-one pro podniky. Microsoft Fabric zahrnuje všechno od přesunu dat až po datové vědy, analýzy v reálném čase, business intelligence a vytváření sestav. Přečtěte si, jak začít používat novou zkušební verzi zdarma.

Toky dat jsou k dispozici ve službě Azure Data Factory i v kanálech Azure Synapse. Tento článek se týká mapování toků dat. Pokud s transformacemi začínáte, přečtěte si úvodní článek Transformace dat pomocí mapování toku dat.

Pomocí transformace odvozeného sloupce můžete vygenerovat nové sloupce ve vašem toku dat nebo upravit existující pole.

Vytváření a aktualizace sloupců

Při vytváření odvozeného sloupce můžete buď vygenerovat nový sloupec, nebo aktualizovat existující sloupec. Do textového pole Sloupec zadejte sloupec, který vytváříte. Pokud chcete přepsat existující sloupec ve schématu, můžete použít rozevírací seznam sloupců. Pokud chcete vytvořit výraz odvozeného sloupce, klikněte na textové pole Pro zadání výrazu. Můžete začít psát výraz nebo otevřít tvůrce výrazů pro vytvoření logiky.

Derived column settings

Pokud chcete přidat další odvozené sloupce, klikněte nad seznam sloupců nebo na ikonu plus vedle existujícího odvozeného sloupce. Zvolte buď Přidat sloupec , nebo Přidat vzor sloupce.

New derived column selection

Vzory sloupců

V případech, kdy schéma není explicitně definováno nebo pokud chcete hromadně aktualizovat sadu sloupců, budete chtít vytvořit vzory sloupců. Vzory sloupců umožňují spárovat sloupce pomocí pravidel založených na metadatech sloupců a vytvářet odvozené sloupce pro každý odpovídající sloupec. Další informace najdete v tématu vytváření vzorů sloupců v odvozené transformaci sloupce.

Column patterns

Vytváření schémat pomocí tvůrce výrazů

Při použití tvůrce výrazů mapování toku dat můžete vytvářet, upravovat a spravovat odvozené sloupce v oddílu Odvozené sloupce. Zobrazí se všechny sloupce vytvořené nebo změněné v transformaci. Interaktivně vyberte, který sloupec nebo vzor upravujete, kliknutím na název sloupce. Pokud chcete přidat další sloupec, vyberte Vytvořit nový a zvolte, jestli chcete přidat jeden sloupec nebo vzor.

Create new column

Při práci se složitými sloupci můžete vytvořit podsloupce. Uděláte to tak, že kliknete na ikonu plus vedle libovolného sloupce a vyberete Přidat dílčí sloupec. Další informace o zpracování složitých typů v toku dat najdete v tématu Zpracování JSON v mapování toku dat.

Add subcolumn

Další informace o zpracování složitých typů v toku dat najdete v tématu Zpracování JSON v mapování toku dat.

Add complex column

Skript toku dat

Syntaxe

<incomingStream>
    derive(
           <columnName1> = <expression1>,
           <columnName2> = <expression2>,
           each(
                match(matchExpression),
                <metadataColumn1> = <metadataExpression1>,
                <metadataColumn2> = <metadataExpression2>
               )
          ) ~> <deriveTransformationName>

Příklad

Následující příklad je odvozený sloupec s názvem CleanData , který přebírá příchozí datový proud MoviesYear a vytvoří dva odvozené sloupce. První odvozený sloupec nahradí sloupec Rating hodnotou ratingu jako celočíselného typu. Druhý odvozený sloupec je vzor, který odpovídá každému sloupci, jehož název začíná "filmy". Pro každý odpovídající sloupec vytvoří sloupec movie , který se rovná hodnotě odpovídajícího sloupce s předponou "movie_".

V uživatelském rozhraní vypadá tato transformace jako na následujícím obrázku:

Derive example

Skript toku dat pro tuto transformaci je v následujícím fragmentu kódu:

MoviesYear derive(
                Rating = toInteger(Rating),
		        each(
                    match(startsWith(name,'movies')),
                    'movie' = 'movie_' + toString($$)
                )
            ) ~> CleanData
  • Přečtěte si další informace o jazyce výrazů mapování Tok dat.