Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Gilt für:
Azure Data Factory
Azure Synapse Analytics
Tipp
Data Factory in Microsoft Fabric ist die nächste Generation von Azure Data Factory mit einer einfacheren Architektur, integrierter KI und neuen Features. Wenn Sie mit der Datenintegration noch nicht vertraut sind, beginnen Sie mit Fabric Data Factory. Vorhandene ADF-Workloads können auf Fabric aktualisiert werden, um auf neue Funktionen in der Datenwissenschaft, Echtzeitanalysen und Berichterstellung zuzugreifen.
Datenflüsse sind sowohl in Azure Data Factory Pipelines als auch in Azure Synapse Analytics Pipelines verfügbar. Dieser Artikel gilt für Datenflusszuordnungen. Wenn Sie mit Transformationen noch nicht fertig sind, lesen Sie den einführungsartikel Transformieren von Daten mithilfe von Zuordnungsdatenflüssen.
Tipp
Die entsprechende Transformation (benutzerdefinierte Spalte) in Dataflow Gen2 finden Sie in einer Anleitung zu Dataflow Gen2 zum Zuordnen von Datenflussbenutzern.
Verwenden Sie die Transformation für abgeleitete Spalten, um in Ihrem Datenfluss neue Spalten zu generieren oder vorhandene Felder zu ändern.
Erstellen und Aktualisieren von Spalten
Beim Erstellen einer abgeleiteten Spalte können Sie entweder eine neue Spalte generieren oder eine vorhandene Spalte aktualisieren. Geben Sie im Textfeld „Spalte“ die Spalte ein, die Sie erstellen. Wenn Sie eine vorhandene Spalte in Ihrem Schema überschreiben möchten, können Sie die Dropdownliste für Spalten verwenden. Um den Ausdruck der abgeleiteten Spalte zu erstellen, wählen Sie im Textfeld "Ausdruck eingeben" aus. Sie können entweder mit dem Eingeben des Ausdrucks beginnen oder den Ausdrucks-Generator öffnen, um die Logik zu erstellen.
Wenn Sie weitere abgeleitete Spalten hinzufügen möchten, wählen Sie entweder Hinzufügen oben in der Spaltenliste oder das Plussymbol neben einer vorhandenen abgeleiteten Spalte aus. Klicken Sie entweder auf Spalte hinzufügen oder auf Spaltenmuster hinzufügen.
Spaltenmuster
In Fällen, in denen Ihr Schema nicht explizit definiert ist oder wenn Sie eine Gruppe von Spalten in Massen aktualisieren möchten, sollten Sie Spaltenmuster erstellen. Mithilfe von Spaltenmustern können Sie Spalten anhand von Regeln abgleichen, die auf den Spaltenmetadaten basieren, und abgeleitete Spalten für jede übereinstimmende Spalte erstellen. Weitere Informationen finden Sie unter Erstellen von Spaltenmustern in der Transformation für abgeleitete Spalten.
Erstellen von Schemas mit dem Ausdrucks-Generator
Wenn Sie den Ausdrucks-Generator für Zuordnungsdatenflüsse verwenden, können Sie Ihre abgeleiteten Spalten im Abschnitt Abgeleitete Spalten erstellen, bearbeiten und verwalten. Es werden alle in der Transformation erstellten oder geänderten Spalten aufgelistet. Wählen Sie interaktiv aus, welche Spalte oder welches Muster Sie bearbeiten, indem Sie den Spaltennamen auswählen. Wenn Sie eine weitere Spalte hinzufügen möchten, wählen Sie "Neu erstellen " aus, und wählen Sie aus, ob Sie eine einzelne Spalte oder ein Muster hinzufügen möchten.
Wenn Sie mit komplexen Spalten arbeiten, können Sie Unterspalten erstellen. Wählen Sie dazu das Plussymbol neben einer beliebigen Spalte aus, und wählen Sie " Unterspalte hinzufügen" aus. Weitere Informationen zum Umgang mit komplexen Typen im Datenfluss finden Sie unter JSON-Verarbeitung mit Mapping Data Flow.
Weitere Informationen zum Umgang mit komplexen Typen im Datenfluss finden Sie unter JSON-Verarbeitung mit Mapping Data Flow.
Datenflussskript
Syntax
<incomingStream>
derive(
<columnName1> = <expression1>,
<columnName2> = <expression2>,
each(
match(matchExpression),
<metadataColumn1> = <metadataExpression1>,
<metadataColumn2> = <metadataExpression2>
)
) ~> <deriveTransformationName>
Beispiel
Das folgende Beispiel ist eine abgeleitete Spalte mit dem Namen CleanData, die aus einem eingehenden Datenstrom MoviesYear zwei abgeleitete Spalten erstellt. Die erste abgeleitete Spalte ersetzt die Spalte Rating durch den Wert für „Rating“ als ganzzahliger Typ. Die zweite abgeleitete Spalte ist ein Muster, das jede Spalte abgleicht, deren Name mit „movies“ beginnt. Für jede übereinstimmende Spalte wird eine Spalte movie erstellt, die dem Wert der übereinstimmenden Spalte entspricht, die dem Präfix "movie_" vorangestellt ist.
In der Benutzeroberfläche sieht diese Transformation wie in der folgenden Abbildung aus:
Das Datenflussskript für diese Transformation befindet sich im folgenden Codeausschnitt:
MoviesYear derive(
Rating = toInteger(Rating),
each(
match(startsWith(name,'movies')),
'movie' = 'movie_' + toString($$)
)
) ~> CleanData
Zugehöriger Inhalt
- Erfahren Sie mehr über die Mapping Datenfluss Ausdruckssprache.