Ausdrucksfunktionen im Zuordnungsdatenfluss
GILT FÜR: Azure Data Factory Azure Synapse Analytics
Tipp
Testen Sie Data Factory in Microsoft Fabric, eine All-in-One-Analyselösung für Unternehmen. Microsoft Fabric deckt alle Aufgaben ab, von der Datenverschiebung bis hin zu Data Science, Echtzeitanalysen, Business Intelligence und Berichterstellung. Erfahren Sie, wie Sie kostenlos eine neue Testversion starten!
Datenflüsse sind sowohl in Azure Data Factory als auch in Azure Synapse-Pipelines verfügbar. Dieser Artikel gilt für Zuordnungsdatenflüsse. Wenn Sie noch nicht mit Transformationen arbeiten, lesen Sie den Einführungsartikel Transformieren von Daten mit einem Zuordnungsdatenfluss.
Der folgende Artikel enthält Details zu Ausdrucksfunktionen, die von Azure Data Factory und Azure Synapse Analytics in Zuordnungsdatenflüssen unterstützt werden.
Liste der Ausdrucksfunktionen
In Data Factory- und Synapse-Pipelines verwenden Sie die Ausdruckssprache des Features für Zuordnungsdatenflüsse, um Datentransformationen zu konfigurieren.
Ausdrucksfunktion | Aufgabe |
---|---|
abs | Absoluter Wert einer Zahl. |
acos | Berechnet einen invertierten Kosinuswert. |
add | Addiert ein Paar Zeichenfolgen oder Zahlen. Addiert ein Datum zu einer Anzahl von Tagen. Fügt einem Zeitstempel eine Dauer hinzu. Fügt ein Array mit ähnlichem Typ an ein anderes an. Entspricht dem Operator „+“. |
and | Logischer AND-Operator. Entspricht „&&“. |
asin | Berechnet einen invertierten Sinuswert. |
assertErrorMessages | Gibt die Zuordnung aller Assert-Meldungen zurück. |
atan | Berechnet einen invertierten Tangenswert. |
atan2 | Gibt den Winkel im Bogenmaß zwischen der positiven X-Achse einer Ebene und dem durch die Koordinaten angegebenen Punkt zurück. |
between | Überprüft, ob der erste Wert zwischen zwei anderen Werten liegt. Numerische Werte, Zeichenfolgenwerte und datetime-Werte können verglichen werden |
bitwiseAnd | Bitweiser And-Operator für integrale Datentypen. Identisch mit & Operator. |
bitwiseOr | Bitweiser Or-Operator für integrale Datentypen. Gleich wie Operator | |
bitwiseXor | Bitweiser Or-Operator für integrale Datentypen. Gleich wie Operator | |
blake2b | Berechnet den Blake2-Hash von Spalten verschiedener primitiver Datentypen anhand einer Bitlänge. Die Bitlänge darf nur ein Vielfaches von 8 sein und muss zwischen 8 und 512 liegen. Dies kann zum Berechnen eines Fingerabdrucks für eine Zeile verwendet werden. |
blake2bBinary | Berechnet den Blake2-Digest einer Spalte mit unterschiedlichen grundtypischen Datentypen mit einer Bitlänge, die nur Vielfache von 8 zwischen 8 und 512 sein kann. Dies kann zum Berechnen eines Fingerabdrucks für eine Zeile verwendet werden: |
case | Wendet basierend auf alternierenden Bedingungen einen Wert oder den anderen an. Wenn die Anzahl von Eingaben gerade ist, ist der andere Wert für die letzte Bedingung standardmäßig NULL. |
cbrt | Berechnet die Kubikwurzel einer Zahl. |
ceil | Gibt den kleinsten Integerwert zurück, der nicht kleiner als die Zahl ist. |
coalesce | Gibt den ersten Wert ungleich NULL aus einem Satz von Eingaben zurück. Alle Eingaben müssen den gleichen Typ haben. |
columnNames | Ruft die Namen aller Ausgabespalten für einen Stream ab. Sie können einen optionalen Streamnamen als erstes Argument und optionales zweites Argument übergeben, um nur Schemaabweichungsspalten zurückzugeben. |
columns | Ruft die Werte aller Ausgabespalten für einen Stream ab. Sie können einen optionalen Streamnamen als zweites Argument übergeben. |
compare | Vergleicht zwei Werte des gleichen Typs. Bei „Wert 1 < Wert 2“ wird eine negative ganze Zahl zurückgegeben. Bei „Wert 1 == Wert 2“ wird „0“ zurückgegeben. Und bei „Wert 1 > Wert 2“ wird ein positiver Wert zurückgegeben. |
concat | Verkettet eine variable Anzahl von Zeichenfolgen miteinander. Entspricht dem Operator „+“ mit Zeichenfolgen. |
concatWS | Verkettet eine variable Anzahl von Zeichenfolgen unter Verwendung eines Trennzeichens miteinander. Der erste Parameter ist das Trennzeichen. |
cos | Berechnet einen Kosinuswert. |
cosh | Berechnet einen hyperbolischen Kosinuswert. |
crc32 | Berechnet den CRC32-Hash einer Gruppe von Spalten verschiedener primitiver Datentypen anhand einer angegebenen Bitlänge. Die Bitlänge muss die Werte 0 (256), 224, 256, 384 oder 512 aufweisen. Dies kann zum Berechnen eines Fingerabdrucks für eine Zeile verwendet werden. |
degrees | Konvertiert Bogenmaße zu Graden. |
divide | Dividiert ein Zahlenpaar. Entspricht dem Operator / . |
dropLeft | Entfernt die angegebene Anzahl von Zeichen links von der Zeichenfolge. Wenn die angeforderte Löschung die Länge der Zeichenfolge überschreitet, wird eine leere Zeichenfolge zurückgegeben. |
dropRight | Entfernt die angegebene Anzahl von Zeichen rechts von der Zeichenfolge. Wenn die angeforderte Löschung die Länge der Zeichenfolge überschreitet, wird eine leere Zeichenfolge zurückgegeben. |
endsWith | Überprüft, ob die Zeichenfolge mit der angegebenen Zeichenfolge endet. |
equals | Operator für Vergleich auf Gleichheit. Entspricht dem Operator „==“. |
equalsIgnoreCase | Operator für Vergleich auf Gleichheit ohne Berücksichtigung der Groß-/Kleinschreibung. Gleich wie Operator <=>. |
escape | Versieht eine Zeichenfolge mit einem Escapezeichen entsprechend einem Format. Literalwerte für zulässige Formate sind „json“, „xml“, „ecmascript“, „html“ und „java“. |
expr | Führt zu einem Ausdruck aus einer Zeichenfolge. Dies entspricht dem Schreiben des Ausdrucks in nicht literaler Form und kann zum Übergeben von Parametern als Zeichenfolgendarstellungen verwendet werden. |
factorial | Berechnet die Fakultät einer Zahl. |
false | Gibt immer den Wert FALSE zurück. Verwenden Sie die Funktion syntax(false()) , wenn eine Spalte mit dem Namen „false“ vorhanden ist. |
floor | Gibt den größten Integerwert zurück, der nicht größer als die Zahl ist. |
fromBase64 | Decodiert die angegebene Base64-codierte Zeichenfolge. |
greater | Operator für Vergleich auf „größer als“. Gleich wie Operator >. |
greaterOrEqual | Operator für Vergleich auf „größer als oder gleich“. Gleich wie Operator >=. |
greatest | Gibt den größten Wert in der Liste der Werte als Eingabe zurück, wobei NULL-Werte übersprungen werden. Gibt NULL zurück, wenn alle Eingaben NULL sind. |
hasColumn | Überprüft anhand des Namens, ob ein Spaltenwert im Stream vorhanden ist. Sie können einen optionalen Streamnamen als zweites Argument übergeben. Spaltennamen, die zur Entwurfszeit bekannt sind, sollten nur mit ihrem Namen angegeben werden. Berechnete Eingaben werden nicht unterstützt. Sie können aber Parameterersetzungen verwenden. |
hasError | Überprüft, ob Assert mit der angegebenen ID als Fehler markiert ist. |
iif | Wendet basierend auf einer Bedingung einen Wert oder den anderen an. Wenn „Andere“ nicht angegeben ist, wird NULL angenommen. Die Werte müssen kompatibel sein (numerisch, Zeichenfolge, ...). |
iifNull | Bei zwei oder mehr Eingaben wird das erste Element zurückgegeben, das nicht NULL ist. Diese Funktion ist gleichbedeutend mit „coalesce“. |
initCap | Wandelt den ersten Buchstaben jedes Worts in Großbuchstaben um. Wörter werden als durch Leerzeichen getrennt identifiziert. |
instr | Sucht die Position (basierend auf 1) der Teilzeichenfolge innerhalb einer Zeichenfolge. Bei nicht gefundener Zeichenfolge wird 0 zurückgegeben. |
isDelete | Überprüft, ob die Zeile zum Löschen markiert ist. Für Transformationen, die mehrere Eingabestreams akzeptieren, können Sie den (auf 1 basierenden) Index des Streams übergeben. Der Streamindex muss „1“ oder „2“ lauten, und der Standardwert ist „1“. |
isError | Überprüft, ob die Zeile als Fehler markiert ist. Für Transformationen, die mehrere Eingabestreams akzeptieren, können Sie den (auf 1 basierenden) Index des Streams übergeben. Der Streamindex muss „1“ oder „2“ lauten, und der Standardwert ist „1“. |
isIgnore | Überprüft, ob die Zeile zum Ignorieren markiert ist. Für Transformationen, die mehrere Eingabestreams akzeptieren, können Sie den (auf 1 basierenden) Index des Streams übergeben. Der Streamindex muss „1“ oder „2“ lauten, und der Standardwert ist „1“. |
isInsert | Überprüft, ob die Zeile zum Einfügen markiert ist. Für Transformationen, die mehrere Eingabestreams akzeptieren, können Sie den (auf 1 basierenden) Index des Streams übergeben. Der Streamindex muss „1“ oder „2“ lauten, und der Standardwert ist „1“. |
isMatch | Überprüft, ob die Zeile bei der Suche übereinstimmt. Für Transformationen, die mehrere Eingabestreams akzeptieren, können Sie den (auf 1 basierenden) Index des Streams übergeben. Der Streamindex muss „1“ oder „2“ lauten, und der Standardwert ist „1“. |
isNull | Überprüft, ob der Wert NULL ist. |
isUpdate | Überprüft, ob die Zeile zum Aktualisieren markiert ist. Für Transformationen, die mehrere Eingabestreams akzeptieren, können Sie den (auf 1 basierenden) Index des Streams übergeben. Der Streamindex muss „1“ oder „2“ lauten, und der Standardwert ist „1“. |
isUpsert | Überprüft, ob die Zeile zum Einfügen markiert ist. Für Transformationen, die mehrere Eingabestreams akzeptieren, können Sie den (auf 1 basierenden) Index des Streams übergeben. Der Streamindex muss „1“ oder „2“ lauten, und der Standardwert ist „1“. |
jaroWinkler | Ruft den Jaro-Winkler-Abstand zwischen zwei Zeichenfolgen ab. |
least | Operator für Vergleich auf „kleiner als oder gleich“. Gleich wie Operator <. |
left | Extrahiert eine Teilzeichenfolge mit Beginn an Index 1 mit einer Anzahl von Zeichen. Entspricht SUBSTRING(str, 1, n). |
length | Gibt die Länge der Zeichenfolge zurück. |
lesser | Operator für Vergleich auf „kleiner als“. Gleich wie Operator <. |
lesserOrEqual | Operator für Vergleich auf „kleiner als oder gleich“. Gleich wie Operator <. |
levenshtein | Ruft die Levenshtein-Distanz zwischen zwei Zeichenfolgen ab. |
like | Das Muster ist eine Zeichenfolge, die buchstabenweise verglichen wird. Ausnahmen sind die folgenden Sonderzeichen: „_“ entspricht einem einzelnen Zeichen in der Eingabe (ähnlich „.“ in regulären posix -Ausdrücken). |
locate | Sucht die Position (basierend auf 1) der Teilzeichenfolge innerhalb einer Zeichenfolge ab einer bestimmten Position. Wenn die Position nicht angegeben ist, wird vom dem Anfang der Zeichenfolge ausgegangen. Bei nicht gefundener Zeichenfolge wird 0 zurückgegeben. |
log | Berechnet den Logarithmuswert. Eine optionale Basis kann angegeben werden; andernfalls wird die Eulersche Zahl verwendet. |
log10 | Berechnet den Logarithmuswert über der Basis 10. |
lower | Wandelt eine Zeichenfolge in Kleinschreibung um. |
lpad | Füllt die Zeichenfolge nach links mit der angegebenen Auffüllung bis zu einer bestimmten Länge auf. Ist die Zeichenfolge größer oder gleich der Länge, wird sie auf die Länge gekürzt. |
ltrim | Entfernt vorangestellte Zeichen aus einer Zeichenfolge. Wenn der zweite Parameter nicht angegeben ist, werden Leerstellen entfernt. Andernfalls werden Zeichen entfernt, die im zweiten Parameter angegeben sind. |
md5 | Berechnet den MD5-Hash einer Gruppe von Spalten verschiedener primitiver Datentypen und gibt eine hexadezimale Zeichenfolge mit 32 Zeichen zurück. Dies kann zum Berechnen eines Fingerabdrucks für eine Zeile verwendet werden. |
minus | Subtrahiert Zahlen. Subtrahiert eine Anzahl von Tagen von einem Datum. Subtrahiert die Dauer von einem Zeitstempel. Subtrahiert einen Zeitstempel vom anderen, um den Unterschied in Millisekunden zu erhalten. Entspricht dem Operator „-“. |
mod | Führt einen Modulo für ein Zahlenpaar aus. Entspricht dem Operator „%“. |
multiply | Multipliziert ein Paar Zahlen. Entspricht dem Operator „*“. |
negate | Negiert eine Zahl. Wandelt positive Zahlen in negative um (und umgekehrt). |
nextSequence | Gibt die nächste eindeutige Folge zurück. Die Zahl ist nur innerhalb einer Partition aufeinanderfolgend, und ihr ist die Partitions-ID (partitionId) vorangestellt. |
normalize | Normalisiert den Zeichenfolgenwert zum Trennen von Unicode-Akzentzeichen. |
not | Logischer Negationsoperator. |
notEquals | Operator für Vergleich auf Ungleichheit. Entspricht dem Operator „!=“. |
null | Gibt einen NULL-Wert zurück. Verwenden Sie die Funktion syntax(null()) , wenn eine Spalte mit dem Namen „null“ vorhanden ist. Jeder Vorgang, in dem dieser Ausdruck verwendet wird, hat als Ergebnis NULL. |
or | Logischer OR-Operator. Entspricht „||“. |
pMod | Führt einen positiven Modulo für ein Zahlenpaar aus. |
partitionId | Gibt die aktuelle Partitions-ID zurück, in der sich die Eingabezeile befindet. |
power | Potenziert eine Zahl um den Potenzwert einer anderen. |
radians | Konvertiert Grad in Radiant |
random | Gibt eine Zufallszahl mit einem optionalen Seed innerhalb einer Partition zurück. Der Seed sollte ein fester Wert sein und wird zusammen mit der partitionId zum Erzeugen von Zufallswerten verwendet. |
regexExtract | Extrahiert eine übereinstimmende Teilzeichenfolge anhand eines angegebenen RegEx-Musters. Der letzte Parameter identifiziert die Übereinstimmungsgruppe und ist standardmäßig 1, wenn er nicht angegeben ist. `<regex>` (invertiertes Hochkomma) stimmt mit einer Zeichenfolge ohne Escapezeichen überein. |
regexMatch | Überprüft, ob die Zeichenfolge mit dem angegebenen RegEx-Muster übereinstimmt. `<regex>` (invertiertes Hochkomma) stimmt mit einer Zeichenfolge ohne Escapezeichen überein. |
regexReplace | Ersetzt alle Vorkommen eines RegEx-Musters durch eine andere Teilzeichenfolge in der angegebenen Zeichenfolge. `<regex>` (invertiertes Hochkomma) stimmt mit einer Zeichenfolge ohne Escapezeichen überein. |
regexSplit | Unterteilt eine Zeichenfolge anhand eines Trennzeichens basierend auf einem regulären Ausdruck und gibt ein Array mit Zeichenfolgen zurück. |
replace | Ersetzt alle Vorkommen einer Teilzeichenfolge durch eine andere Teilzeichenfolge in der angegebenen Zeichenfolge. Wenn der letzte Parameter weggelassen wird, wird standardmäßig eine leere Zeichenfolge angegeben. |
reverse | Kehrt eine Zeichenfolge um. |
right | Extrahiert eine Teilzeichenfolge mit einer Anzahl von Zeichen von rechts. Entspricht SUBSTRING(str, LENGTH(str) - n, n). |
rlike | Überprüft, ob die Zeichenfolge mit dem angegebenen RegEx-Muster übereinstimmt. |
round | Rundet eine Zahl mit optional angegebenen Dezimalstellen und einem optionalen Rundungsmodus. Wenn die Dezimalstellen nicht angegeben sind, lautet der Standardwert 0. Wenn der Modus nicht angegeben ist, wird standardmäßig ROUND_HALF_UP(5) verwendet. Die Werte für die Rundung umfassen |
rpad | Füllt die Zeichenfolge nach rechts mit der angegebenen Auffüllung bis zu einer bestimmten Länge auf. Ist die Zeichenfolge größer oder gleich der Länge, wird sie auf die Länge gekürzt. |
rtrim | Entfernt nachgestellte Zeichen aus einer Zeichenfolge. Wenn der zweite Parameter nicht angegeben ist, werden Leerstellen entfernt. Andernfalls werden Zeichen entfernt, die im zweiten Parameter angegeben sind. |
sha1 | Berechnet den SHA-1-Hash einer Gruppe von Spalten verschiedener primitiver Datentypen und gibt eine hexadezimale Zeichenfolge mit 40 Zeichen zurück. Dies kann zum Berechnen eines Fingerabdrucks für eine Zeile verwendet werden. |
sha2 | Berechnet den SHA-2-Hash einer Gruppe von Spalten verschiedener primitiver Datentypen mit einer angegebenen Bitlänge, die nur die Werte 0 (256), 224, 256, 384, 512 aufweisen kann. Dies kann zum Berechnen eines Fingerabdrucks für eine Zeile verwendet werden. |
sin | Berechnet einen Sinuswert. |
sinh | Berechnet einen hyperbolischen Sinuswert. |
soundex | Ruft den Code soundex für die Zeichenfolge ab. |
split | Unterteilt eine Zeichenfolge basierend auf einem Trennzeichen und gibt ein Array mit Zeichenfolgen zurück. |
sqrt | Berechnet die Quadratwurzel einer Zahl. |
startsWith | Überprüft, ob die Zeichenfolge mit der angegebenen Zeichenfolge beginnt. |
substring | Extrahiert eine Teilzeichenfolge mit einer bestimmten Länge ab einer Position. Die Position basiert auf 1. Wenn die Länge nicht angegeben ist, wird standardmäßig bis zum Ende der Zeichenfolge extrahiert. |
substringIndex | Extrahiert die Teilzeichenfolge vor den count -Vorkommen des Trennzeichens. Wenn count positiv ist, wird alles links vom letzten Trennzeichen (von links gezählt) zurückgegeben. Wenn count negativ ist, wird alles rechts vom letzten Trennzeichen (von rechts gezählt) zurückgegeben. |
tan | Berechnet einen Tangenswert. |
tanh | Berechnet einen hyperbolischen Tangenswert. |
translate | Ersetzt eine Gruppe von Zeichen durch eine andere Gruppe von Zeichen in der Zeichenfolge. Zeichen werden 1:1 ersetzt. |
trim | Entfernt vorangestellte und nachgestellte Zeichen aus einer Zeichenfolge. Wenn der zweite Parameter nicht angegeben ist, werden Leerstellen entfernt. Andernfalls werden Zeichen entfernt, die im zweiten Parameter angegeben sind. |
true | Gibt immer den Wert TRUE zurück. Verwenden Sie die Funktion syntax(true()) , wenn eine Spalte mit dem Namen „true“ vorhanden ist. |
typeMatch | Stimmt mit dem Typ der Spalte überein. Kann nur in Musterausdrücken verwendet werden. „number“ stimmt mit „short“, „integer“, „long“, „double“, „float“ oder „decimal“ überein, „integral“ stimmt mit „short“, „integer“ oder „long“ überein, „fractional“ stimmt mit „double“, „float“ oder „decimal“ überein, und „datetime“ stimmt mit „date“ oder „timestamp“ überein. |
unescape | Entfernt die Escapezeichen einer Zeichenfolge entsprechend einem Format. Literalwerte für zulässige Formate sind „json“, „xml“, „ecmascript“, „html“ und „java“. |
upper | Wandelt eine Zeichenfolge in Großschreibung um. |
uuid | Gibt die generierte UUID zurück. |
xor | Logischer XOR-Operator. Entspricht dem Operator „^“. |
Zugehöriger Inhalt
- Liste aller Aggregatfunktionen
- Liste aller Arrayfunktionen
- Liste aller zwischengespeicherten Suchfunktionen
- Liste aller Konvertierungsfunktionen
- Liste aller Datums- und Uhrzeitfunktionen
- Liste aller Zuordnungsfunktionen
- Liste aller Metafunktionen
- Liste aller Fensterfunktionen
- Nutzungsdetails aller Datentransformationsausdrücke.
- Erfahren Sie, wie Sie den Ausdrucks-Generator verwenden.