Teilen über


Ausdrucksfunktionen im Zuordnen von Datenflüssen

GILT FÜR: Azure Data Factory Azure Synapse Analytics

Tipp

Testen Sie Data Factory in Microsoft Fabric, eine All-in-One-Analyselösung für Unternehmen. In Microsoft Fabric können Sie alle erforderlichen Aufgaben ausführen, von der Datenverschiebung bis hin zu Data Science, Echtzeitanalysen, Business Intelligence und Berichterstellung. Erfahren Sie, wie Sie kostenlos eine neue Testversion starten!

Datenflüsse sind sowohl in Azure Data Factory-Pipelines als auch in Azure Synapse Analytics-Pipelines verfügbar. Dieser Artikel gilt für Zuordnungsdatenflüsse. Wenn Sie mit Transformationen noch nicht fertig sind, lesen Sie den einführungsartikel Transformieren von Daten mithilfe von Zuordnungsdatenflüssen.

Dieser Artikel enthält Details zu Ausdrucksfunktionen, die von Azure Data Factory und Azure Synapse Analytics bei der Zuordnung von Datenflüssen unterstützt werden.

Liste der Ausdrucksfunktionen

Verwenden Sie in Azure Data Factory- und Azure Synapse Analytics-Pipelines die Ausdruckssprache des Zuordnungsdatenflussfeatures, um Datentransformationen zu konfigurieren.

Ausdrucksfunktion Aufgabe
abs Gibt den absoluten Wert einer Zahl an.
acos Berechnet einen invertierten Kosinuswert.
add Addiert ein Paar Zeichenfolgen oder Zahlen. Addiert ein Datum zu einer Anzahl von Tagen. Fügt einem Zeitstempel eine Dauer hinzu. Fügt ein Array mit ähnlichem Typ an ein anderes an. Entspricht dem Operator +.
and Verwendet den logischen AND Operator. Identisch mit &&.
asin Berechnet einen invertierten Sinuswert.
assertErrorMessages Gibt eine Abbildung aller Assert-Nachrichten zurück.
atan Berechnet einen invertierten Tangenswert.
atan2 Gibt den Winkel im Bogenmaß zwischen der positiven X-Achse einer Ebene und dem durch die Koordinaten angegebenen Punkt zurück.
between Überprüft, ob der erste Wert zwischen zwei anderen Werten liegt. Sie können numerische, Zeichenfolgen und datetime Werte vergleichen.
bitwiseAnd Verwendet den bitweisen And Operator über integrale Typen hinweg. Entspricht dem Operator &.
bitwiseOr Verwendet den bitweisen Or Operator über integrale Typen hinweg. Entspricht dem Operator |.
bitwiseXor Verwendet den bitweisen Or Operator über integrale Typen hinweg. Entspricht dem Operator |.
blake2b Berechnet den Blake2-Digest einer Reihe von Spalten unterschiedlicher primitiver Datentypen, wenn eine Bitlänge angegeben ist. Die Bitlänge darf nur ein Vielfaches von 8 sein und muss zwischen 8 und 512 liegen. Sie können ihn verwenden, um einen Fingerabdruck für eine Zeile zu berechnen.
blake2bBinary Berechnet den Blake2-Digest einer Reihe von Spalten unterschiedlicher primitiver Datentypen bei einer Bitlänge, die nur Vielfache von 8 zwischen 8 und 512 sein kann. Sie können ihn verwenden, um einen Fingerabdruck für eine Zeile zu berechnen.
case Wendet einen Wert oder den anderen basierend auf wechselnden Bedingungen an. Wenn die Anzahl von Eingaben gerade ist, ist der andere Wert für die letzte Bedingung standardmäßig NULL.
cbrt Berechnet die Kubikwurzel einer Zahl.
ceil Gibt den kleinsten Integerwert zurück, der nicht kleiner als die Zahl ist.
coalesce Gibt den ersten Wert ungleich NULL aus einem Satz von Eingaben zurück. Alle Eingaben müssen den gleichen Typ haben.
columnNames Ruft die Namen aller Ausgabespalten für einen Stream ab. Sie können einen optionalen Streamnamen als erstes Argument und optionales zweites Argument übergeben, um nur Schemaabweichungsspalten zurückzugeben.
columns Ruft die Werte aller Ausgabespalten für einen Stream ab. Sie können einen optionalen Streamnamen als zweites Argument übergeben.
compare Vergleicht zwei Werte des gleichen Typs. Gibt eine negative ganze Zahl zurück, wenn Wert1 < Wert2 oder 0, wenn Wert1 == Wert2, und gibt einen positiven Wert zurück, wenn Wert1 > Wert2.
concat Verkettet eine variable Anzahl von Zeichenfolgen miteinander. Identisch mit dem + Operator mit Zeichenfolgen.
concatWS Verkettet eine variable Anzahl von Zeichenfolgen unter Verwendung eines Trennzeichens miteinander. Der erste Parameter ist das Trennzeichen.
cos Berechnet einen Kosinuswert.
cosh Berechnet einen hyperbolischen Kosinuswert.
crc32 Berechnet den CRC32-Hash einer Reihe von Spalten unterschiedlicher primitiver Datentypen, wenn eine Bitlänge angegeben ist. Die Bitlänge muss Werte 0 (256), 224, 256, 384 und 512 haben. Sie können ihn verwenden, um einen Fingerabdruck für eine Zeile zu berechnen.
degrees Konvertiert Bogenmaße zu Graden.
divide Dividiert ein Zahlenpaar. Entspricht dem Operator /.
dropLeft Entfernt so viele Zeichen wie angegeben von der linken Seite der Zeichenfolge. Wenn die angeforderte Löschung die Länge der Zeichenfolge überschreitet, wird eine leere Zeichenfolge zurückgegeben.
dropRight Entfernt so viele Zeichen wie angegeben von rechts von der Zeichenfolge. Wenn die angeforderte Löschung die Länge der Zeichenfolge überschreitet, wird eine leere Zeichenfolge zurückgegeben.
endsWith Überprüft, ob die Zeichenfolge mit der angegebenen Zeichenfolge endet.
equals Verwendet den Vergleichsoperator "Equals". Entspricht dem Operator ==.
equalsIgnoreCase Verwendet den Operator für Vergleich auf Gleichheit ohne Berücksichtigung der Groß-/Kleinschreibung. Entspricht dem Operator <=>.
escape Versieht eine Zeichenfolge mit einem Escapezeichen entsprechend einem Format. Literalwerte für zulässiges Format sind json, , xml, ecmascript, htmlund java.
expr Führt zu einem Ausdruck aus einer Zeichenfolge. Entspricht dem Schreiben des Ausdrucks in einer nichtliteralen Form. Sie können sie verwenden, um Parameter als Zeichenfolgendarstellungen zu übergeben.
factorial Berechnet die Fakultät einer Zahl.
false Gibt immer den Wert FALSE zurück. Verwenden Sie die Funktion syntax(false()) , wenn eine Spalte mit dem Namen vorhanden falseist.
floor Gibt den größten Integerwert zurück, der nicht größer als die Zahl ist.
fromBase64 Decodiert die spezifische base64-codierte Zeichenfolge.
greater Verwendet den Operator für Vergleich auf „größer als“. Entspricht dem Operator >.
greaterOrEqual Verwendet den Operator für Vergleich auf „größer als oder gleich“. Entspricht dem Operator >=.
greatest Gibt den größten Wert in der Liste der Werte als Eingabe zurück, wobei NULL-Werte übersprungen werden. Gibt NULL zurück, wenn alle Eingaben NULL sind.
hasColumn Überprüft anhand des Namens, ob ein Spaltenwert im Stream vorhanden ist. Sie können einen optionalen Streamnamen als zweites Argument übergeben. Spaltennamen, die zur Entwurfszeit bekannt sind, sollten nur mit ihrem Namen adressiert werden. Berechnete Eingaben werden nicht unterstützt, Aber Sie können Parameterersetzungen verwenden.
hasError Überprüft, ob die Assertion mit der angegebenen ID als Fehler gekennzeichnet ist.
iif Wendet einen Wert oder den anderen basierend auf einer Bedingung an. Wenn der andere nicht angegeben ist, wird der Wert berücksichtigt NULL. Beide Werte müssen kompatibel sein (z. B. numerische oder Zeichenfolge).
iifNull Gibt das erste nicht NULL-Element zurück, wenn zwei oder mehr Eingaben vorhanden sind. Diese Funktion ist gleichbedeutend mit coalesce.
initCap Wandelt den ersten Buchstaben jedes Worts in Großbuchstaben um. Wörter werden als durch Leerzeichen getrennt identifiziert.
instr Findet die Position (einsbasiert) der Teilzeichenfolge in einem String. Wird nichts gefunden, wird 0 zurückgegeben.
isDelete Überprüft, ob die Zeile zum Löschen markiert ist. Bei Transformationen, die mehr als einen Eingabedatenstrom verwenden, können Sie den (1-basierten) Index des Datenstroms übergeben. Der Datenstromindex sollte entweder 1 oder 2 sein, und der Standardwert ist 1.
isError Überprüft, ob die Zeile als Fehler markiert ist. Bei Transformationen, die mehr als einen Eingabedatenstrom verwenden, können Sie den (1-basierten) Index des Datenstroms übergeben. Der Stream-Index sollte entweder 1 oder 2 sein. Der Standardwert ist 1.
isIgnore Überprüft, ob die Zeile ignoriert werden soll. Bei Transformationen, die mehr als einen Eingabedatenstrom verwenden, können Sie den (1-basierten) Index des Datenstroms übergeben. Der Stream-Index sollte entweder 1 oder 2 sein. Der Standardwert ist 1.
isInsert Überprüft, ob die Zeile zum Einfügen markiert ist. Bei Transformationen, die mehr als einen Eingabedatenstrom verwenden, können Sie den (1-basierten) Index des Datenstroms übergeben. Der Stream-Index sollte entweder 1 oder 2 sein. Der Standardwert ist 1.
isMatch Überprüft, ob die Zeile bei der Suche übereinstimmt. Bei Transformationen, die mehr als einen Eingabedatenstrom verwenden, können Sie den (1-basierten) Index des Datenstroms übergeben. Der Stream-Index sollte entweder 1 oder 2 sein. Der Standardwert ist 1.
isNull Überprüft, ob der Wert ist NULL.
isUpdate Überprüft, ob die Zeile zum Aktualisieren markiert ist. Bei Transformationen, die mehr als einen Eingabedatenstrom verwenden, können Sie den (1-basierten) Index des Datenstroms übergeben. Der Stream-Index sollte entweder 1 oder 2 sein. Der Standardwert ist 1.
isUpsert Überprüft, ob die Zeile zum Einfügen markiert ist. Bei Transformationen, die mehr als einen Eingabedatenstrom verwenden, können Sie den (1-basierten) Index des Datenstroms übergeben. Der Stream-Index sollte entweder 1 oder 2 sein. Der Standardwert ist 1.
jaroWinkler Ruft den Jaro-Winkler-Abstand zwischen zwei Zeichenfolgen ab.
least Verwendet den Operator für Vergleich auf „kleiner als oder gleich“. Entspricht dem Operator <=.
left Extrahiert eine Teilzeichenfolge, die bei Index 1 beginnt, mit der Anzahl der Zeichen. Identisch mit SUBSTRING(str, 1, n).
length Gibt die Länge der Zeichenfolge zurück.
lesser Verwendet den Operator für Vergleich auf „kleiner als“. Entspricht dem Operator <.
lesserOrEqual Verwendet den Operator für Vergleich auf „kleiner als oder gleich“. Entspricht dem Operator <=.
levenshtein Ruft die Levenshtein-Distanz zwischen zwei Zeichenfolgen ab.
like Verwendet ein Muster mit einer Zeichenfolge, die genau übereinstimmt. Die Ausnahme ist das Sondersymbol _ , das einem zeichen in der Eingabe entspricht (ähnlich wie .* in posix regulären Ausdrücken).
locate Sucht die Position (basierend auf 1) der Teilzeichenfolge innerhalb einer Zeichenfolge ab einer bestimmten Position. Wenn die Position nicht angegeben wird, beginnen Sie vom Anfang der Zeichenfolge. Wird nichts gefunden, wird 0 zurückgegeben.
log Berechnet den Protokollwert. Sie können bei Verwendung eine optionale Basis oder eine Eulernummer angeben.
log10 Berechnet den Logarithmuswert über der Basis 10.
lower Wandelt eine Zeichenfolge in Kleinschreibung um.
lpad Füllt die Zeichenfolge nach links mit der angegebenen Auffüllung bis zu einer bestimmten Länge auf. Ist die Zeichenfolge größer oder gleich der Länge, wird die Zeichenfolge auf die Länge gekürzt.
ltrim Entfernt vorangestellte Zeichen aus einer Zeichenfolge. Wenn der zweite Parameter nicht angegeben ist, werden Leerzeichen gekürzt. Andernfalls werden alle im zweiten Parameter angegebenen Zeichen gekürzt.
md5 Berechnet den MD5-Digest einer Reihe von Spalten unterschiedlicher primitiver Datentypen und gibt eine 32-stellige Hexadexzeichenfolge zurück. Sie können ihn verwenden, um einen Fingerabdruck für eine Zeile zu berechnen.
minus Subtrahiert Zahlen. Subtrahiert die Anzahl von Tagen von einem Datum. Subtrahiert die Dauer von einem Zeitstempel. Subtrahiert zwei Zeitstempel, um die Differenz in Millisekunden zu erhalten. Entspricht dem Operator -.
mod Gibt den Modulus eines Zahlenpaars an. Entspricht dem Operator %.
multiply Multipliziert ein Zahlenpaar. Entspricht dem Operator *.
negate Negiert eine Zahl. Wandelt positive Zahlen in negative um (und umgekehrt).
nextSequence Gibt die nächste eindeutige Folge zurück. Die Zahl ist nur innerhalb einer Partition aufeinanderfolgend und wird mit der Partitions-ID vorangestellt.
normalize Normalisiert den Zeichenfolgenwert so, dass akzentierte Unicode-Zeichen getrennt werden.
not Verwendet den logischen Negationsoperator.
notEquals Verwendet den Operator für Vergleich auf Ungleichheit. Entspricht dem Operator !=.
null Gibt einen NULL Wert zurück. Verwenden Sie die Funktion syntax(null()) , wenn eine Spalte mit dem Namen vorhanden nullist. Jeder Vorgang, der ihn verwendet, führt zu einer NULL.
or Verwendet den logischen OR Operator. Identisch mit ||.
pMod Gibt den positiven Modulus eines Zahlenpaars an.
partitionId Gibt die aktuelle Partitions-ID zurück, in der sich die Eingabezeile befindet.
power Potenziert eine Zahl um den Potenzwert einer anderen.
radians Konvertiert Grade in Bogenmaße.
random Gibt eine Zufallszahl mit einem optionalen Seed innerhalb einer Partition zurück. Der Seed sollte ein fester Wert sein und wird zusammen mit der Partitions-ID zum Erzeugen von Zufallswerten verwendet.
regexExtract Extrahiert eine übereinstimmende Teilzeichenfolge für ein bestimmtes regex-Muster. Der letzte Parameter identifiziert die Übereinstimmungsgruppe und ist standardmäßig „1“, wenn er nicht angegeben ist. Verwenden Sie `<regex>`, um eine Zeichenfolge ohne Escapezeichen abzugleichen.
regexMatch Überprüft, ob die Zeichenfolge dem spezifischen regex-Muster entspricht. Verwenden Sie `<regex>`, um eine Zeichenfolge ohne Escapezeichen abzugleichen.
regexReplace Ersetzt alle Vorkommen eines Regex-Musters durch eine andere Teilzeichenfolge in einem bestimmten String. Verwenden Sie `<regex>`, um eine Zeichenfolge ohne Escapezeichen abzugleichen.
regexSplit Unterteilt eine Zeichenfolge anhand eines Trennzeichens basierend auf einem regulären Ausdruck und gibt ein Array mit Zeichenfolgen zurück.
replace Ersetzt alle Vorkommen einer Teilzeichenfolge durch eine andere Teilzeichenfolge in der spezifischen Zeichenfolge. Wenn der letzte Parameter nicht angegeben wird, wird standardmäßig eine leere Zeichenfolge verwendet.
reverse Kehrt eine Zeichenfolge um.
right Extrahiert eine Teilzeichenfolge mit der Anzahl der Zeichen von rechts. Identisch mit SUBSTRING(str, LENGTH(str) - n, n).
rlike Überprüft, ob die Zeichenfolge dem spezifischen regex-Muster entspricht.
round Rundet eine Zahl, wenn eine optionale Skalierung und ein optionaler Rundungsmodus angegeben wird. Wenn die Skalierung nicht angegeben wird, wird standardmäßig "0" verwendet. Wenn der Modus nicht angegeben wird, ist er standardmäßig ROUND_HALF_UP(5).
rpad Füllt die Zeichenfolge nach rechts mit der angegebenen Auffüllung bis zu einer bestimmten Länge auf. Ist die Zeichenfolge größer oder gleich der Länge, wird die Zeichenfolge auf die Länge gekürzt.
rtrim Entfernt nachgestellte Zeichen aus einer Zeichenfolge. Wenn der zweite Parameter nicht angegeben ist, werden Leerzeichen gekürzt. Andernfalls werden alle im zweiten Parameter angegebenen Zeichen gekürzt.
sha1 Berechnet den SHA-1-Digest einer Reihe von Spalten unterschiedlicher primitiver Datentypen und gibt eine 40-stellige Hexadexzeichenfolge zurück. Sie können ihn verwenden, um einen Fingerabdruck für eine Zeile zu berechnen.
sha2 Berechnet den SHA-2-Digest einer Reihe von Spalten unterschiedlicher primitiver Datentypen, wenn eine Bitlänge angegeben wird, die nur Werte von 0 (256), 224, 256, 384 und 512 annehmen kann. Sie können ihn verwenden, um einen Fingerabdruck für eine Zeile zu berechnen.
sin Berechnet einen Sinuswert.
sinh Berechnet einen hyperbolischen Sinuswert.
soundex Ruft den Code soundex für die Zeichenfolge ab.
split Unterteilt eine Zeichenfolge basierend auf einem Trennzeichen und gibt ein Array mit Zeichenfolgen zurück.
sqrt Berechnet die Quadratwurzel einer Zahl.
startsWith Überprüft, ob die Zeichenfolge mit der angegebenen Zeichenfolge beginnt.
substring Extrahiert eine Teilzeichenfolge mit einer bestimmten Länge ab einer Position. Die Position basiert auf 1. Wenn die Länge nicht angegeben wird, wird standardmäßig das Ende der Zeichenfolge verwendet.
substringIndex Extrahiert die Teilzeichenfolge vor den count-Vorkommen des Trennzeichens. Wenn count positiv ist, wird alles links vom letzten Trennzeichen (von links gezählt) zurückgegeben. Wenn count negativ ist, wird alles rechts vom letzten Trennzeichen (von rechts gezählt) zurückgegeben.
tan Berechnet einen Tangenswert.
tanh Berechnet einen hyperbolischen Tangenswert.
translate Ersetzt einen Satz von Zeichen durch einen anderen Satz von Zeichen in der Zeichenkette. Zeichen werden eins zu eins ersetzt.
trim Entfernt vorangestellte und nachgestellte Zeichen aus einer Zeichenfolge. Wenn der zweite Parameter nicht angegeben ist, werden Leerzeichen gekürzt. Andernfalls werden alle im zweiten Parameter angegebenen Zeichen gekürzt.
true Gibt immer den Wert TRUE zurück. Verwenden Sie die Funktion syntax(true()) , wenn eine Spalte benannt trueist.
typeMatch Stimmt mit dem Typ der Spalte überein. Wird nur in Musterausdrücken verwendet. Die Zahl entspricht „short“, „integer“, „long“, „double“, „float“ oder „decimal“. Integral entspricht den Datentypen short, int und long. Bruchzahlen entsprechen „double“, „float“ und „decimal“. Datetime entspricht dem Datums- oder Zeitstempeltyp.
unescape Entfernt die Escapezeichen einer Zeichenfolge entsprechend einem Format. Literalwerte für zulässiges Format sind json, , xml, ecmascript, htmlund java.
upper Wandelt eine Zeichenfolge in Großschreibung um.
uuid Gibt die generierte UUID zurück.
xor Gibt den logischen XOR Operator an. Entspricht dem Operator ^.