Sdílet prostřednictvím


Funkce výrazů v mapování toků dat

PLATÍ PRO: Azure Data Factory Azure Synapse Analytics

Tip

Vyzkoušejte si službu Data Factory v Microsoft Fabric, řešení pro analýzy typu all-in-one pro podniky. Microsoft Fabric zahrnuje všechno od přesunu dat až po datové vědy, analýzy v reálném čase, business intelligence a vytváření sestav. Přečtěte si, jak začít používat novou zkušební verzi zdarma.

Toky dat jsou k dispozici v kanálech Azure Data Factory i v kanálech Azure Synapse Analytics. Tento článek se týká mapování toků dat. Pokud s transformacemi začínáte, přečtěte si úvodní článek Transformace dat pomocí mapování toků dat.

Tento článek obsahuje podrobnosti o funkcích výrazů podporovaných službou Azure Data Factory a Azure Synapse Analytics při mapování toků dat.

Seznam funkcí výrazů

V kanálech Azure Data Factory a Azure Synapse Analytics můžete ke konfiguraci transformací dat použít jazyk výrazů funkce mapování toku dat.

Funkce výrazu Úloha
Abs Vrátí absolutní hodnotu čísla.
acos Vypočítá kosinus inverzní hodnotu.
add Sečte dvojici řetězců nebo čísel. Přidá datum k určitému počtu dnů. Přidá dobu trvání do časového razítka. Připojí jedno pole podobného typu k druhému. Stejné jako operátor + .
and Používá logický AND operátor. Stejné jako &&.
asin Vypočítá inverzní sinusovou hodnotu.
assertErrorMessages Vrátí mapu všech zpráv assert.
atan Vypočítá inverzní tangens hodnotu.
atan2 Vrátí úhel v radiánech mezi kladnou osou x roviny a bodem daným souřadnicemi.
mezi Zkontroluje, jestli je první hodnota mezi dvěma dalšími hodnotami včetně. Můžete porovnat číselné hodnoty, řetězce a datetime hodnoty.
bitwiseAnd Používá bitový And operátor napříč celočíselnými typy. Stejné jako operátor & .
bitwiseOr Používá bitový Or operátor napříč celočíselnými typy. Stejné jako operátor | .
bitwiseXor Používá bitový Or operátor napříč celočíselnými typy. Stejné jako operátor | .
blake2b Vypočítá hodnotu hash Blake2 množiny sloupců různých primitivních datových typů, když je zadána bitová délka. Délka bitu může být pouze násobky 8 mezi 8 a 512. Můžete ho použít k výpočtu otisku prstu pro řádek.
blake2bBinary Vypočítá shrnutí Blake2 pro množinu sloupců obsahující různé primitivní datové typy při zadání bitové délky, která musí být násobkem 8 od 8 do 512. Můžete ho použít k výpočtu otisku prstu pro řádek.
case Použije jednu hodnotu nebo druhou na základě střídavých podmínek. Pokud je počet vstupů sudý, druhý se ve výchozím nastavení nastaví na NULL pro poslední podmínku.
cbrt Vypočítá kořen datové krychle čísla.
zakrýt stropem Vrátí nejmenší celé číslo, které není menší než číslo.
splynout Vrátí první hodnotu null ze sady vstupů. Všechny vstupy by měly být stejného typu.
columnNames Získá názvy všech výstupních sloupců pro datový proud. Jako první argument můžete předat volitelný název datového proudu a přidat volitelný druhý argument, aby se vrátily pouze sloupce posunu schématu.
sloupce Získá hodnoty všech výstupních sloupců pro datový proud. Jako druhý argument můžete předat volitelný název datového proudu.
porovnat Porovná dvě hodnoty stejného typu. Vrátí záporné celé číslo, pokud hodnota1 < hodnota2 nebo 0, pokud hodnota1 == hodnota2, a vrátí kladnou hodnotu, pokud hodnota1 > hodnota2.
concat Zřetězí proměnný počet řetězců dohromady. Stejné jako operátor + s řetězci.
concatWS Zřetězí proměnný počet řetězců společně s oddělovačem. Prvním parametrem je oddělovač.
cos Vypočítá kosinusovou hodnotu.
obušek Vypočítá hyperbolický kosinus hodnoty.
crc32 Vypočítá hodnotu hash CRC32 pro sadu sloupců různých základních datových typů při zadané bitové délce. Bitová délka musí být hodnot 0 (256), 224, 256, 384a 512. Můžete ho použít k výpočtu otisku prstu pro řádek.
stupně Převede radiány na stupně.
rozdělit Dělí dvojici čísel. Stejné jako operátor / .
dropLeft Odebere zleva od řetězce tolik znaků, kolik je zadáno. Pokud požadovaný pokles překročí délku řetězce, vrátí se prázdný řetězec.
dropRight Odebere zprava od řetězce tolik znaků, kolik je zadáno. Pokud požadovaný pokles překročí délku řetězce, vrátí se prázdný řetězec.
endsWith Zkontroluje, jestli řetězec končí zadaným řetězcem.
equals Používá operátor porovnání rovnosti. Stejné jako operátor == .
equalsIgnoreCase Používá operátor rovnosti a ignoruje rozdíly v malých a velkých písmenech. Stejné jako operátor <=> .
escape Unikne řetězci podle formátu. Hodnoty literálů pro přijatelný formát jsou json, xml, ecmascript, html, a java.
výraz Výsledkem je výraz z řetězce. Ekvivalent k zápisu výrazu v neliterální podobě. Můžete ho použít k předání parametrů jako řetězcových reprezentací.
faktoriál Vypočítá faktoriál čísla.
false Vždy vrátí hodnotu false. syntax(false()) Funkci použijte, pokud existuje sloupec s názvem false.
podlaha Vrátí největší celé číslo, které není větší než číslo.
fromBase64 Dekóduje konkrétní řetězec kódovaný v base64.
greater Používá porovnání větší než operátor. Stejné jako operátor > .
greaterOrEqual Používá porovnání větší než nebo rovno operátoru. Stejné jako operátor >= .
největší Vrátí nejvyšší hodnotu ze seznamu hodnot, protože vstupní hodnoty null přeskočí. Vrátí hodnotu null, pokud jsou všechny vstupy null.
hasColumn Kontroluje hodnotu sloupce podle názvu v datovém proudu. Jako druhý argument můžete předat volitelný název datového proudu. Názvy sloupců známé v době návrhu by měly být adresovány pouze pomocí jejich názvu. Vypočítané vstupy se nepodporují, ale můžete použít nahrazení parametrů.
hasError Zkontroluje, jestli je kontrolní výraz se zadaným ID označený jako chyba.
iif Použije jednu nebo druhou hodnotu na základě podmínky. Pokud druhý není zadán, hodnota je považována za NULL. Obě hodnoty musí být kompatibilní (například číselné nebo řetězcové).
iifNull Vrátí první položku, která nemá hodnotu null, pokud zadáte dva nebo více vstupů. Tato funkce je ekvivalentní coalesce.
initCap Převede první písmeno každého slova na velká písmena. Slova jsou označena jako oddělená prázdným znakem.
instr Najde pozici (1-indexovanou) podřetězce v řetězci. Pokud se nenajde, vrátí se 0.
isDelete Zkontroluje, jestli je řádek označený k odstranění. U transformací, které přebírají více než jeden vstupní datový proud, můžete předat index datového proudu (1). Index datového proudu by měl být buď 1 nebo 2a výchozí hodnota je 1.
isError Zkontroluje, jestli je řádek označený jako chyba. U transformací, které přebírají více než jeden vstupní datový proud, můžete předat index datového proudu (1). Index datového proudu by měl být buď 1 nebo 2. Výchozí hodnota je 1.
isIgnore Zkontroluje, jestli se má řádek ignorovat. U transformací, které přebírají více než jeden vstupní datový proud, můžete předat index datového proudu (1). Index datového proudu by měl být buď 1 nebo 2. Výchozí hodnota je 1.
isInsert Zkontroluje, jestli je řádek označený pro vložení. U transformací, které přebírají více než jeden vstupní datový proud, můžete předat index datového proudu (1). Index datového proudu by měl být buď 1 nebo 2. Výchozí hodnota je 1.
isMatch Zkontroluje, jestli se řádek shoduje s vyhledáváním. U transformací, které přebírají více než jeden vstupní datový proud, můžete předat index datového proudu (1). Index datového proudu by měl být buď 1 nebo 2. Výchozí hodnota je 1.
isNull Zkontroluje, jestli je hodnota NULL.
isUpdate Zkontroluje, jestli je řádek označený k aktualizaci. U transformací, které přebírají více než jeden vstupní datový proud, můžete předat index datového proudu (1). Index datového proudu by měl být buď 1 nebo 2. Výchozí hodnota je 1.
isUpsert Zkontroluje, jestli je řádek označený pro vložení. U transformací, které přebírají více než jeden vstupní datový proud, můžete předat index datového proudu (1). Index datového proudu by měl být buď 1 nebo 2. Výchozí hodnota je 1.
jaroWinkler Získá JaroWinkler vzdálenost mezi dvěma řetězci.
nejméně Používá porovnání menší než nebo rovno operátoru. Stejné jako operátor <= .
Vlevo Extrahuje podřetězdí začínající indexem 1 s počtem znaků. Stejné jako SUBSTRING(str, 1, n).
length Vrátí délku řetězce.
menší Používá porovnávací operátor menší. Stejné jako operátor < .
lesserOrEqual Používá porovnání menší než nebo rovno operátoru. Stejné jako operátor <= .
levenshtein Získá levenshtein vzdálenost mezi dvěma řetězci.
jako Používá vzor s řetězcem, který je shodný doslova. Výjimkou je speciální symbol _ , který odpovídá jakémukoli znaku ve vstupu (podobně jako .* v posix regulárních výrazech).
nalézt Vyhledá pozici (založenou na 1) podřetězce v řetězci, který začíná na určité pozici. Pokud je pozice vynechána, začněte od začátku řetězce. Pokud se nenajde, vrátí se 0.
kláda Vypočítá logaritmickou hodnotu. Pokud použijete, můžete zadat volitelný základ nebo jiné číslo Euleru.
log10 Vypočítá logaritmickou hodnotu o základu 10.
dolní Malá písmena řetězce.
lpad Vyplní řetězec zleva zadaným odsazením, dokud nedosáhne určité délky. Pokud je řetězec roven nebo větší než zadaná délka, řetězec se ořízne na tuto délku.
ltrim Levý oříznou řetězec počátečních znaků. Pokud druhý parametr není zadaný, oříznou se prázdné znaky. Jinak ořízne všechny znaky určené v druhém parametru.
md5 Vypočítá hodnotu hash MD5 sady sloupců různých primitivních datových typů a vrátí šestnáctkový řetězec se 32 znaky. Můžete ho použít k výpočtu otisku prstu pro řádek.
minus Odečte čísla. Odečte počet dní od data. Odečte dobu trvání od časového razítka. Odečte dvě časová razítka, abyste získali rozdíl v milisekundách. Stejné jako operátor - .
zkratka modulo Vrátí modul dvojice čísel. Stejné jako operátor % .
násobit Vynásobí dvojici čísel. Stejné jako operátor * .
negovat Neguje číslo. Změní kladná čísla na záporná a naopak.
nextSequence Vrátí další jedinečnou sekvenci. Číslo je souvislé pouze v rámci oddílu a je opatřeno předponou s ID oddílu.
normalizovat Normalizuje hodnotu řetězce na samostatné zvýrazňované znaky Unicode.
not Používá logický operátor negace.
notEquals Používá relační operátor nerovná se. Stejné jako operátor != .
null Vrátí hodnotu NULL. syntax(null()) Funkci použijte, pokud existuje sloupec s názvem null. Jakákoli operace, která ji používá, má za NULLnásledek .
nebo Používá logický OR operátor. Stejné jako ||.
pMod Poskytuje kladné moduly dvojice čísel.
partitionId Vrátí aktuální ID oddílu, ve které je vstupní řádek.
moc Zvýší jedno číslo na mocninu druhého.
Radiánech Převede stupně na radiány.
náhodný Vrátí náhodné číslo, když je v rámci oddílu zadána volitelná počáteční hodnota. Počáteční hodnota by měla být pevná a používá se spolu s ID oddílu k generování náhodných hodnot.
regexExtract Extrahuje odpovídající podřetězec pro určitý vzor regulárního výrazu. Poslední parametr identifikuje skupinu shody a pokud je vynechán, výchozí hodnota je 1. Slouží `<regex>` k porovnávání řetězce bez odvozování.
regexMatch Zkontroluje, zda daný řetězec odpovídá specifickému vzoru regulárního výrazu. Slouží `<regex>` k porovnávání řetězce bez odvozování.
regexReplace Nahradí všechny výskyty vzoru regulárního výrazu jiným podřetězcem v konkrétním řetězci. Slouží `<regex>` k porovnávání řetězce bez odvozování.
regexSplit Rozdělí řetězec na základě oddělovače na základě regulárního výrazu a vrátí pole řetězců.
replace Nahradí všechny výskyty podřetězce jiným podřetězcem v konkrétním řetězci. Pokud je poslední parametr vynechán, výchozí hodnota je prázdný řetězec.
reverse Vrátí řetězec.
Vpravo Extrahuje podřetězec s daným počtem znaků od konce. Stejné jako SUBSTRING(str, LENGTH(str) - n, n).
rlike Zkontroluje, jestli řetězec odpovídá konkrétnímu patternu regularního výrazu (regex).
kulatý Zaokrouhlí číslo, pokud zadáte volitelné měřítko a volitelný režim zaokrouhlování. Pokud je měřítko vynecháno, výchozí hodnota je 0. Pokud je režim vynechán, výchozí hodnota je ROUND_HALF_UP(5).
rpad Vyplní řetězec zpravé strany zadaným znakem pro vyplnění, dokud nedosáhne určité délky. Pokud je řetězec roven nebo větší než zadaná délka, řetězec se ořízne na tuto délku.
rtrim Vpravo oříznou řetězec koncových znaků. Pokud druhý parametr není zadaný, oříznou se prázdné znaky. Jinak ořízne všechny znaky určené v druhém parametru.
sha1 Vypočítá SHA-1 hash pro sadu sloupců s různými primitivními datovými typy a vrátí šestnáctkový řetězec o 40 znacích. Můžete ho použít k výpočtu otisku prstu pro řádek.
sha2 Vypočítá SHA-2 digest sady sloupců různých typů primitivních dat, pokud je zadána bitová délka, která může být pouze z hodnot 0 (256), 224, 256, 384 a 512. Můžete ho použít k výpočtu otisku prstu pro řádek.
hřích Vypočítá sinusovou hodnotu.
Sinh Vypočítá hyperbolickou sinusovou hodnotu.
soundex soundex Získá kód pro řetězec.
split Rozdělí řetězec na základě oddělovače a vrátí pole řetězců.
Sqrt Vypočítá druhou odmocninu čísla.
startsWith Zkontroluje, jestli řetězec začíná zadaným řetězcem.
podřetězec Extrahuje podřetězení určité délky z pozice. Pozice je založená na 1. Pokud je délka vynechána, nastaví se na konec řetězce.
substringIndex Extrahuje podřetězen count před výskyty oddělovače. Pokud count je kladné, vrátí se vše nalevo od konečného oddělovače (počítá se zleva). Pokud count je záporné, vrátí se vše napravo od konečného oddělovače (počítá se zprava).
opálení Vypočítá tangens hodnotu.
tanh Vypočítá hyperbolickou tangensovou hodnotu.
překládat Nahradí jednu sadu znaků jinou sadou znaků v řetězci. Znaky mají nahrazení 1:1.
zastřihnout Oříznou řetězec počátečních a koncových znaků. Pokud druhý parametr není zadaný, oříznou se prázdné znaky. Jinak ořízne všechny znaky určené v druhém parametru.
true Vždy vrátí hodnotu true. syntax(true()) Funkci použijte, pokud je sloupec pojmenován true.
typeMatch Odpovídá typu sloupce. Používá se pouze ve vzorových výrazech. Číslo odpovídá typu short, integer, long, double, float nebo decimal. Integrál odpovídá krátkým, celočíselným a dlouhým. Desetinné hodnoty odpovídají typu double, float a desetinnému číslu. Datetime odpovídá typu datového nebo časového razítka.
unescape Unescapes řetězec podle formátu. Hodnoty literálů pro přijatelný formát jsou json, xml, ecmascript, html, a java.
horní Velká písmena řetězce.
uuid Vrátí vygenerované UUID.
xor Předává logický XOR operátor. Stejné jako operátor ^ .