매핑 데이터 흐름의 식 함수

적용 대상: Azure Data Factory Azure Synapse Analytics

기업용 올인원 분석 솔루션인 Microsoft Fabric의 Data Factory를 사용해 보세요. Microsoft Fabric은 데이터 이동부터 데이터 과학, 실시간 분석, 비즈니스 인텔리전스 및 보고에 이르기까지 모든 것을 다룹니다. 무료로 새 평가판을 시작하는 방법을 알아봅니다!

데이터 흐름은 Azure Data Factory 및 Azure Synapse Pipelines 모두에서 사용할 수 있습니다. 이 문서는 매핑 데이터 흐름에 적용됩니다. 변환을 처음 사용하는 경우 매핑 데이터 흐름을 사용하여 데이터 변환 소개 문서를 참조하세요.

다음 문서에서는 매핑 데이터 흐름에서 Azure Data Factory 및 Azure Synapse Analytics에서 지원하는 식 함수에 대한 세부 정보를 제공합니다.

식 함수 목록

Data Factory 및 Synapse 파이프라인에서 매핑 데이터 흐름 기능의 식 언어를 사용하여 데이터 변환을 구성합니다.

식 함수 작업
abs 숫자의 절대값입니다.
acos 역코사인 값을 계산합니다.
add 문자열 또는 숫자의 쌍을 추가합니다. 날짜에 일 수를 추가합니다. 타임스탬프에 기간을 추가합니다. 유사한 형식의 한 배열을 다른 배열에 추가합니다. + 연산자와 같습니다.
and 논리적 AND 연산자입니다. &&과 같습니다.
asin 역사인 값을 계산합니다.
assertErrorMessages 모든 어설션 메시지의 맵을 반환합니다.
atan 역탄젠트 값을 계산합니다.
atan2 평면의 양의 x축과 좌표로 지정된 점 사이의 라디안 각도를 반환합니다.
between 첫 번째 값이 다른 두 값 사이에 있는지 확인합니다. 숫자, 문자열 및 날짜/시간 값과 비교할 수 있습니다.
bitwiseAnd 정수 형식의 비트 And 연산자. & 연산자와 같습니다.
bitwiseOr 정수 형식의 비트 Or 연산자. | 연산자와 같습니다.
bitwiseXor 정수 형식의 비트 Or 연산자. | 연산자와 같습니다.
blake2b 비트 길이가 지정된 다양한 기본 데이터 형식 열 세트의 Blake2 다이제스트를 계산합니다. 비트 길이는 8에서 512 사이의 8의 배수일 수 있습니다. 행의 지문을 계산하는 데 사용할 수 있습니다.
blake2bBinary 8과 512 사이에서 8의 배수만 될 수 있는 비트 길이가 주어진 다양한 기본 데이터 형식 열 세트의 Blake2 다이제스트를 계산합니다. 행의 지문을 계산하는 데 사용할 수 있습니다.
case 교대로 나오는 조건에 따라 하나의 값 또는 다른 값이 적용됩니다. 입력 수가 짝수이면 마지막 조건에서 다른 값은 Null로 기본 설정됩니다.
cbrt 숫자의 세제곱근을 계산합니다.
ceil 해당 수보다 작지 않은 가장 작은 정수를 반환합니다.
coalesce 입력에서 Null이 아닌 첫 번째 값을 반환합니다. 모든 입력은 동일한 형식이어야 합니다.
columnNames 스트림의 모든 출력 열 이름을 가져옵니다. 선택적 스트림 이름을 첫 번째 인수로 전달하고 선택적 두 번째 인수를 전달하여 스키마 드리프트 열만 반환할 수 있습니다.
columns 스트림의 모든 출력 열 값을 가져옵니다. 선택적 스트림 이름을 두 번째 인수로 전달할 수 있습니다.
compare 동일한 형식의 두 값을 비교합니다. value1 < value2이면 음의 정수, value1과 value2가 같으면 0, value1 > value2이면 양수를 반환합니다.
concat 가변 개수의 문자열을 함께 연결합니다. 문자열이 있는 + 연산자와 같습니다.
concatWS 가변 개수의 문자열을 구분 기호와 함께 연결합니다. 첫 번째 매개 변수는 구분 기호입니다.
cos 코사인 값을 계산합니다.
cosh 값의 쌍곡선 코사인을 계산합니다.
crc32 지정된 비트 길이를 갖는 다양한 기본 데이터 형식의 열 세트에서 CRC32 해시를 계산합니다. 비트 길이는 0(256), 224, 256, 384 또는 512 값이어야 합니다. 행의 지문을 계산하는 데 사용할 수 있습니다.
degrees 라디안을 도로 변환합니다.
divide 숫자 쌍을 나눕니다. / 연산자와 같습니다.
dropLeft 문자열 왼쪽에서 문자를 최대한 제거합니다. 요청된 삭제가 문자열의 길이를 초과하면 빈 문자열이 반환됩니다.
dropRight 문자열의 오른쪽에서 문자를 최대한 제거합니다. 요청된 삭제가 문자열의 길이를 초과하면 빈 문자열이 반환됩니다.
endsWith 문자열이 제공된 문자열로 끝나는지 확인합니다.
equals 비교 같음 연산자. == 연산자와 같습니다.
equalsIgnoreCase 비교는 대/소문자를 무시하는 연산자와 같습니다. <=> 연산자와 같습니다.
escape 형식에 따라 문자열을 이스케이프합니다. 허용되는 형식의 리터럴 값은 'json', 'xml', 'ecmascript', 'html', 'java'입니다.
expr 문자열에서 식이 생성됩니다. 리터럴이 아닌 형식으로 식을 작성하는 것과 같으며 매개 변수를 문자열 표현으로 전달하는 데 사용할 수 있습니다.
factorial 숫자의 계승값을 계산합니다.
false 항상 false 값을 반환합니다. 'false'라는 열이 있는 경우 함수 syntax(false())를 사용합니다.
floor 해당 수보다 크지 않은 가장 큰 정수를 반환합니다.
fromBase64 지정된 base64로 인코딩된 문자열을 디코딩합니다.
greater 비교 보다 큼 연산자. > 연산자와 같습니다.
greaterOrEqual 비교 보다 크거나 같음 연산자. >= 연산자와 같습니다.
greatest Null 값을 건너뛰는 입력으로 값 목록 중에서 가장 큰 값을 반환합니다. 모든 입력이 Null이면 Null을 반환합니다.
hasColumn 스트림에서 이름을 기준으로 열 값을 확인합니다. 선택적 스트림 이름을 두 번째 인수로 전달할 수 있습니다. 디자인 타임에 알려진 열 이름은 해당 이름으로만 처리되어야 합니다. 계산된 입력은 지원되지 않지만 매개 변수 대체를 사용할 수 있습니다.
hasError 제공된 ID의 assert가 오류로 표시되는지 확인합니다.
iif 조건에 따라 하나의 값 또는 다른 값이 적용됩니다. 다른 값을 지정하지 않으면 NULL로 간주됩니다. 두 값은 호환되어야 합니다(숫자, 문자열 등).
iifNull 두 개 이상의 입력이 지정되면 null이 아닌 첫 번째 항목을 반환합니다. 이 함수는 병합과 동일합니다.
initCap 모든 단어의 첫 글자를 대문자로 변환합니다. 단어는 공백으로 구분하여 식별됩니다.
instr 문자열 내에서 부분 문자열의 위치(1부터 시작)를 찾습니다. 찾을 수 없으면 0이 반환됩니다.
isDelete 행이 삭제용으로 표시되어 있는지 확인합니다. 둘 이상의 입력 스트림을 사용하는 변환은 스트림의 인덱스(1부터 시작)를 제공할 수 있습니다. 스트림 인덱스는 1 또는 2여야 하며 기본값은 1입니다.
isError 행이 오류로 표시되는지 여부를 확인합니다. 둘 이상의 입력 스트림을 사용하는 변환은 스트림의 인덱스(1부터 시작)를 제공할 수 있습니다. 스트림 인덱스는 1 또는 2여야 하며 기본값은 1입니다.
isIgnore 행이 무시되도록 표시되는지 여부를 확인합니다. 둘 이상의 입력 스트림을 사용하는 변환은 스트림의 인덱스(1부터 시작)를 제공할 수 있습니다. 스트림 인덱스는 1 또는 2여야 하며 기본값은 1입니다.
isInsert 행이 삽입용으로 표시되어 있는지 확인합니다. 둘 이상의 입력 스트림을 사용하는 변환은 스트림의 인덱스(1부터 시작)를 제공할 수 있습니다. 스트림 인덱스는 1 또는 2여야 하며 기본값은 1입니다.
isMatch 조회 시 행이 일치하는지 여부를 확인합니다. 둘 이상의 입력 스트림을 사용하는 변환은 스트림의 인덱스(1부터 시작)를 제공할 수 있습니다. 스트림 인덱스는 1 또는 2여야 하며 기본값은 1입니다.
isNull 값이 Null인지 확인합니다.
isUpdate 행이 업데이트용으로 표시되어 있는지 확인합니다. 둘 이상의 입력 스트림을 사용하는 변환은 스트림의 인덱스(1부터 시작)를 제공할 수 있습니다. 스트림 인덱스는 1 또는 2여야 하며 기본값은 1입니다.
isUpsert 행이 삽입용으로 표시되어 있는지 확인합니다. 둘 이상의 입력 스트림을 사용하는 변환은 스트림의 인덱스(1부터 시작)를 제공할 수 있습니다. 스트림 인덱스는 1 또는 2여야 하며 기본값은 1입니다.
jaroWinkler 두 문자열 간의 JaroWinkler 거리를 가져옵니다.
least 비교 보다 작거나 같음 연산자. <= 연산자와 같습니다.
left 인덱스 1에서 시작하여 지정된 문자 수를 갖는 부분 문자열을 추출합니다. SUBSTRING(str, 1, n)과 같습니다.
length 문자열의 길이를 반환합니다.
lesser 비교 보다 작음 연산자. < 연산자와 같습니다.
lesserOrEqual 비교 보다 작거나 같음 연산자. <= 연산자와 같습니다.
levenshtein 두 문자열 간의 levenshtein 거리를 가져옵니다.
like 패턴은 말 그대로 일치하는 문자열을 나타냅니다. 예외는 다음과 같은 특수 기호입니다. _는 입력의 임의의 하나의 문자와 일치합니다(posix 정규식의 .와 유사)
locate 특정 위치에서 시작하는 문자열 내에서 부분 문자열의 위치(1부터 시작)를 찾습니다. 이 위치를 생략하면 문자열의 시작 부분에서 찾습니다. 찾을 수 없으면 0이 반환됩니다.
log 로그 값을 계산합니다. 오일러 수 이외의 선택적인 밑을 제공할 수 있습니다(사용할 경우).
log10 밑이 10인 로그 값을 계산합니다.
lower 문자열을 소문자로 바꿉니다.
lpad 특정 길이가 될 때까지 제공된 패딩으로 문자열의 왼쪽 여백을 채웁니다. 문자열이 길이보다 크거나 같은 경우 길이에 맞게 잘립니다.
ltrim 왼쪽의 선행 문자열을 삭제합니다. 두 번째 매개 변수를 지정하지 않으면 공백을 삭제합니다. 그렇지 않은 경우 두 번째 매개 변수에 지정된 모든 문자를 삭제합니다.
md5 다양한 기본 데이터 형식의 열 세트에서 MD5 다이제스트를 계산하고 32자의 16진수 문자열을 반환합니다. 행의 지문을 계산하는 데 사용할 수 있습니다.
minus 숫자를 뺍니다. 날짜에서 일 수를 뺍니다. 타임스탬프에서 기간을 뺍니다. 두 타임스탬프를 빼서 밀리초 단위로 차이를 구합니다. - 연산자와 같습니다.
mod 숫자 쌍의 모듈러스입니다. % 연산자와 같습니다.
multiply 숫자 쌍을 곱합니다. * 연산자와 같습니다.
negate 숫자를 부정합니다. 양수를 음수로, 음수를 양수로 변환합니다.
nextSequence 고유한 다음 시퀀스를 반환합니다. 이 수는 파티션 내에서만 연속되며 앞에 partitionId가 붙습니다.
normalize 악센트 기호가 있는 유니코드 문자를 구분하기 위해 문자열 값을 정규화합니다.
not 논리 부정 연산자.
notEquals 비교 같지 않음 연산자. != 연산자와 같습니다.
null NULL 값을 반환합니다. 'null'이라는 열이 있는 경우 함수 syntax(null())를 사용합니다. 사용하는 모든 작업은 결과적으로 Null이 됩니다.
or 논리적 OR 연산자입니다. ||과 같습니다.
pMod 숫자 쌍의 양의 모듈러스입니다.
partitionId 입력 행이 있는 현재 파티션 ID를 반환합니다.
power 한 수를 다른 수의 승수로 거듭제곱합니다.
radians 도를 라디안으로 변환
random 파티션 내의 선택적 시드가 지정된 난수를 반환합니다. 시드는 고정 값이어야 하며 partitionId와 함께 사용되어 임의 값을 생성합니다.
regexExtract 지정된 정규식 패턴에 대해 일치하는 부분 문자열을 추출합니다. 마지막 매개 변수는 일치 그룹을 식별하고 생략하면 기본적으로 1이 지정됩니다. 이스케이프 없이 문자열을 일치시키려면 `<regex>`(역 따옴표)를 사용합니다.
regexMatch 문자열이 지정된 정규식 패턴과 일치하는지 확인합니다. 이스케이프 없이 문자열을 일치시키려면 `<regex>`(역 따옴표)를 사용합니다.
regexReplace 한 정규식 패턴이 나오는 모든 경우를 지정된 문자열의 다른 substring으로 바꿉니다. 이스케이프 없이 문자열을 일치시키려면 `<regex>`(역 따옴표)를 사용합니다.
regexSplit 정규식을 기준으로 구분 기호에 따라 문자열을 분할하고 문자열의 배열을 반환합니다.
replace 한 하위 문자열이 나오는 모든 경우를 지정된 문자열의 다른 하위 문자열로 바꿉니다. 마지막 매개 변수를 생략하는 경우 기본값은 빈 문자열입니다.
reverse 문자열을 반대로 바꿉니다.
right 오른쪽부터 지정된 문자 수를 갖는 부분 문자열을 추출합니다. SUBSTRING(str, LENGTH(str) - n, n)과 같습니다.
rlike 문자열이 지정된 정규식 패턴과 일치하는지 확인합니다.
round 지정된 선택적 소수 자릿수와 선택적 반올림 모드를 사용하여 숫자를 반올림합니다. 소수 자릿수를 생략하면 기본 자릿수 0이 사용됩니다. 반올림 모드를 생략하면 기본적으로 ROUND_HALF_UP(5)이 사용됩니다. 반올림 값은 다음과 같습니다.
rpad 특정 길이가 될 때까지 제공된 패딩으로 문자열의 오른쪽 여백을 채웁니다. 문자열이 길이보다 크거나 같은 경우 길이에 맞게 잘립니다.
rtrim 오른쪽의 후행 문자열을 삭제합니다. 두 번째 매개 변수를 지정하지 않으면 공백을 삭제합니다. 그렇지 않은 경우 두 번째 매개 변수에 지정된 모든 문자를 삭제합니다.
sha1 다양한 기본 데이터 형식의 열 세트에서 SHA-1 다이제스트를 계산하고 40자의 16진수 문자열을 반환합니다. 행의 지문을 계산하는 데 사용할 수 있습니다.
sha2 0(256), 224, 256, 384, 512 값의 지정된 비트 길이를 갖는 다양한 기본 데이터 형식의 열 세트에서 SHA-2 다이제스트를 계산합니다. 행의 지문을 계산하는 데 사용할 수 있습니다.
sin 사인 값을 계산합니다.
sinh 쌍곡선 사인 값을 계산합니다.
soundex 문자열의 soundex 코드를 가져옵니다.
split 구분 기호를 기준으로 문자열을 분할하고 문자열의 배열을 반환합니다.
sqrt 숫자의 제곱근을 계산합니다.
startsWith 문자열이 제공된 문자열로 시작하는지 확인합니다.
substring 특정 위치에서 특정 길이의 부분 문자열을 추출합니다. 위치는 1부터 시작합니다. 길이를 생략하면 기본적으로 문자열 끝까지입니다.
substringIndex 구분 기호가 count개 발생하기 전에 하위 문자열을 추출합니다. count가 양수이면 마지막 구분 기호의 왼쪽에 있는 모든 항목(왼쪽부터 계산)이 반환됩니다. count가 음수이면 마지막 구분 기호의 오른쪽에 있는 모든 항목(오른쪽부터 계산)이 반환됩니다.
tan 탄젠트 값을 계산합니다.
tanh 쌍곡선 탄젠트 값을 계산합니다.
translate 하나의 문자 세트를 문자열의 다른 문자 세트로 바꿉니다. 문자는 1:1로 대체됩니다.
trim 선행 및 후행 문자열을 삭제합니다. 두 번째 매개 변수를 지정하지 않으면 공백을 삭제합니다. 그렇지 않은 경우 두 번째 매개 변수에 지정된 모든 문자를 삭제합니다.
true 항상 true 값을 반환합니다. 'true'라는 열이 있는 경우 함수 syntax(true())를 사용합니다.
typeMatch 열의 형식과 일치합니다. 패턴 식에서만 사용할 수 있습니다. number는 short, integer, long, double, float 또는 decimal과 일치하고, integral은 short, integer, long과 일치하고, fractional은 double, float, decimal과 일치하고, datetime은 date 또는 timestamp 형식과 일치합니다.
unescape 형식에 따라 문자열을 이스케이프 해제합니다. 허용되는 형식의 리터럴 값은 'json', 'xml', 'ecmascript', 'html', 'java'입니다.
upper 문자열을 대문자로 바꿉니다.
uuid 생성된 UUID를 반환합니다.
xor 논리 XOR 연산자입니다. ^ 연산자와 같습니다.