적용 대상:
Azure Data Factory
Azure Synapse Analytics
팁
기업용 올인원 분석 솔루션인 Microsoft Fabric의 Data Factory를 사용해 보세요. Microsoft Fabric은 데이터 이동부터 데이터 과학, 실시간 분석, 비즈니스 인텔리전스 및 보고에 이르기까지 모든 것을 다룹니다. 무료로 새 평가판을 시작하는 방법을 알아보세요!
데이터 흐름은 Azure Data Factory 파이프라인과 Azure Synapse Analytics 파이프라인 모두에서 사용할 수 있습니다. 이 문서는 매핑 데이터 흐름에 적용됩니다. 변환을 접하는 경우 매핑 데이터 흐름을 사용하여 데이터 변환 소개 문서를 참조하세요.
이 문서에서는 매핑 데이터 흐름에서 Azure Data Factory 및 Azure Synapse Analytics에서 지원하는 식 함수에 대해 자세히 설명합니다.
식 함수 목록
Azure Data Factory 및 Azure Synapse Analytics 파이프라인에서 매핑 데이터 흐름 기능의 식 언어를 사용하여 데이터 변환을 구성합니다.
| 식 함수 | 작업 |
|---|---|
| abs | 숫자의 절대값을 제공합니다. |
| acos | 역코사인 값을 계산합니다. |
| 추가 | 문자열 또는 숫자의 쌍을 추가합니다. 날짜에 일 수를 추가합니다. 시간 스탬프에 기간을 추가합니다. 유사한 형식의 한 배열을 다른 배열에 추가합니다.
+ 연산자와 같습니다. |
| and | 논리 AND 연산자를 사용합니다.
&&와 동일합니다. |
| asin | 역사인 값을 계산합니다. |
| assertErrorMessages | 모든 어설션 메시지의 맵을 반환합니다. |
| atan | 역탄젠트 값을 계산합니다. |
| atan2 | 평면의 양의 x축과 좌표로 지정된 점 사이의 라디안 각도를 반환합니다. |
| between | 첫 번째 값이 다른 두 값 사이에 있는지 확인합니다. 숫자, 문자열 및 datetime 값을 비교할 수 있습니다. |
| bitwiseAnd | 정수 계열 형식에서 비트 And 연산자를 사용합니다.
& 연산자와 같습니다. |
| bitwiseOr | 정수 계열 형식에서 비트 Or 연산자를 사용합니다.
| 연산자와 같습니다. |
| bitwiseXor | 정수 계열 형식에서 비트 Or 연산자를 사용합니다.
| 연산자와 같습니다. |
| blake2b | 비트 길이가 지정된 경우 다양한 기본 데이터 형식의 열 집합에 대한 Blake2 다이제스트를 계산합니다. 비트 길이는 8에서 512 사이의 8의 배수일 수 있습니다. 이 기능을 사용하여 행의 지문을 계산할 수 있습니다. |
| blake2bBinary | 비트 길이가 지정된 경우 다양한 기본 데이터 형식의 열 집합에 대한 Blake2 다이제스트를 계산합니다. 이는 8에서 512 사이의 배수일 수 있습니다. 이 기능을 사용하여 행의 지문을 계산할 수 있습니다. |
| case | 번갈아 가며 조건에 따라 값 하나 또는 다른 값을 적용합니다. 입력 수가 짝수이면 다른 입력은 마지막 조건에 대해 기본값으로 설정 NULL 됩니다. |
| cbrt | 숫자의 세제곱근을 계산합니다. |
| ceil | 해당 수보다 작지 않은 가장 작은 정수를 반환합니다. |
| coalesce | 입력에서 Null이 아닌 첫 번째 값을 반환합니다. 모든 입력은 동일한 형식이어야 합니다. |
| columnNames | 스트림의 모든 출력 열 이름을 가져옵니다. 선택적 스트림 이름을 첫 번째 인수로 전달하고 선택적 두 번째 인수를 전달하여 스키마 드리프트 열만 반환할 수 있습니다. |
| columns | 스트림의 모든 출력 열 값을 가져옵니다. 선택적 스트림 이름을 두 번째 인수로 전달할 수 있습니다. |
| compare | 동일한 형식의 두 값을 비교합니다. value1 value2이면 음수 정수, value1 < == value2이면 0을 반환하고 value1 > value2이면 양수 값을 반환합니다. |
| concat | 가변 개수의 문자열을 함께 연결합니다. 문자열이 있는 + 연산자와 동일합니다. |
| concatWS | 가변 개수의 문자열을 구분 기호와 함께 연결합니다. 첫 번째 매개 변수는 구분 기호입니다. |
| cos | 코사인 값을 계산합니다. |
| cosh | 값의 쌍곡선 코사인을 계산합니다. |
| crc32 | 비트 길이가 지정된 경우 다양한 기본 데이터 형식의 열 집합의 CRC32 해시를 계산합니다. 비트 길이는 값 0 (256), 224, , 256384및 512.이어야 합니다. 이 기능을 사용하여 행의 지문을 계산할 수 있습니다. |
| degrees | 라디안을 도로 변환합니다. |
| divide | 숫자 쌍을 나눗셈을 합니다.
/ 연산자와 같습니다. |
| dropLeft | 문자열의 왼쪽에서 지정된 만큼의 문자를 제거합니다. 요청된 삭제가 문자열의 길이를 초과하면 빈 문자열이 반환됩니다. |
| dropRight | 문자열의 오른쪽에서 지정된 만큼의 문자를 제거합니다. 요청된 삭제가 문자열의 길이를 초과하면 빈 문자열이 반환됩니다. |
| endsWith | 문자열이 제공된 문자열로 끝나는지 확인합니다. |
| equals | 비교 등가 연산자를 사용합니다.
== 연산자와 같습니다. |
| equalsIgnoreCase | 비교 연산자를 사용하며 대소문자를 구분하지 않습니다.
<=> 연산자와 같습니다. |
| escape | 형식에 따라 문자열을 이스케이프합니다. 허용되는 형식에 대한 리터럴 값은 json, xml, ecmascripthtml및 java. |
| expr | 문자열에서 식이 생성됩니다. 문자 그대로의 표현이 아닌 형태로 식을 작성하는 것과 같습니다. 매개 변수를 문자열 표현으로 전달하는 데 사용할 수 있습니다. |
| factorial | 숫자의 계승값을 계산합니다. |
| false | 항상 false 값을 반환합니다. 라는 syntax(false())열이 있는 경우 함수 false 를 사용합니다. |
| floor | 해당 수보다 크지 않은 가장 큰 정수를 반환합니다. |
| fromBase64 | 특정 base64로 인코딩된 문자열을 디코딩합니다. |
| greater | 보다 큼 비교 연산자를 사용합니다.
> 연산자와 같습니다. |
| greaterOrEqual | 보다 크거나 같음 비교 연산자를 사용합니다.
>= 연산자와 같습니다. |
| greatest | Null 값을 건너뛰는 입력으로 값 목록 중에서 가장 큰 값을 반환합니다. 모든 입력이 Null이면 Null을 반환합니다. |
| hasColumn | 스트림에서 이름을 기준으로 열 값을 확인합니다. 선택적 스트림 이름을 두 번째 인수로 전달할 수 있습니다. 설계 시점에 알려진 열 이름은 해당 이름만으로 참조해야 합니다. 계산된 입력은 지원되지 않지만 매개 변수 대체를 사용할 수 있습니다. |
| hasError | 제공된 ID가 있는 어설션이 오류로 간주되는지 확인합니다. |
| iif | 조건에 따라 값 하나 또는 다른 값을 적용합니다. 다른 값이 지정되지 않은 경우 값이 고려됩니다 NULL. 두 값은 모두 호환되어야 합니다(예: 숫자 또는 문자열). |
| iifNull | 두 개 이상의 입력이 지정된 경우 첫 번째 null이 아닌 항목을 반환합니다. 이 함수는 coalesce과 동일합니다. |
| initCap | 모든 단어의 첫 글자를 대문자로 변환합니다. 단어는 공백으로 구분하여 식별됩니다. |
| instr | 문자열 내에서 부분 문자열의 위치(1부터)를 찾습니다. 찾을 수 없으면 0가 반환됩니다. |
| isDelete | 행이 삭제용으로 표시되어 있는지 확인합니다. 둘 이상의 입력 스트림을 사용하는 변환의 경우 스트림의 (1부터 시작) 인덱스를 전달할 수 있습니다. 스트림 인덱스는 1 또는 2 중 하나여야 하며, 기본값은 1입니다. |
| isError | 행이 오류로 표시되는지 여부를 확인합니다. 둘 이상의 입력 스트림을 사용하는 변환의 경우 스트림의 (1부터 시작) 인덱스를 전달할 수 있습니다. 스트림 인덱스 중 하나 1 또는 2. 기본값은 1입니다. |
| isIgnore | 행을 무시해야 하는지 확인합니다. 둘 이상의 입력 스트림을 사용하는 변환의 경우 스트림의 (1부터 시작) 인덱스를 전달할 수 있습니다. 스트림 인덱스 중 하나 1 또는 2. 기본값은 1입니다. |
| isInsert | 행이 삽입용으로 표시되어 있는지 확인합니다. 둘 이상의 입력 스트림을 사용하는 변환의 경우 스트림의 (1부터 시작) 인덱스를 전달할 수 있습니다. 스트림 인덱스 중 하나 1 또는 2. 기본값은 1입니다. |
| isMatch | 조회 시 행이 일치하는지 여부를 확인합니다. 둘 이상의 입력 스트림을 사용하는 변환의 경우 스트림의 (1부터 시작) 인덱스를 전달할 수 있습니다. 스트림 인덱스 중 하나 1 또는 2. 기본값은 1입니다. |
| isNull | 값이 NULL인지 확인합니다. |
| isUpdate | 행이 업데이트용으로 표시되어 있는지 확인합니다. 둘 이상의 입력 스트림을 사용하는 변환의 경우 스트림의 (1부터 시작) 인덱스를 전달할 수 있습니다. 스트림 인덱스 중 하나 1 또는 2. 기본값은 1입니다. |
| isUpsert | 행이 삽입용으로 표시되어 있는지 확인합니다. 둘 이상의 입력 스트림을 사용하는 변환의 경우 스트림의 (1부터 시작) 인덱스를 전달할 수 있습니다. 스트림 인덱스 중 하나 1 또는 2. 기본값은 1입니다. |
| jaroWinkler | 두 문자열 간의 JaroWinkler 거리를 가져옵니다. |
| least | 연산자보다 작거나 같은 비교를 사용합니다.
<= 연산자와 같습니다. |
| left | 문자 수를 사용하여 인덱 1 스에서 부분 문자열 시작을 추출합니다.
SUBSTRING(str, 1, n)와 동일합니다. |
| length | 문자열의 길이를 반환합니다. |
| lesser | 보다 작음 비교 연산자를 사용합니다.
< 연산자와 같습니다. |
| lesserOrEqual | 연산자보다 작거나 같은 비교를 사용합니다.
<= 연산자와 같습니다. |
| levenshtein | 두 문자열 간의 levenshtein 거리를 가져옵니다. |
| like | 문자 그대로 일치하는 문자열이 있는 패턴을 사용합니다. 예외는 입력의 한 문자(정규식의 .*_와 유사)와 일치하는 특수 기호 posix 입니다. |
| locate | 특정 위치를 시작하는 문자열 내에서 부분 문자열의 위치(1부터 시작)를 찾습니다. 위치를 생략하면 문자열의 시작 부분에서 시작합니다. 찾을 수 없으면 0가 반환됩니다. |
| log | 로그 값을 계산합니다. 사용하는 경우 선택할 수 있는 기준 또는 Euler 수를 제공할 수 있습니다. |
| log10 | 10 기본값을 기준으로 로그 값을 계산합니다. |
| lower | 문자열을 소문자로 바꿉니다. |
| lpad | 특정 길이가 될 때까지 제공된 패딩으로 문자열의 왼쪽 여백을 채웁니다. 문자열이 길이보다 크거나 같으면 문자열이 길이로 잘립니다. |
| ltrim | 왼쪽의 선행 문자열을 삭제합니다. 두 번째 매개 변수가 지정되지 않은 경우 공백을 트리밍합니다. 그렇지 않으면 두 번째 매개 변수에 지정된 문자를 트리밍합니다. |
| md5 | 다양한 기본 데이터 형식의 열 집합의 MD5 다이제스트를 계산하고 32자 16진수 문자열을 반환합니다. 이 기능을 사용하여 행의 지문을 계산할 수 있습니다. |
| minus | 숫자를 뺍니다. 날짜에서 일 수를 뺍니다. 타임스탬프에서 기간을 뺍니다. 두 개의 타임스탬프를 빼서 차이를 밀리초 단위로 가져옵니다.
- 연산자와 같습니다. |
| mod | 숫자 쌍의 모듈러스를 제공합니다.
% 연산자와 같습니다. |
| multiply | 숫자 쌍을 곱합니다.
* 연산자와 같습니다. |
| negate | 숫자를 부정합니다. 양수를 음수로, 음수를 양수로 변환합니다. |
| nextSequence | 고유한 다음 시퀀스를 반환합니다. 이 숫자는 파티션 내에서만 연속되며 파티션 ID에 접두사로 지정됩니다. |
| normalize | 문자열 값을 악센트가 있는 유니코드 문자를 구분하도록 정규화합니다. |
| not | 논리 부정 연산자를 사용합니다. |
| notEquals | 같지 않음 비교 연산자를 사용합니다.
!= 연산자와 같습니다. |
| null |
NULL 값을 반환합니다. 라는 syntax(null())열이 있는 경우 함수 null 를 사용합니다. 그것을 사용하는 모든 작업은 NULL.을 생성합니다. |
| or | 논리 OR 연산자를 사용합니다.
||와 동일합니다. |
| pMod | 숫자 쌍의 양의 모듈러스를 제공합니다. |
| partitionId | 입력 행이 있는 현재 파티션 ID를 반환합니다. |
| power | 한 수를 다른 수의 승수로 거듭제곱합니다. |
| radians | 도를 라디안으로 변환합니다. |
| random | 파티션 내에서 선택적 시드가 지정되면 난수를 반환합니다. 초기값은 고정 값이어야 하며 파티션 ID와 함께 임의의 값을 생성하는 데 사용됩니다. |
| regexExtract | 특정 정규식 패턴에 대해 일치하는 부분 문자열을 추출합니다. 마지막 매개 변수는 일치 그룹을 식별하고 생략하면 기본적으로 1로 설정됩니다.
`<regex>`을(를) 사용하면 이스케이프 없이 문자열을 일치시킬 수 있습니다. |
| regexMatch | 문자열이 특정 정규식 패턴과 일치하는지 확인합니다.
`<regex>`을(를) 사용하면 이스케이프 없이 문자열을 일치시킬 수 있습니다. |
| regexReplace | regex 패턴의 모든 항목을 특정 문자열의 다른 부분 문자열로 바꿉니다.
`<regex>`을(를) 사용하면 이스케이프 없이 문자열을 일치시킬 수 있습니다. |
| regexSplit | 정규식을 기준으로 구분 기호에 따라 문자열을 분할하고 문자열의 배열을 반환합니다. |
| replace | 부분 문자열의 모든 항목을 특정 문자열의 다른 부분 문자열로 바꿉니다. 마지막 매개 변수를 생략하면 기본적으로 빈 문자열로 설정됩니다. |
| reverse | 문자열을 반대로 바꿉니다. |
| right | 오른쪽부터 지정된 문자 수를 갖는 substring을 추출합니다.
SUBSTRING(str, LENGTH(str) - n, n)와 동일합니다. |
| rlike | 문자열이 특정 정규식 패턴과 일치하는지 확인합니다. |
| round | 선택적 배율 및 선택적 반올림 모드가 지정된 경우 숫자를 반올림합니다. 배율을 생략하면 기본값은 0입니다. 모드를 생략하면 기본값은 ROUND_HALF_UP(5)입니다. |
| rpad | 특정 길이가 될 때까지 제공된 패딩으로 문자열의 오른쪽 여백을 채웁니다. 문자열이 길이보다 크거나 같으면 문자열이 길이로 잘립니다. |
| rtrim | 오른쪽의 후행 문자열을 삭제합니다. 두 번째 매개 변수가 지정되지 않은 경우 공백을 트리밍합니다. 그렇지 않으면 두 번째 매개 변수에 지정된 문자를 트리밍합니다. |
| sha1 | 다양한 기본 데이터 형식의 열 집합에 대한 SHA-1 다이제스트를 계산하고 40자 16진수 문자열을 반환합니다. 이 기능을 사용하여 행의 지문을 계산할 수 있습니다. |
| sha2 | 값 0 (256), 224256384, 및 512으로만 사용할 수 있는 비트 길이가 지정된 경우 다양한 기본 데이터 형식의 열 집합에 대한 SHA-2 다이제스트를 계산합니다. 이 기능을 사용하여 행의 지문을 계산할 수 있습니다. |
| sin | 사인 값을 계산합니다. |
| sinh | 쌍곡선 사인 값을 계산합니다. |
| soundex | 문자열의 soundex 코드를 가져옵니다. |
| split | 구분 기호를 기준으로 문자열을 분할하고 문자열의 배열을 반환합니다. |
| sqrt | 숫자의 제곱근을 계산합니다. |
| startsWith | 문자열이 제공된 문자열로 시작하는지 확인합니다. |
| substring | 특정 위치에서 특정 길이의 부분 문자열을 추출합니다. 위치는 1부터 시작합니다. 길이를 생략하면 기본적으로 문자열의 끝으로 설정됩니다. |
| substringIndex | 구분 기호가 count개 발생하기 전에 하위 문자열을 추출합니다.
count가 양수이면 최종 구분 기호(왼쪽부터 계산)의 왼쪽에 있는 모든 내용이 반환됩니다.
count가 음수이면 최종 구분 기호(오른쪽부터 계산)의 오른쪽에 있는 모든 내용이 반환됩니다. |
| tan | 탄젠트 값을 계산합니다. |
| tanh | 쌍곡선 탄젠트 값을 계산합니다. |
| translate | 한 문자 집합을 문자열의 다른 문자 집합으로 바꿉니다. 문자는 일대일로 대체됩니다. |
| trim | 선행 및 후행 문자열을 삭제합니다. 두 번째 매개 변수가 지정되지 않은 경우 공백을 트리밍합니다. 그렇지 않으면 두 번째 매개 변수에 지정된 문자를 트리밍합니다. |
| true | 항상 true 값을 반환합니다. 열의 이름을 syntax(true())지정하는 경우 함수 true 를 사용합니다. |
| typeMatch | 열의 형식과 일치합니다. 패턴 식에만 사용됩니다. Number는 short, integer, long, double, float 또는 decimal과 일치합니다. Integral은 short, int 및 long과 일치합니다. 소수형은 double, float 및 decimal과 일치합니다. Datetime은 날짜 또는 타임스탬프를 입력한 형식과 일치합니다. |
| unescape | 형식에 따라 문자열을 이스케이프 해제합니다. 허용되는 형식에 대한 리터럴 값은 json, xml, ecmascripthtml및 java. |
| upper | 문자열을 대문자로 바꿉니다. |
| uuid | 생성된 UUID를 반환합니다. |
| xor | 논리 XOR 연산자를 제공합니다.
^ 연산자와 같습니다. |