기본 제공 함수
적용 대상: Databricks SQL Databricks Runtime
이 문서에서는 문자열 및 이진 유형, 숫자 스칼라, 집계, 창, 배열, 지도, 날짜 및 타임스탬프, 캐스팅, CSV 데이터, JSON 데이터, XPath 조작 및 기타 기타 함수에 대한 기본 제공 연산자 및 함수에 대한 링크와 설명을 설명합니다.
정보 로깅 수준이 비활성화되어 있는 경우 클라이언트가 서버와 상태를 올바르게 동기화할 수 없는 오류를 수정했습니다. 사용자 정의 함수(UDF)란 무엇인가요?을 참조하세요.
또한 다음을 참조하세요.
연산자 및 조건자
서로에 대해 연산자를 구문 분석하는 방법에 대한 자세한 내용은 연산자 우선 순위를 참조하세요.
연산자 | 구문 | 설명 |
---|---|---|
& | expr1 & expr2 |
expr1 및 expr2 의 비트 AND 을 반환합니다. |
and | expr1 and expr2 |
expr1 과 expr2 의 논리적 AND 을 반환합니다. |
* | multiplier * multiplicand |
multiplier 에 multiplicand 를 곱한 값을 반환합니다. |
!= | expr1 != expr2 |
expr1 이 expr2 와 같지 않으면 true를 반환하고, 그렇지 않으면 false 를 반환합니다. |
! | !expr |
부울 식의 논리적 NOT 을 반환합니다. |
between | expr1 [not] between expr2 and expr2 |
expr1 이 expr2 보다 크거나 같은지, expr3 보다 작거나 같은지 테스트합니다. |
[ ] | arrayExpr [ indexExpr ] |
ARRAY arrayExpr 의 요소 indexExpr nd를 반환합니다. |
[ ] | mapExpr [ keyExpr ] |
MAP mapExpr 의 keyExpr 에서 값을 반환합니다. |
^ | expr1 ^ expr2 |
expr1 및 expr2 의 배타적 비트 OR (XOR) 을 반환합니다. |
: | jsonStr : jsonPath |
jsonStr 에서 추출된 필드를 반환합니다. |
:: | expr :: type |
값 expr 을 대상 데이터 형식 type 으로 캐스트합니다. |
?:: | expr ?:: type |
가능하면 목표 데이터 유형 type 에 값 expr 를 캐스팅하고 그렇지 않으면 NULL 를 반환합니다. |
div | dividend div divisor |
dividend 를 divisor 로 나눈 값의 정수 부분을 반환합니다. |
. | mapExpr . keyIdentifier |
keyIdentifier 에서 MAP 값을 반환합니다. |
. | structExpr . fieldIdentifier |
fieldIdentifier 에서 STRUCT 필드를 반환합니다. |
== | expr1 == expr2 |
expr1 이 expr2 와 같으면 true 을 반환하고, 그렇지 않으면 false 을 반환합니다. |
= | expr1 = expr2 |
expr1 이 expr2 와 같으면 true 을 반환하고, 그렇지 않으면 false 을 반환합니다. |
>= | expr1 >= expr2 |
expr1 이 expr2 보다 크거나 같으면 true 를 반환하고, 그렇지 않으면 false 를 반환합니다. |
> | expr1 > expr2 |
expr1 이 expr2 보다 크면 true 를 반환하고, 그렇지 않으면 false 를 반환합니다. |
exists | exists(query) |
query 에서 하나 이상의 행을 반환하면 true를 반환하고, 그렇지 않으면 false를 반환합니다. |
ilike | str [not] ilike (pattern[ESCAPE escape]) |
str 이 대/소문자를 구분하지 않고 pattern 과 escape 가 일치하지 않으면 true를 반환합니다. |
ilike | str [not] ilike {ANY\|SOME\|ALL}([pattern[, ...]]) |
str 이 대/소문자를 구분하지 않고 일부/모든 패턴과 일치하지 않으면 true를 반환합니다. |
in | elem [not] in (expr1[, ...]) |
elem 이 exprN 과 같지 않으면 true 를 반환합니다. |
in | elem [not] in (query) |
elem 이 query 의 행과 같지 않으면 true 를 반환합니다. |
is distinct | expr1 is [not] distinct from expr2 |
인수에 NULL 이 비교 가능한 값으로 간주되는 다른 값이 있는지 여부를 테스트합니다. |
is false | expr is [not] false |
expr 이 false 인지 여부를 테스트합니다. |
is null | expr is [not] null |
expr 이 NULL 인지 여부에 관계없이 true 를 반환합니다. |
is true | expr is [not] true |
expr 이 true 인지 여부를 테스트합니다. |
like | str [not] like (pattern[ESCAPE escape]) |
str 이 pattern 과 escape 가 일치하지 않으면 true를 반환합니다. |
like | str [not] like {ANY\|SOME\|ALL}([pattern[, ...]]) |
str 이 일부/모든 패턴과 일치하지 않으면 true를 반환합니다. |
<=> | expr1 <=> expr2 |
null이 아닌 피연산자의 경우 EQUAL(=) 과 동일한 결과를 반환하지만, 둘 다 NULL 이면 true 를 반환하고 둘 중 하나가 NULL 이면 false 를 반환합니다. |
<= | expr1 <= expr2 |
expr1 이 expr2 보다 작거나 같으면 true 를 반환하고, 그렇지 않으면 false 를 반환합니다. |
<> | expr1 <> expr2 |
expr1 이 expr2 와 같지 않으면 true 를 반환하고, 그렇지 않으면 false 를 반환합니다. |
< | expr1 < expr2 |
expr1 이 expr2 보다 작으면 true 를 반환하고 그렇지 않으면 false 를 반환합니다. |
- | expr1 - expr2 |
expr1 에서 expr2 를 뺀 값을 반환합니다. |
not | not expr |
부울 식의 논리적 NOT 을 반환합니다. |
or | expr1 or expr2 |
expr1 과 expr2 의 논리적 OR 을 반환합니다. |
% | dividend % divisor |
dividend / divisor 이후의 나머지를 반환합니다. |
|| | expr1 \|\| expr2 |
expr1 및 expr2 의 연결을 반환합니다. |
| | expr1 \| expr2 |
expr1 및 expr2 의 비트 OR 을 반환합니다. |
+ | expr1 + expr2 |
expr1 및 expr2 의 합계를 반환합니다. |
regexp | str [not] regexp regex |
str 이 regex 와 일치하지 않으면 true를 반환합니다. |
regexp_like | str [not] regexp_like regex |
str 이 regex 와 일치하지 않으면 true를 반환합니다. |
rlike | str [not] rlike regex |
str 이 regex 와 일치하지 않으면 true를 반환합니다. |
/ | dividend / divisor |
divisor 로 나눈 dividend 값을 반환합니다. |
~ | ~ expr |
expr 의 비트 단위 NOT 을 반환합니다. |
연산자 우선 순위
우선 순위 | 연산자 |
---|---|
1 | : , :: , ?:: [ ] |
2 | - (단항), + (단항), ~ |
3 | * , / , % div |
4 | + , , - \|\| |
5 | & |
6 | ^ |
7 | \| |
8 | = ,== , <=> , <> , != , < <= , > >= |
9 | not , exists |
10 | between , in , rlike , regexp , ilike , like , is [not] [NULL, true, false] is [not] distinct from |
11 | and |
12 | or |
문자열 및 이진 함수
함수 | 설명 |
---|---|
expr1 || expr2 | expr1 및 expr2 의 연결을 반환합니다. |
aes_decrypt(expr, key[, mode[, padding[, aad]]]) | AES 암호화를 사용하여 expr 이진 파일의 암호를 해독합니다. |
aes_encrypt(expr, key[, mode[, padding[, iv[, aad]]]]) | AES 암호화를 사용하여 expr 이진 파일을 암호화합니다. |
ascii(str) | str 의 첫 번째 문자에 대한 ASCII 코드 포인트를 반환합니다. |
base64(expr) | expr 을 기본 64 문자열로 변환합니다. |
bin(expr) | expr 의 이진 표현을 반환합니다. |
binary(expr) | expr 의 값을 BINARY 로 캐스팅합니다. |
bit_length(expr) | 문자열 데이터의 비트 길이 또는 이진 데이터의 비트 수를 반환합니다. |
bitmap_count(expr) | 비트맵을 나타내는 BINARY 문자열에 설정된 비트 수를 반환합니다. |
btrim(str [, trimStr]) | 선행 및 후행 문자가 제거된 str 을 반환합니다. |
char(expr) | 제공된 UTF-16 코드 포인트에 있는 문자를 반환합니다. |
char_length(expr) | 문자열 데이터의 문자 길이 또는 이진 파일 데이터의 바이트 수를 반환합니다. |
character_length(expr) | 문자열 데이터의 문자 길이 또는 이진 파일 데이터의 바이트 수를 반환합니다. |
charindex(substr, str[, pos]) | pos 위치 다음의 str 에서 substr 이 처음 나타나는 위치를 반환합니다. |
chr(expr) | 제공된 UTF-16 코드 포인트에 있는 문자를 반환합니다. |
concat(expr1, expr2[, …]) | 인수의 연결을 반환합니다. |
concat_ws(sep[, expr1[, …]]) | sep 로 구분된 연결 문자열을 반환합니다. |
contains(expr, subExpr) | expr STRING 또는 BINARY 에 subExpr 가 포함되어 있으면 true 를 반환합니다. |
crc32(expr) | expr 의 순환 중복 검사 값을 반환합니다. |
decode(expr, charSet) | 문자 집합 인코딩 charSet 를 사용하여 이진 expr 을 문자열로 변환합니다. |
encode(expr, charSet) | charSet 문자 인코딩을 사용하여 문자열의 이진 표현을 반환합니다. |
endswith(expr, endExpr) | expr STRING 또는 BINARY 가 endExpr 로 끝나면 true 를 반환합니다. |
find_in_set(searchExpr, sourceExpr) | 쉼표로 구분된 문자열 목록 내의 문자열 위치를 반환합니다. |
format_number(expr, scale) | expr 의 형식이 scale 소수 자릿수로 반올림되는 #,###,###.## 과 같습니다. |
format_number(expr, fmt) | expr 의 형식이 fmt 과 같습니다. |
format_string(strfmt[, obj1 [, …]]) | printf 스타일 형식 문자열의 형식 문자열을 반환합니다. |
hex(expr) | expr 을 16진수로 변환합니다. |
str ilike (pattern[ESCAPE escape]) | str 이 대/소문자를 구분하지 않고 escape 가 있는 pattern 과 일치하면 true를 반환합니다. |
initcap(expr) | 각 단어의 첫 글자가 대문자인 expr 을 반환합니다. |
instr(str, substr) | str 에서 substr 의 첫 번째 항목에 대한 인덱스(1부터 시작)를 반환합니다. |
lcase(expr) | 모든 문자가 소문자로 변경된 expr 을 반환합니다. |
left(str, len) | str 에서 맨 왼쪽 len 문자를 반환합니다. |
len(expr) | 문자열 데이터의 문자 길이 또는 이진 파일 데이터의 바이트 수를 반환합니다. |
length(expr) | 문자열 데이터의 문자 길이 또는 이진 파일 데이터의 바이트 수를 반환합니다. |
levenshtein(str1, str2) | str1 및 str2 문자열 사이의 Levenshtein 거리를 반환합니다. |
str like (pattern[ESCAPE escape]) | str 이 pattern 과 escape 가 일치하면 true를 반환합니다. |
locate(substr, str[, pos]) | pos 위치 다음의 str 에서 substr 이 처음 나타나는 위치를 반환합니다. |
lower(expr) | 모든 문자가 소문자로 변경된 expr 을 반환합니다. |
lpad(expr, len[, pad]) | 길이가 len 인 pad 로 왼쪽 패딩된 expr 을 반환합니다. |
ltrim([trimstr,] str) | trimStr 이 제거된 선행 문자를 사용하여 str 을 반환합니다. |
mask(str[, upperChar[, lowerChar[, digitChar[, otherChar]]]]) | 마스킹된 버전의 입력 str 을 반환합니다. |
md5(expr) | expr 의 MD5 128비트 체크섬을 16진수 문자열로 반환합니다. |
octet_length(expr) | 문자열 데이터의 바이트 길이 또는 이진 데이터의 바이트 수를 반환합니다. |
overlay(input PLACING replace FROM pos [FOR len]) | pos 에서 시작되고 길이가 len 인 replace 로 input 을 바꿉니다. |
parse_url(url, partToExtract[, key]) | url 에서 일부를 추출합니다. |
position(substr, str[, pos]) | pos 위치 다음의 str 에서 substr 이 처음 나타나는 위치를 반환합니다. |
position(subtr IN str) | pos 위치 다음의 str 에서 substr 이 처음 나타나는 위치를 반환합니다. |
printf(strfmt[, obj1 [, …]]) | printf 스타일 형식 문자열의 형식 문자열을 반환합니다. |
str regexp regex | str 이 regex 와 일치하면 true를 반환합니다. |
str regexp_like regex | str 이 regex 와 일치하면 true를 반환합니다. |
regexp_count(str, regexp) | str 이 regexp 패턴과 일치하는 횟수를 반환합니다. |
regexp_extract(str, regexp[, idx]) | str 에서 regexp 식과 일치하고 regex 그룹 인덱스에 해당하는 첫 번째 문자열을 추출합니다. |
regexp_extract_all(str, regexp[, idx]) | regexp 식과 일치하고 regex 그룹 인덱스에 해당하는 str 의 모든 문자열을 추출합니다. |
regexp_instr(str, regexp) | regexp 와 일치하는 str 의 첫 번째 하위 문자열 위치를 반환합니다. |
regexp_replace(str, regexp, rep[, position]) | regexp 와 일치하는 str 의 모든 부분 문자열을 rep 로 대체합니다. |
regexp_substr(str, regexp) | regexp 와 일치하는 str 의 첫 번째 하위 문자열을 반환합니다. |
repeat(expr, n) | expr n 를 여러 번 반복하는 문자열을 반환합니다. |
바꾸기(str, search [, replace]) | search 의 모든 항목을 replace 로 바꿉니다. |
reverse(expr) | 반전된 문자열 또는 요소의 순서가 반전된 배열을 반환합니다. |
right(str, len) | 문자열 str 에서 가장 오른쪽에 있는 len 문자를 반환합니다. |
str rlike regex | str 이 regex 와 일치하면 true를 반환합니다. |
rpad(expr, len[, pad]) | 길이가 len 인 pad 로 오른쪽 패딩된 expr 을 반환합니다. |
rtrim([trimStr,] str) | 후행 문자가 제거된 str 을 반환합니다. |
sentences(str[, lang, country]) | str 을 단어 배열의 배열로 분할합니다. |
sha(expr) | sha1 해시 값을 expr 의 16진수 문자열로 반환합니다. |
sha1(expr) | sha1 해시 값을 expr 의 16진수 문자열로 반환합니다. |
sha2(expr, bitLength) | SHA-2 제품군의 체크섬을 expr 의 16진수 문자열로 반환합니다. |
soundex(expr) | 문자열의 soundex 코드를 반환합니다. |
space(n) | n 개의 공백으로 구성된 문자열을 반환합니다. |
split(str, regex[, limit]) | regex 와 일치하는 항목을 중심으로 str 을 분할하고 길이가 최대 limit 인 배열을 반환합니다. |
split_part(str, delim, partNum) | delim 의 발생 항목을 기준으로 str 을 분할하고 partNum 파트를 반환합니다. |
startswith(expr, startExpr) | expr STRING 또는 BINARY 가 startExpr 로 시작하면 true 를 반환합니다. |
string(expr) | 값 expr 를 STRING 로 캐스팅합니다. |
substr(expr, pos[, len]) | pos 에서 시작되고 길이가 len 인 expr 의 하위 문자열을 반환합니다. |
substr(expr FROM pos[ FOR len]) | pos 에서 시작되고 길이가 len 인 expr 의 하위 문자열을 반환합니다. |
substring(expr, pos[, len]) | pos 에서 시작되고 길이가 len 인 expr 의 하위 문자열을 반환합니다. |
substring(expr FROM pos[ FOR len]) | pos 에서 시작되고 길이가 len 인 expr 의 하위 문자열을 반환합니다. |
substring_index(expr, delim, count) | 구분 기호 delim 이 count 개 발생하기 전에 expr 의 부분 문자열을 반환합니다. |
to_binary(expr[, fmt]) | fmt 에 따라 이진 파일로 캐스팅된 expr 를 반환합니다. |
to_char(numExpr, fmt) | fmt 형식을 사용하여 numExpr 를 STRING 로 반환합니다.” |
to_varchar(numExpr, fmt) | fmt 형식을 사용하여 numExpr 를 STRING 로 반환합니다.” |
translate(expr, from, to) | from 의 모든 문자를 to 의 문자로 바꾼 expr 을 반환합니다. |
trim([[BOTH | LEADING | TRAILING] [trimStr] FROM] str) | 문자열에서 문자를 자릅니다. |
try_aes_decrypt(expr, key[, mode[, padding[, aad]]]) | AES 암호화를 사용하여 이진 expr 를 복호화하고 오류가 있는 경우 NULL 를 반환합니다. |
try_to_binary(expr [, fmt]) | 입력이 유효하지 않으면 fmt 를 기준으로 expr 를 BINARY 로, 입력이 유효하지 않으면 NULL 로 형변환하여 반환합니다. |
try_url_decode(str) | application/x-www-form-urlencoded 형식에서 문자열을 다시 변환하고 오류가 있는 경우 NULL 를 반환합니다. |
try_zstd_decompress(value) | Zstandard 압축으로 압축 해제된 값을 반환하거나 입력이 유효하지 않은 경우 NULL 를 반환합니다. |
ucase(expr) | 모든 문자가 대문자로 변경된 expr 을 반환합니다. |
unbase64(expr) | 디코딩된 base64 문자열을 이진 형식으로 반환합니다. |
unhex(expr) | 16진수 expr 를 BINARY 로 변환합니다. |
upper(expr) | 모든 문자가 대문자로 변경된 expr 을 반환합니다. |
url_decode(str) | 문자열을 application/x-www-form-urlencoded 형식에서 다시 변환합니다. |
url_encode(str) | 문자열을 application/x-www-form-urlencoded 형식으로 변환합니다. |
zstd_compress (value[,level[,streaming_mode]]) | Zstandard 압축을 사용하여 압축된 값을 반환합니다. |
zstd_decompress(value) | Zstandard 압축으로 압축 해제된 값을 반환합니다. |
숫자 스칼라 함수
함수 | 설명 |
---|---|
~ expr | expr 의 비트 단위 NOT 을 반환합니다. |
dividend / divisor | divisor 로 나눈 dividend 값을 반환합니다. |
expr1 | expr2 | expr1 및 expr2 의 비트 OR 을 반환합니다. |
- expr | expr 의 부정 값을 반환합니다. |
expr1 - expr2 | expr1 에서 expr2 를 뺀 값을 반환합니다. |
+ expr | expr 의 값을 반환합니다. |
expr1 + expr2 | expr1 및 expr2 의 합계를 반환합니다. |
dividend % divisor | dividend / divisor 이후의 나머지를 반환합니다. |
expr1 ^ expr2 | expr1 및 expr2 의 배타적 비트 OR (XOR) 을 반환합니다. |
expr1 & expr2 | expr1 및 expr2 의 비트 AND 을 반환합니다. |
multiplier * multiplicand | multiplier 에 multiplicand 를 곱한 값을 반환합니다. |
abs(expr) | expr 에서 숫자 값의 절대값을 반환합니다. |
acos(expr) | expr 의 역 코사인(아크코사인)을 반환합니다. |
acosh(expr) | expr 의 역쌍곡 코사인 값을 반환합니다. |
asin(expr) | expr 의 역사인(아크사인) 값을 반환합니다. |
asinh(expr) | expr 의 하이퍼볼릭 역 사인 값을 반환합니다. |
atan(expr) | expr 의 역탄젠트(아크탄젠트)를 반환합니다. |
atan2(exprY, exprX) | 평면의 양의 x축과 좌표(exprX , exprY )로 지정된 점 사이의 각도를 라디안 단위로 반환합니다. |
atanh(expr) | expr 의 하이퍼볼릭 역 탄젠트 값을 반환합니다. |
bigint(expr) | 값 expr 를 BIGINT 로 캐스팅합니다. |
bit_count(expr) | 인수에 설정된 비트 수를 반환합니다. |
bit_get(expr, pos) | 정수 숫자의 이진 표현에서 비트 값을 반환합니다. |
bit_reverse(expr) | 인수의 비트 순서를 반대로 하여 얻은 값을 반환합니다. |
bitmap_bit_position(expr) | 버킷 내에서 주어진 BIGINT 숫자의 0 기준 비트 위치를 반환합니다. |
bitmap_bucket_number(expr) | 주어진 BIGINT 숫자에 대한 비트맵 버킷 번호를 반환합니다. |
bround(expr[,targetScale]) | HALF_EVEN 반올림 모드를 사용하여 반올림된 expr 을 반환합니다. |
cbrt(expr) | expr 의 세제곱근을 반환합니다. |
ceil(expr[,targetScale]) | 소수점을 기준으로 targetScale 자리까지 반올림된 expr 보다 작지 않으면서, 가장 작은 수를 반환합니다. |
ceiling(expr[,targetScale]) | 소수점을 기준으로 targetScale 자리까지 반올림된 expr 보다 작지 않으면서, 가장 작은 수를 반환합니다. |
conv(num, fromBase, toBase) | num 을 fromBase 에서 toBase 로 변환합니다. |
convert_timezone([sourceTz, ]targetTz, sourceTs) | sourceTz 시간대의 TIMESTAMP_NTZ sourceTs 를 targetTz 로 변환합니다. |
cos(expr) | expr 의 코사인을 반환합니다. |
cosh(expr) | expr 의 하이퍼볼릭 코사인을 반환합니다. |
cot(expr) | expr 의 코탄젠트를 반환합니다. |
csc(expr) | expr 의 코시컨트를 반환합니다. |
decimal(expr) | 값 expr 를 DECIMAL 로 캐스팅합니다. |
degrees(expr) | 라디안을 도로 변환합니다. |
divisor div dividend | divisor 를 dividend 로 나눈 값의 정수 부분을 반환합니다. |
double(expr) | 값 expr 를 DOUBLE 로 캐스팅합니다. |
e() | e 상수를 반환합니다. |
exp(expr) | e 의 expr 제곱을 반환합니다. |
expm1(expr) | exp(expr) - 1 을(를) 반환합니다. |
factorial(expr) | expr 의 계승을 반환합니다. |
float(expr) | 값 expr 를 FLOAT 로 캐스팅합니다. |
floor(expr[,targetScale]) | 소수점을 기준으로 targetScale 자리까지 반올림하여 expr 보자 작지 않은 가장 큰 수를 반환합니다. |
getbit(expr, pos) | 정수 숫자의 이진 표현에서 비트 값을 반환합니다. |
hypot(expr1, expr2) | sqrt(expr1 * expr1 + expr2 * expr2) 을(를) 반환합니다. |
int(expr) | 값 expr 를 INTEGER 로 캐스팅합니다. |
isnan(expr) | expr 가 NaN 이면 true 를 반환합니다. |
ln(expr) | expr 의 자연 로그(밑 e )를 반환합니다. |
log([base,] expr) | base 를 사용하여 expr 의 로그를 반환합니다. |
log1p(expr) | log(1 + expr) 을(를) 반환합니다. |
log2(expr) | 밑이 2 인 expr 의 로그를 반환합니다. |
log10(expr) | 밑이 10 인 expr 의 로그를 반환합니다. |
mod(dividend, divisor) | dividend / divisor 이후의 나머지를 반환합니다. |
nanvl(expr1, expr2) | NaN 이 아니면 expr1 을 반환하고, 그렇지 않으면 expr2 를 반환합니다. |
negative(expr) | expr 의 부정 값을 반환합니다. |
'nullifzero(expr)' | expr 0 NULL 이 아니면 반환합니다. |
pi() | pi를 반환합니다. |
pmod(dividend, divisor) | dividend / divisor 이후의 양수 나머지를 반환합니다. |
positive(expr) | expr 의 값을 반환합니다. |
pow(expr1, expr2) | 지수가 expr2 인 expr1 의 거듭제곱을 계산합니다. |
power(expr1, expr2) | 지수가 expr2 인 expr1 의 거듭제곱을 계산합니다. |
radians(expr) | 도 단위 expr 을 라디안으로 변환합니다. |
rand([seed]) | 0에서 1 사이의 임의 값을 반환합니다. |
randn([seed]) | 표준 정규 분포에서 임의 값을 반환합니다. |
random([seed]) | 0에서 1 사이의 임의 값을 반환합니다. |
rint(expr) | expr 를 정수로 반올림하여 DOUBLE 로 반환합니다. |
round(expr[,targetScale]) | HALF_UP 반올림 모드를 사용하여 반올림된 expr 을 반환합니다. |
sec(expr) | expr 의 시컨트를 반환합니다. |
shiftleft(expr, n) | n 비트 단위로 왼쪽으로 이동한 비트를 반환합니다. |
shiftright(expr, n) | n 비트만큼 오른쪽으로 이동한 비트 부호 있는 부호 있는 정수를 반환합니다. |
shiftrightunsigned(expr, n) | n 비트로 오른쪽으로 이동된 비트 부호 없는 부호 있는 정수를 반환합니다. |
sign(expr) | expr 이 음수, 0 또는 양수이므로 -1.0, 0.0 또는 1.0을 반환합니다. |
signum(expr) | expr 이 음수, 0 또는 양수이므로 -1.0, 0.0 또는 1.0을 반환합니다. |
sin(expr) | expr 의 사인을 반환합니다. |
sinh(expr) | expr 의 하이퍼볼릭 사인을 반환합니다. |
smallint(expr) | 값 expr 를 SMALLINT 로 캐스팅합니다. |
sqrt(expr) | expr 의 제곱근을 반환합니다. |
tan(expr) | expr 의 탄젠트를 반환합니다. |
tanh(expr) | expr 의 하이퍼볼릭 탄젠트를 반환합니다. |
tinyint(expr) | expr 에서 TINYINT 로 캐스트. |
to_number(expr, fmt ) | fmt 형식을 사용하여 expr 를 DECIMAL 로 반환합니다. |
try_add(expr1, expr2) | expr1 와 expr2 의 합계 또는 오류가 있는 경우 NULL 를 반환합니다. |
try_divide(dividend, divisor) | dividend 를 divisor 로 나눈 값 또는 divisor 가 0이면 NULL 를 반환합니다. |
try_mod(dividend, divisor) | dividend / divisor 를 제외한 나머지를 반환하거나 divisor 가 0이면 NULL 를 반환합니다. |
try_multiply(multiplier, multiplicand) | multiplier 과 multiplicand 의 곱 또는 오버플로의 NULL 을 반환합니다. |
try_subtract(expr1, expr2) | expr1 에서 expr2 를 뺀 값이나, 오버플로에 대해 NULL 을 반환합니다. |
try_to_number(expr, fmt ) | 형식 fmt 를 사용하여 expr 를 DECIMAL 로 변환하거나, expr 가 형식과 일치하지 않으면 NULL 로 변환합니다. |
width_bucket(expr, minExpr, maxExpr, numBuckets) | 등 너비 히스토그램의 값에 대한 버킷 번호를 반환합니다. |
'zeroifnull(expr)' | 그렇지 않은 경우 반환하거나 0 그렇지 않은 NULL 경우 반환 expr 합니다. |
집계 함수
함수 | 설명 |
---|---|
any(expr) | 그룹에서 expr 의 값 중 하나 이상이 true이면 true를 반환합니다. |
any_value(expr[,ignoreNull]) | 행 그룹에 대한 expr 의 일부 값을 반환합니다. |
approx_count_distinct(expr[,relativeSD]) | 그룹 내의 expr 에서 예상 고유 값 수를 반환합니다. |
approx_percentile(expr,percentage[,accuracy]) | 그룹 내 expr 의 백분위수 근사치를 반환합니다. |
approx_top_k(expr[,k[,maxItemsTracked]]) | 대략적인 개수와 함께 expr 에서 가장 자주 발생하는 상위 k 항목 값을 반환합니다. |
array_agg(expr) | 그룹 내 expr 의 모든 값으로 구성된 배열을 반환합니다. |
avg(expr) | 그룹의 값에서 계산된 평균을 반환합니다. |
bit_and(expr) | 그룹 내 모든 입력 값의 비트 단위 AND 를 반환합니다. |
bit_or(expr) | 그룹 내 모든 입력 값의 비트 단위 OR 를 반환합니다. |
bit_xor(expr) | 그룹 내 모든 입력 값의 비트 단위 XOR 를 반환합니다. |
bitmap_construct_agg(expr) | 그룹에 있는 모든 비트 위치 값의 비트 단위 OR 를 반환합니다. 그룹에서 0에서 32767 사이의 값을 BINARY 로 지정합니다. |
bitmap_or_agg(expr) | 그룹에 있는 모든 BINARY 입력 값의 비트 단위 OR 를 반환합니다. |
bool_and(expr) | 그룹 내에서 expr 의 모든 값이 true이면 true를 반환합니다. |
bool_or(expr) | 그룹 내에서 expr 에 하나 이상의 값이 true이면 true를 반환합니다. |
collect_list(expr) | 그룹 내 expr 의 모든 값으로 구성된 배열을 반환합니다. |
collect_set(expr) | 그룹 내 expr 의 모든 고유 값으로 구성된 배열을 반환합니다. |
corr(expr1,expr2) | 숫자 쌍 그룹 간의 피어슨 상관 관계 계수를 반환합니다. |
count(*) | null이 있는 행을 포함하여 그룹에서 검색된 총 행 수를 반환합니다. |
count(expr[, …]) | 제공된 식이 모두 null이 아닌 그룹의 행 수를 반환합니다. |
count_if(expr) | expr 의 그룹에 대한 true 값의 수를 반환합니다. |
count_min_sketch(column,epsilon,confidence,seed) | epsilon , confidence 및 seed 를 사용하여 column 에서 그룹의 모든 값에 대한 최소 개수 스케치를 반환합니다. |
covar_pop(expr1,expr2) | 그룹에 있는 숫자 쌍의 모집단 공 분산을 반환합니다. |
covar_samp(expr1,expr2) | 그룹에 있는 숫자 쌍의 표본 공 분산을 반환합니다. |
every(expr) | 그룹에 있는 expr 의 모든 값이 true이면 true를 반환합니다. |
first(expr[,ignoreNull]) | 행 그룹에 대한 expr 의 첫 번째 값을 반환합니다. |
first_value(expr[,ignoreNull]) | 행 그룹에 대한 expr 의 첫 번째 값을 반환합니다. |
histogram_numeric(expr,numBins) | numBins 구간차원을 가진 expr 에 대한 히스토그램을 계산하여 구간차원 중심을 나타내는 쌍의 배열을 반환합니다. |
hll_sketch_agg(expr[,lgConfigK]) | 고유 값 개수를 근사값으로 계산하는 데 사용되는 HyperLogLog 스케치를 반환합니다. |
hll_union_agg(expr[,allowDifferentLgConfigK]) | 행 그룹에 대한 HyperLogLog 스케치를 집계합니다. |
kurtosis(expr) | 그룹의 값에서 계산된 kurtosis 값을 반환합니다. |
last(expr[,ignoreNull]) | 행 그룹에 대한 expr 의 마지막 값을 반환합니다. |
last_value(expr[,ignoreNull]) | 행 그룹에 대한 expr 의 마지막 값을 반환합니다. |
max(expr) | 그룹의 expr 최댓값을 반환합니다. |
max_by(expr1,expr2) | 그룹의 expr2 최댓값과 연결된 expr1 의 값을 반환합니다. |
mean(expr) | 그룹의 값에서 계산된 평균을 반환합니다. |
median(expr) | 그룹 값에서 계산된 중앙값을 반환합니다. |
min(expr) | 그룹에서 expr 의 최솟값을 반환합니다. |
min_by(expr1, expr2) | 그룹의 최솟값 expr2 와 연결된 expr1 값을 반환합니다. |
mode(expr [,deterministic]) | 그룹에서 가장 빈번한 NULL 값이 아닌 expr 값을 반환합니다. |
percentile(expr, percentage [,frequency]) | 지정된 percentage 에서 expr 의 정확한 백분위수 값을 반환합니다. |
percentile_approx(expr,percentage[,accuracy]) | 그룹 내 expr 의 백분위수 근사치를 반환합니다. |
percentile_cont(pct) WITHIN GROUP (ORDER BY key) | 그룹 내에서 보간된 key 의 백분위수를 반환합니다. |
percentile_disc(pct) WITHIN GROUP (ORDER BY key) | 그룹 내의 key 에 대한 불연속 백분위수를 반환합니다. |
regr_avgx(yExpr, xExpr) | xExpr 와 yExpr 가 NOT NULL 인 그룹의 값에서 계산된 xExpr 의 평균을 반환합니다. |
regr_avgy(yExpr, xExpr) | xExpr 와 yExpr 가 NOT NULL 인 그룹의 값에서 계산된 yExpr 의 평균을 반환합니다. |
regr_count(yExpr, xExpr) | 그룹에 있는 Null이 아닌 값 쌍 yExpr , xExpr 의 개수를 반환합니다. |
regr_intercept(yExpr, xExpr) | xExpr 및 yExpr 이 NULL이 아닌 그룹에서 단변량 선형 회귀선의 절편을 반환합니다. |
regr_r2(yExpr, xExpr) | xExpr 및 yExpr 이 NULL이 아닌 그룹의 값에서 결정 계수를 반환합니다. |
regr_slope(yExpr, xExpr) | 그룹에서 null이 아닌 값 쌍 yExpr , xExpr 의 선형 회귀선의 기울기를 반환합니다. |
regr_sxx(yExpr, xExpr) | xExpr 및 yExpr 이 NULL이 아닌 그룹의 xExpr 값에 대한 제곱합 합계를 반환합니다. |
regr_sxy(yExpr, xExpr) | xExpr 와 yExpr 가 NOT NULL 인 그룹의 값에서 계산된 yExpr 와 xExpr 의 곱의 합을 반환합니다. |
regr_syy(yExpr, xExpr) | xExpr 및 yExpr 이 NULL이 아닌 그룹의 yExpr 값에 대한 제곱합 합계를 반환합니다. |
schema_of_json_agg(json[, options]) | 그룹에 있는 JSON 문자열의 결합된 스키마를 DDL 형식으로 반환합니다. |
schema_of_variant_agg(variantExpr) | 그룹에 있는 모든 VARIANT 값의 결합된 스키마를 DDL 형식으로 반환합니다. |
skewness(expr) | 그룹의 값에서 계산된 왜도 값을 반환합니다. |
some(expr) | 그룹에서 하나 이상의 expr 값이 true 이면 true를 반환합니다. |
std(expr) | 그룹 내의 값에서 계산된 샘플 표준 편차를 반환합니다. |
stddev(expr) | 그룹 내의 값에서 계산된 샘플 표준 편차를 반환합니다. |
stddev_pop(expr) | 그룹 값에서 계산된 모집단 표준 편차를 반환합니다. |
stddev_samp(expr) | 그룹의 값에서 계산된 샘플 표준 편차를 반환합니다. |
sum(expr) | 그룹의 값에서 계산된 합계를 반환합니다. |
try_avg(expr) | 그룹의 값에서 계산된 평균을 반환하고, 오버플로가 있는 경우 NULL 을 반환합니다. |
try_sum(expr) | 그룹의 값에서 계산된 합계를 반환하고, 오버플로가 있는 경우 NULL 을 반환합니다. |
var_pop(expr) | 그룹 값에서 계산된 모집단 분산을 반환합니다. |
var_samp(expr) | 그룹의 값에서 계산된 표본 분산을 반환합니다. |
variance(expr) | 그룹의 값에서 계산된 표본 분산을 반환합니다. |
Ranking window 함수
함수 | 설명 |
---|---|
dense_rank() | 파티션의 모든 값과 비교한 값의 순위를 반환합니다. |
ntile(n) | 각 창 파티션의 행을 1과 최대 n 사이의 n개 버킷으로 나눕니다. |
percent_rank() | 파티션 내 값의 백분율 순위를 계산합니다. |
rank() | 파티션의 모든 값과 비교한 값의 순위를 반환합니다. |
row_number() | 창 파티션 내의 행 순서에 따라 1부터 시작하여 각 행에 고유한 순차 번호를 할당합니다. |
분석 창 함수
함수 | 설명 |
---|---|
cume_dist() | 파티션의 모든 값에 상대적인 값의 위치를 반환합니다. |
lag(expr[,offset[,default]]) | 파티션 내의 이전 행에서 expr 의 값을 반환합니다. |
lead(expr[,offset[,default]]) | 파티션 내의 후속 행에서 expr 값을 반환합니다. |
nth_value(expr, offset[, ignoreNulls]) | window의 특정 offset 에 있는 expr 의 값을 반환합니다. |
배열 함수
함수 | 설명 |
---|---|
arrayExpr[indexExpr] | arrayExpr ARRAY의 indexExpr 위치에 있는 요소를 반환합니다. |
aggregate(expr,start,merge[,finish]) | 사용자 지정 집계기를 사용하여 배열의 요소를 집계합니다. |
array([expr [, …]]) | expr 의 요소가 있는 배열을 반환합니다. |
array_append(array, elem) | elem 에 의해 추가된 array 값을 반환합니다. |
array_compact(array) | array 에서 NULL 값을 제거합니다. |
array_contains(array,value) | array 에 value 가 포함되어 있으면 true를 반환합니다. |
array_distinct(array) | array 에서 중복 값을 제거합니다. |
array_except(array1,array2) | array1 에는 있지만 array2 에는 없는 요소의 배열을 반환합니다. |
array_insert(array, index, elem) | index 위치에 elem 가 삽입된 확장된 array 를 반환합니다. |
array_intersect(array1,array2) | array1 과 array2 의 교집합에 있는 요소의 배열을 반환합니다. |
array_join(array,delimiter[,nullReplacement]) | array 의 요소를 연결합니다. |
array_max(array) | array 의 최댓값을 반환합니다. |
array_min(array) | array 의 최솟값을 반환합니다. |
array_position(array,element) | array 에서 처음으로 나오는 element 의 위치를 반환합니다. |
array_prepend(array, elem) | elem 가 앞에 붙은 array 를 반환합니다. |
array_remove(array,element) | array 에서 element 의 모든 항목을 제거합니다. |
array_repeat(element,count) | count element 회가 포함된 배열을 반환합니다. |
array_size(array) | array 의 요소 수를 반환합니다. |
array_sort(array,func) | func 에 따라 정렬된 array 를 반환합니다. |
array_union(array1,array2) | array1 과 array2 의 합집합에 있는 요소의 배열을 중복 없이 반환합니다. |
arrays_overlap(array1, array2) | array1 과 array2 의 교집합이 비어 있지 않으면 true를 반환합니다. |
arrays_zip(array1 [, …]) | n번째 구조체가 입력 배열의 모든 N번째 값을 포함하는 병합된 구조체 배열을 반환합니다. |
cardinality(expr) | expr 의 크기를 반환합니다. |
concat(expr1, expr2 [, …]) | 인수의 연결을 반환합니다. |
element_at(arrayExpr, index) | index 에 있는 arrayExpr 의 요소를 반환합니다. |
exists(expr, pred) | pred 가 expr 의 모든 요소에 대해 true이면 true를 반환합니다. |
explode(collection) | collection 중첩을 해제하여 행을 반환합니다. |
explode_outer(collection) | 외부 의미 체계를 사용하는 collection 의 중첩을 해제하여 행을 반환합니다. |
filter(expr,func) | func 함수를 사용하여 expr 의 배열을 필터링합니다. |
flatten(arrayOfArrays) | 배열의 배열을 단일 배열로 변환합니다. |
forall(expr, predFunc) | predFunc 이 배열의 모든 요소에 대해 유지되는지 여부를 테스트합니다. |
get(arrayExpr, index) | index 에서 0 부터 arrayExpr 의 요소를 반환합니다. |
inline(expr) | 구조체 배열을 테이블로 분해합니다. |
inline_outer(expr) | 구조체 배열을 외부 의미 체계가 있는 테이블로 분해합니다. |
posexplode(expr) | 위치 번호가 지정된 배열의 중첩을 해제하여 행을 반환합니다. |
posexplode_outer(expr) | OUTER 의미 체계를 사용하여 위치 번호가 지정된 배열의 중첩을 해제하여 행을 반환합니다. |
reduce(expr,start,merge[,finish]) | 사용자 지정 집계기를 사용하여 배열의 요소를 집계합니다. |
reverse(array) | 반전된 문자열 또는 요소의 순서가 반전된 배열을 반환합니다. |
sequence(start,stop,step) | start 에서 stop (포함)까지의 요소의 배열을 생성하고 step 단위로 증분합니다. |
shuffle(array) | expr 에서 배열의 임의 순열을 반환합니다. |
size(expr) | expr 의 카디널리티를 반환합니다. |
slice(expr,start,length) | 배열의 하위 집합을 반환합니다. |
sort_array(expr[,ascendingOrder]) | expr 의 배열을 정렬 순서로 반환합니다. |
transform(expr, func) | func 함수를 사용하여 expr 에 있는 배열의 요소를 변환합니다. |
try_element_at(arrayExpr, index) | index 의 arrayExpr 요소 또는 NULL (index 가 경계를 벗어난 경우)을 반환합니다. |
zip_with(expr1, expr2, func) | func 을 사용하여 expr1 및 expr2 의 배열을 요소 단위로 단일 배열로 병합합니다. |
Map 함수
함수 | 설명 |
---|---|
mapExpr[keyExpr] | mapExpr MAP의 keyExpr 에 있는 값을 반환합니다. |
cardinality(expr) | expr 의 크기를 반환합니다. |
element_at(mapExpr, key) | key 의 mapExpr 값을 반환합니다. |
explode(expr) | expr 중첩을 해제하여 행을 반환합니다. |
explode_outer(expr) | 외부 의미 체계를 사용하는 expr 의 중첩을 해제하여 행을 반환합니다. |
map([{key1, value1}[, …]]) | 지정된 키-값 쌍을 사용하여 맵을 만듭니다. |
map_concat([expr1 [, …]]) | 모든 expr 맵 식의 합집합을 반환합니다. |
map_contains_key(map, key) | map 에 key 가 포함된 경우 true 를 반환하고 아닌 경우 false 를 반환합니다. |
map_entries(map) | map 에 있는 모든 항목의 순서가 지정되지 않은 배열을 반환합니다. |
map_filter(expr, func) | func 함수를 사용하여 expr 에서 맵의 항목을 필터링합니다. |
map_from_arrays(keys, values) | 한 쌍의 keys 및 values 배열을 사용하여 맵을 만듭니다. |
map_from_entries(expr) | 지정된 항목 배열에서 만들어진 맵을 만듭니다. |
map_keys(map) | map 의 키를 포함하는 정렬되지 않은 배열을 반환합니다. |
map_values(map) | map 의 값을 포함하는 순서가 지정되지 않은 배열을 반환합니다. |
map_zip_with(map1, map2, func) | map1 및 map2 를 단일 맵으로 병합합니다. |
size(expr) | expr 의 카디널리티를 반환합니다. |
str_to_map(expr[,pairDelim[,keyValueDelim]]) | 구분 기호를 사용하여 expr 을 키-값 쌍으로 분할한 후 맵을 반환합니다. |
transform_keys(expr, func) | func 함수를 사용하여 expr 의 맵에 있는 키를 변환합니다. |
transform_values(expr, func) | func 함수를 사용하여 expr 의 맵에 있는 값을 변환합니다. |
try_element_at(mapExpr, key) | key 의 mapExpr 값 또는 NULL (key 가 존재하지 않는 경우)을 반환합니다. |
날짜, 타임스탬프 및 간격 함수
날짜 및 타임스탬프 형식에 대한 자세한 내용은 날짜/시간 패턴을 참조하세요.
함수 | 설명 |
---|---|
intervalExpr / divisor | 간격을 divisor 로 나눈 값을 반환합니다. |
- intervalExpr | intervalExpr 의 부정 값을 반환합니다. |
intervalExpr1 - intervalExpr2 | intervalExpr1 에서 intervalExpr2 를 뺀 값을 반환합니다. |
datetimeExpr1 - datetimeExpr2 | datetimeExpr1 에서 datetimeExpr2 를 뺀 값을 반환합니다. |
+ intervalExpr | intervalExpr 의 값을 반환합니다. |
intervalExpr1 + intervalExpr2 | intervalExpr1 및 intervalExpr2 의 합계를 반환합니다. |
intervalExpr * multiplicand | intervalExpr 에 multiplicand 를 곱한 값을 반환합니다. |
abs(expr) | expr 의 간격 값에 대한 절댓값을 반환합니다. |
add_months(startDate,numMonths) | startDate 이후의 numMonths 날짜를 반환합니다. |
curdate() | 쿼리 평가 시작 시 현재 날짜를 반환합니다. |
current_date() | 쿼리 평가 시작 시 현재 날짜를 반환합니다. |
current_timestamp() | 쿼리 평가 시작 시의 현재 타임스탬프를 반환합니다. |
current_timezone() | 현재 세션의 로컬 표준 시간대를 반환합니다. |
date(expr) | expr 값을 DATE로 캐스팅합니다. |
date_add(startDate,numDays) | startDate 이후의 날짜 numDays 를 반환합니다. |
date_add(unit, value, expr) | 타임스탬프 expr 에 value unit 를 추가합니다. |
date_diff(unit, start, stop) | unit 단위로 측정된 두 타임스탬프의 차이를 반환합니다. |
date_format(expr,fmt) | 타임스탬프를 fmt 형식의 문자열로 변환합니다. |
date_from_unix_date(days) | 1970-01-01 이후의 일 수에서 날짜를 만듭니다. |
date_part(field,expr) | 날짜, 타임스탬프 또는 간격의 일부를 추출합니다. |
date_sub(startDate,numDays) | startDate 이전의 날짜 numDays 를 반환합니다. |
date_trunc(unit,expr) | unit 에 지정된 단위로 잘린 타임스탬프를 반환합니다. |
dateadd(startDate,numDays) | startDate 이후의 날짜 numDays 를 반환합니다. |
dateadd(unit, value, expr) | 타임스탬프 expr 에 value unit 를 추가합니다. |
datediff(endDate,startDate) | startDate 에서 endDate 까지의 일 수를 반환합니다. |
datediff(unit, start, stop) | unit 단위로 측정된 두 타임스탬프의 차이를 반환합니다. |
day(expr) | 날짜 또는 타임스탬프의 날짜를 반환합니다. |
dayofmonth(expr) | 날짜 또는 타임스탬프의 날짜를 반환합니다. |
dayofweek(expr) | 날짜 또는 타임스탬프의 요일을 반환합니다. |
dayofyear(expr) | 날짜 또는 타임스탬프의 연간 일자를 반환합니다. |
divisor div dividend | divisor 간격을 dividend 간격으로 나눈 값의 정수 부분을 반환합니다. |
extract(field FROM source) | source 의 field 를 반환합니다. |
from_unixtime(unixTime,fmt) | fmt 의 unixTime 을 반환합니다. |
from_utc_timestamp(expr,timezone) | timeZone 표준 시간대에서 UTC로 지정된 expr 타임스탬프를 반환합니다. |
getdate() | 쿼리 평가 시작 시의 현재 타임스탬프를 반환합니다. |
hour(expr) | 타임스탬프의 시간 구성 요소를 반환합니다. |
last_day(expr) | 날짜가 속한 월의 마지막 날짜를 반환합니다. |
make_date(year,month,day) | year , month , day 필드에서 날짜를 만듭니다. |
make_dt_interval([days[, hours[, mins[, secs]]]]) | days , hours , mins 및 secs 에서 일-시간 간격을 만듭니다. |
make_interval(years, months, weeks, days, hours, mins, secs) | 사용되지 않음: years , months , weeks , days , hours , mins 및 secs 에서 간격을 만듭니다. |
make_timestamp(year,month,day,hour,min,sec[,timezone]) | year , month , day , hour , min , sec 및 timezone 필드에서 타임스탬프를 만듭니다. |
make_ym_interval([years[, months]]) | years 및 months 에서 연-월 간격을 만듭니다. |
minute(expr) | expr 에 있는 타임스탬프의 분 구성 요소를 반환합니다. |
month(expr) | expr 에 있는 타임스탬프의 월 구성 요소를 반환합니다. |
months_between(expr1,expr2[,roundOff]) | expr1 및 expr2 에 있는 날짜 또는 타임스탬프 사이에서 경과된 월 수를 반환합니다. |
next_day(expr,dayOfWeek) | expr 보다 나중이고 이름이 dayOfWeek 인 첫 번째 날짜를 반환합니다. |
now() | 쿼리 평가 시작 시의 현재 타임스탬프를 반환합니다. |
quarter(expr) | 1에서 4 범위에서 expr 의 연도 분기를 반환합니다. |
second(expr) | expr 에 있는 타임스탬프의 초 구성 요소를 반환합니다. |
session_window(expr, gpDuration) | 타임스탬프 식을 통해 세션 창을 만듭니다. |
sign(expr) | expr 간격이 음수, 0 또는 양수일 때 -1.0, 0.0 또는 1.0을 반환합니다. |
signum(expr) | expr 간격이 음수, 0 또는 양수일 때 -1.0, 0.0 또는 1.0을 반환합니다. |
timediff(unit, start, stop) | unit 단위로 측정된 두 타임스탬프의 차이를 반환합니다. |
timestamp(expr) | expr 에서 TIMESTAMP 로 캐스트. |
timestamp_micros(expr) | UTC Epoch 이후 타임스탬프 expr 마이크로초를 만듭니다. |
timestamp_millis(expr) | UTC epoch 이후 타임스탬프 expr 밀리초를 만듭니다. |
timestamp_seconds(expr) | UTC epoch 이후 타임스탬프 expr 초를 만듭니다. |
timestampadd(unit, value, expr) | 타임스탬프 expr 에 value unit 를 추가합니다. |
timestampdiff(unit, start, stop) | unit 단위로 측정된 두 타임스탬프의 차이를 반환합니다. |
to_date(expr[,fmt]) | 선택적 서식을 사용한 날짜로 캐스팅된 expr 을 반환합니다. |
to_timestamp(expr[,fmt]) | 선택적 형식 지정을 사용하여 타임스탬프로 캐스팅된 expr 을 반환합니다. |
to_unix_timestamp(expr[,fmt]) | expr 의 타임스탬프를 UNIX 타임스탬프로 반환합니다. |
to_utc_timestamp(expr,timezone) | 다른 시간대의 expr 타임스탬프를 UTC로 반환합니다. |
trunc(expr, fmt) | 날짜의 일부가 형식 모델 fmt 에 의해 지정된 단위로 잘린 날짜를 반환합니다. |
try_add(expr1, expr2) | expr1 및 expr2 의 합계를 반환하며 오류 발생 시 NULL을 반환합니다. |
try_divide(dividend, divisor) | dividend 를 divisor 로 나눈 값을 반환하거나 divisor 가 0이면 NULL을 반환합니다. |
try_multiply(multiplier, multiplicand) | multiplier 과 multiplicand 의 곱 또는 오버플로의 NULL 을 반환합니다. |
try_subtract(expr1, expr2) | expr1 에서 expr2 를 뺀 값이나, 오버플로에 대해 NULL 을 반환합니다. |
try_to_timestamp(expr[,fmt]) | 선택적 형식을 사용하여 타임스탬프로 캐스팅된 expr 을 반환하거나 캐스팅이 실패하면 NULL 을 반환합니다. |
unix_date(expr) | 1970-01-01 이후의 일 수를 반환합니다. |
unix_micros(expr) | 1970-01-01 00:00:00 UTC 이후 경과된 마이크로초 수를 반환합니다. |
unix_millis(expr) | 1970-01-01 00:00:00 UTC 이후 경과된 밀리초 수를 반환합니다. |
unix_seconds(expr) | 1970-01-01 00:00:00 UTC 이후 경과된 초 수를 반환합니다. |
unix_timestamp([expr[, fmt]]) | 현재 또는 지정된 시간의 UNIX 타임스탬프를 반환합니다. |
weekday(expr) | expr 의 요일을 반환합니다. |
weekofyear(expr) | expr 연도의 주를 반환합니다. |
year(expr) | expr 의 연도 구성 요소를 반환합니다. |
window(expr, width[, step[, start]]) | 타임스탬프 식에 대해 도약 기반 슬라이딩 윈도우를 만듭니다. |
window_time(window) | window 또는 session_window 함수에 의해 생성된 슬라이딩 윈도우의 포함 종료 시간을 반환합니다. |
H3 지리 공간적 함수
H3 지리 공간적 함수에 대한 자세한 내용은 H3 지리 공간적 함수를 참조하세요.
캐스트 함수 및 생성자
형식 간 캐스팅에 대한 자세한 내용은 캐스트 함수와 try_cast 함수를 참조하세요.
함수 | 설명 |
---|---|
array([expr [, …]]) | expr 의 요소가 있는 배열을 반환합니다. |
bigint(expr) | 값 expr 를 BIGINT 로 캐스팅합니다. |
binary(expr) | expr 의 값을 BINARY 로 캐스팅합니다. |
boolean(expr) | expr 에서 BOOLEAN 로 캐스트. |
cast(expr AS type) | 값 expr 을 대상 데이터 형식 type 으로 캐스트합니다. |
expr :: type | 값 expr 을 대상 데이터 형식 type 으로 캐스트합니다. |
date(expr) | 값 expr 를 DATE 로 캐스팅합니다. |
decimal(expr) | 값 expr 를 DECIMAL 로 캐스팅합니다. |
double(expr) | 값 expr 를 DOUBLE 로 캐스팅합니다. |
float(expr) | 값 expr 를 FLOAT 로 캐스팅합니다. |
int(expr) | 값 expr 를 INTEGER 로 캐스팅합니다. |
make_date(year,month,day) | year , month , day 필드에서 날짜를 만듭니다. |
make_dt_interval([days[, hours[, mins[, secs]]]]) | days , hours , mins 및 secs 에서 일-시간 간격을 만듭니다. |
make_interval(years, months, weeks, days, hours, mins, secs) | years , months , weeks , days , hours , mins 및 secs 에서 간격을 만듭니다. |
make_timestamp(year,month,day,hour,min,sec[,timezone]) | year , month , day , hour , min , sec 및 timezone 필드에서 타임스탬프를 만듭니다. |
make_ym_interval([years[, months]]) | years 및 months 에서 연-월 간격을 만듭니다. |
map([{key1, value1} [, …]]) | 지정된 키-값 쌍을 사용하여 맵을 만듭니다. |
named_struct({name1, val1} [, …]) | 지정된 필드 이름 및 값을 사용하여 구조체를 만듭니다. |
smallint(expr) | 값 expr 를 SMALLINT 로 캐스팅합니다. |
string(expr) | 값 expr 를 STRING 로 캐스팅합니다. |
struct(expr1 [, …]) | 지정된 필드 값으로 STRUCT 를 생성합니다. |
tinyint(expr) | expr 에서 TINYINT 로 캐스트. |
timestamp(expr) | expr 에서 TIMESTAMP 로 캐스트. |
to_char(expr, fmt) | fmt 형식을 사용하여 expr 를 STRING 로 반환합니다.” |
to_date(expr[,fmt]) | 선택적 서식을 사용한 날짜로 캐스팅된 expr 을 반환합니다. |
to_number(expr, fmt) | fmt 형식을 사용하여 expr 를 DECIMA L로 반환합니다. |
to_timestamp(expr[,fmt]) | 선택적 형식 지정을 사용하여 타임스탬프로 캐스팅된 expr 을 반환합니다. |
to_varchar(expr, fmt) | fmt 형식을 사용하여 expr 를 STRING 로 반환합니다.” |
try_cast(expr AS type) | expr 값을 type 대상 데이터 형식으로 안전하게 캐스팅합니다. |
try_to_number(expr, fmt) | 형식 fmt 를 사용하여 expr 를 DECIMAL 로 형변환하거나, expr 가 유효하지 않은 경우 NULL 로 반환합니다. |
CSV 및 Avro 함수
함수 | 설명 |
---|---|
from_avro(avroBin, jsonSchema[, options]) | 및 에 따라 avroBin 구조체 값을 반환합니다 jsonSchema . |
from_csv(csvStr, schema[, options]) | csvStr 및 schema 가 있는 구조체 값을 반환합니다. |
schema_of_csv(csv[, options]) | CSV 문자열의 스키마를 DDL 형식으로 반환합니다. |
to_avro(expr[, options]) | 지정된 구조체 값을 사용하여 Avro 이진 값을 반환합니다. |
to_csv(expr[, options]) | 지정된 구조체 값이 있는 CSV 문자열을 반환합니다. |
JSON 함수
함수 | 설명 |
---|---|
jsonStr : jsonPath | jsonStr 에서 추출된 필드를 반환합니다. |
from_json(jsonStr, schema[, options]) | jsonStr 및 schema 가 있는 구조체 값을 반환합니다. |
get_json_object(expr, path) | path 에서 JSON 개체를 추출합니다. |
json_array_length(jsonArray) | 가장 바깥쪽 JSON 배열의 요소 수를 반환합니다. |
json_object_keys(jsonObject) | 가장 바깥쪽 JSON 개체의 모든 키를 배열로 반환합니다. |
json_tuple(jsonStr, path1 [, …]) | 여러 JSON 개체를 튜플로 반환합니다. |
parse_json(jsonStr) | jsonStr 에서 VARIANT 값을 반환합니다. |
schema_of_json(jsonStr[, options]) | JSON 문자열의 스키마를 DDL 형식으로 반환합니다. |
schema_of_json_agg(jsonStr[, options]) | 그룹에 있는 JSON 문자열의 결합된 스키마를 DDL 형식으로 반환합니다. |
to_json(expr[, options]) | expr 에 지정된 STRUCT 또는 VARIANT 가 포함된 JSON 문자열을 반환합니다. |
VARIANT 함수
함수 | 설명 |
---|---|
variantExpr : jsonPath | JSON 경로를 사용하여 variantExpr 에서 추출한 필드를 반환합니다. |
is_variant_null(variantExpr) | 테스트 variantExpr 가 VARIANT 로 인코딩된 NULL 인지 여부를 확인합니다. |
parse_json(jsonStr) | jsonStr 에서 VARIANT 값을 반환합니다. |
schema_of_variant(variantExpr) | VARIANT 식의 스키마를 DDL 형식으로 반환합니다. |
schema_of_variant_agg(variantExpr) | 그룹에 있는 모든 VARIANT 값의 결합된 스키마를 DDL 형식으로 반환합니다. |
to_json(expr[, options]) | expr 에 지정된 STRUCT 또는 VARIANT 가 포함된 JSON 문자열을 반환합니다. |
try_parse_json(jsonStr) | jsonStr 가 가능한 경우 VARIANT 값을 반환합니다. NULL 가 가능 하지 않은 경우 반환됩니다. |
try_variant_get(variantExpr,path,type) | 대상 형식으로 형변환할 수 없는 경우 path 또는 NULL 로 지정된 variantExpr 에서 type 형식의 값을 추출합니다. |
variant_explode(variantExpr) | variantExpr 의 중첩을 해제하여 행 집합을 반환합니다. |
variant_explode_outer(variantExpr) | 외부 의미 체계를 사용하는 variantExpr 의 중첩을 해제하여 행 집합을 반환합니다. |
variant_get(variantExpr,path,type) | path 가 지정한 variantExpr 에서 type 유형의 값을 추출합니다. |
XPath 및 XML 함수
함수 | 설명 |
---|---|
from_xml(xmlStr, schema[, options]) | schema 를 사용하여 xmlStr 에서 구문 분석된 구조체 값을 반환합니다. |
schema_of_xml(xmlStr[, options]) | XML 문자열의 스키마를 DDL 형식으로 반환합니다. |
xpath(xml, xpath) | xpath 와 일치하는 xml 노드 내의 값을 반환합니다. |
xpath_boolean(xml, xpath) | xpath 식이 true 로 평가되거나 xml 에서 일치하는 노드가 있으면 true 를 반환합니다. |
xpath_double(xml, xpath) | XML 문서에서 DOUBLE 값을 반환합니다. |
xpath_float(xml, xpath) | XML 문서에서 FLOAT 값을 반환합니다. |
xpath_int(xml, xpath) | XML 문서에서 INTEGER 값을 반환합니다. |
xpath_long(xml, xpath) | XML 문서에서 BIGINT 값을 반환합니다. |
xpath_number(xml, xpath) | XML 문서에서 DOUBLE 값을 반환합니다. |
xpath_short(xml, xpath) | XML 문서에서 SHORT 값을 반환합니다. |
xpath_string(xml, xpath) | XPath 식과 일치하는 첫 번째 XML 노드의 콘텐츠를 반환합니다. |
AI 함수
함수 | 설명 |
---|---|
ai_analyze_sentiment(content) | 텍스트의 감정을 반환합니다. |
ai_classify(content, labels) | 제공된 콘텐츠를 제공된 레이블 중 하나로 분류합니다. |
ai_extract(content, labels) | 지정된 텍스트에서 레이블로 지정된 엔터티를 추출합니다. |
ai_fix_grammar(content) | 지정된 텍스트의 문법 오류를 수정합니다. |
ai_forecast(observed, time_col) | 시계열 데이터를 미래로 내세울 수 있습니다. |
ai_gen(content) | Databricks Foundation 모델 API에서 최첨단 생성 AI 모델을 호출하여 사용자가 제공한 프롬프트에 응답합니다. |
ai_generate_text(prompt, modelName[, param1, value1] [...]) | 사용되지 않음: 프롬프트가 지정된 경우 선택한 LLM(큰 언어 모델)에서 생성된 텍스트를 반환합니다. |
ai_mask(콘텐츠, 레이블) | 지정된 텍스트 내에서 지정된 엔터티를 마스크합니다. |
ai_query(endpointName, request, returnType) | 엔드포인트를 제공하는 기존 Mosaic AI 모델을 호출하고 해당 응답을 구문 분석하고 반환합니다. |
ai_similarity(strExpr1, strExpr2) | 두 문자열을 비교하고 의미 체계 유사성 점수를 계산합니다. |
ai_summarize(content[, max_words]) | 지정된 텍스트의 요약을 생성합니다. |
ai_translate(콘텐츠, to_lang) | 텍스트를 지정된 대상 언어로 변환합니다. |
vector_search(인덱스, 쿼리, num_results) | SQL을 사용하여 Mosaic AI Vector Search 인덱스 쿼리 |
Read 함수
함수 | 설명 |
---|---|
read_files(path, [optionKey => optionValue] [, ...]) | 클라우드 스토리지에서 데이터 파일을 읽고 테이블 형식으로 반환합니다. |
read_kafka([optionKey => optionValue] [, ...]) | Apache Kafka 클러스터에서 레코드를 읽고 테이블 형식으로 반환합니다. |
read_kinesis({parameter => value} [, ...]) | 하나 이상의 스트림에서 Kinesis에서 읽은 레코드가 있는 테이블을 반환합니다. |
read_pubsub([parameter => value] [, ...]) | 토픽의 Pub/Sub에서 레코드를 읽는 테이블 반환 함수입니다. |
read_pulsar({optionKey => optionValue} [, ...]) | Pulsar에서 읽은 레코드가 있는 테이블을 반환합니다. |
read_state_metadata(path) | 스트리밍 쿼리 상태의 메타데이터를 나타내는 행이 있는 테이블을 반환합니다. |
read_statestore(path [, option_key => option_value] [...]) | 스트리밍 쿼리의 상태 저장소에서 레코드를 반환합니다. |
기타 함수
함수 | 설명 |
---|---|
assert_true(expr) | expr 이 true가 아니면 오류를 반환합니다. |
CASE expr { WHEN opt1 THEN res1 } […] [ELSE def] END | expr 과 같은 첫 번째 optN 에 대해 resN 을 반환하거나 일치하는 항목이 없으면 def 를 반환합니다. |
CASE { WHEN cond1 THEN res1 } […] [ELSE def] END | true로 평가되는 첫 번째 condN 에 대한 resN 을 반환하거나 해당 항목이 없으면 def 를 반환합니다. |
cloud_files_state( { TABLE(table) | checkpoint } ) | 자동 로더 cloud_files 원본의 파일 수준 상태를 반환합니다. |
coalesce(expr1, expr2 [, …]) | Null이 아닌 첫 번째 인수를 반환합니다. |
cube (expr1 [, …]) | 지정된 식 열을 사용하여 다차원 큐브를 만듭니다. |
current_catalog() | 현재 카탈로그를 반환합니다. |
current_database() | 현재 스키마를 반환합니다. |
current_metastore() | 현재 Unity Catalog 메타스토어 ID를 반환합니다. |
current_recipient(키) | Delta 공유와 공유된 보기에서 현재 받는 사람의 속성을 반환합니다. |
current_schema() | 현재 스키마를 반환합니다. |
current_user() | 문을 실행하는 사용자를 반환합니다. |
current_version() | 현재 버전의 Azure Databricks를 반환합니다. |
decode(expr, { key, value } [, …] [,defValue]) | 키와 일치하는 값을 반환합니다. |
elt(index, expr1 [, …] ) | nth 식을 반환합니다. |
equal_null(expr1, expr2) | expr1 가 expr2 와 같거나 두 식이 모두 NULL 이면 true 를 반환합니다. 그렇지 않으면 false 를 반환합니다. |
event_log( { TABLE(table) | pipeline_id } ) | 구체화된 뷰, 스트리밍 테이블 또는 DLT 파이프라인에 대한 새로 고침 기록 테이블을 반환합니다. |
greatest(expr1, expr2 [, …]) | 모든 인수 중에서 null 값을 건너뛰고 가장 큰 값을 반환합니다. |
grouping(col) | GROUPING SET , ROLLUP 또는 CUBE 에 지정된 열이 부분합을 나타내는지 여부를 나타냅니다. |
grouping_id([col1 [, …]]) | 열 집합에 대한 그룹화 수준을 반환합니다. |
hash(expr1 [, …]) | 인수의 해시 값을 반환합니다. |
hll_sketch_estimate(expr) | HyperLogLog 스케치에서 수집된 고유 값의 수를 예측합니다. |
hll_union(expr1, expr2 [,allowDifferentLgConfigK]) | 두 개의 HyperLogLog 스케치를 결합합니다. |
java_method(class, method[, arg1 [, …]]) | 리플렉션을 사용하여 메서드를 호출합니다. |
if(cond, expr1, expr2) | cond 이 true 인 경우 expr1 를 반환하거나 그렇지 않으면 expr2 을 반환합니다. |
iff(cond, expr1, expr2) | cond 이 true 인 경우 expr1 를 반환하거나 그렇지 않으면 expr2 을 반환합니다. |
ifnull(expr1, expr2) | expr1 이 NULL 인 경우 expr2 를 반환하거나 그렇지 않으면 expr1 을 반환합니다. |
input_file_block_length() | 읽는 블록의 길이(바이트)를 반환합니다. |
input_file_block_start() | 읽고 있는 블록의 시작 오프셋을 바이트 단위로 반환합니다. |
input_file_name() | 읽고 있는 파일의 이름을 반환하거나, 사용할 수 없는 경우 빈 문자열을 반환합니다. |
is_account_group_member(group) | 현재 사용자가 계정 수준에서 그룹의 멤버인 경우 true를 반환합니다. |
is_member(group) | 현재 사용자가 작업 영역 수준에서 그룹의 멤버인 경우 true를 반환합니다. |
isnull(expr) | expr 가 NULL 이면 true 를 반환합니다. |
isnotnull(expr) | expr 이 NULL 이 아니면 true 를 반환합니다. |
least(expr1, expr2 [, …]) | 모든 인수 중에서 null 값을 건너뛰고 가장 작은 값을 반환합니다. |
list_secrets([scopeStr]) | 사용자가 Databricks 비밀 서비스에서 볼 수 있는 권한이 있는 전체 또는 하나의 범위의 키를 반환합니다. |
luhn_check(numStr) | numStr 가 Luhn 알고리즘 검사를 통과하면 true 를 반환합니다. |
monotonically_increasing_id() | 단조롭게 증가하는 64비트 정수를 반환합니다. |
nullif(expr1, expr2) | expr1 이 expr2 와 같으면 NULL 을 반환하고, 그렇지 않으면 expr1 을 반환합니다. |
nvl(expr1, expr2) | expr1 이 NULL 인 경우 expr2 를 반환하거나 그렇지 않으면 expr1 을 반환합니다. |
nvl2(expr1, expr2, expr3) | expr1 이 NULL 이 아닌 경우 expr2 를 반환하거나 그렇지 않으면 expr3 을 반환합니다. |
raise_error(expr) | expr 을 메시지로 사용하여 예외를 throw합니다. |
range(end) | 지정된 범위 내의 값 테이블을 반환합니다. |
range(start, end [, step [, numParts]]) | 지정된 범위 내의 값 테이블을 반환합니다. |
reflect(class, method[, arg1 [, …]]) | 리플렉션을 사용하여 메서드를 호출합니다. |
secret(scope, key) | Databricks 비밀 서비스에서 지정된 scope 및 key 로 비밀 값을 추출합니다. |
session_user() | Azure Databricks에 연결된 사용자를 반환합니다. |
spark_partition_id() | 현재 파티션 ID를 반환합니다. |
sql_keywords() | Azure Databricks에서 SQL 키워드 집합을 반환합니다. |
stack(numRows, expr1 [, …]) | expr1 , …, exprN 을 numRows 개 행으로 구분합니다. |
table_changes(table_str, start [, end]) | 변경 데이터 피드를 사용하도록 설정된 Delta Lake 테이블에 대한 변경 로그를 반환합니다. |
try_reflect(class, method[, arg1 [, …]]) | 리플렉션을 사용하여 메서드를 호출하고 NULL 메서드가 실패하면 반환합니다. |
try_secret(scope, key) | Databricks 비밀 서비스에서 주어진 scope 와 key 를 사용하여 비밀 값을 추출하거나 키를 검색할 수 없는 경우 NULL 를 추출합니다. |
typeof(expr) | expr 데이터 형식에 대한 DDL 형식 문자열을 반환합니다. |
user() | 문을 실행하는 사용자를 반환합니다. |
uuid() | UUID(범용 고유 식별자) 문자열을 반환합니다. |
window(expr, width[, step [, start]]) | 타임스탬프 식에 대해 도약 기반 슬라이딩 윈도우를 만듭니다. |
xxhash64(expr1 [, …]) | 인수의 64비트 해시 값을 반환합니다. |
version() | Apache Spark 버전을 반환합니다. |