다음을 통해 공유


기본 제공 함수

적용 대상: 예로 표시된 확인 Databricks SQL 예로 표시된 확인 Databricks Runtime

이 문서에서는 문자열 및 이진 유형, 숫자 스칼라, 집계, 창, 배열, 지도, 날짜 및 타임스탬프, 캐스팅, CSV 데이터, JSON 데이터, XPath 조작 및 기타 기타 함수에 대한 기본 제공 연산자 및 함수에 대한 링크와 설명을 설명합니다.

정보 로깅 수준이 비활성화되어 있는 경우 클라이언트가 서버와 상태를 올바르게 동기화할 수 없는 오류를 수정했습니다. 사용자 정의 함수(UDF)란 무엇인가요?을 참조하세요.

또한 다음을 참조하세요.

연산자 및 조건자

서로에 대해 연산자를 구문 분석하는 방법에 대한 자세한 내용은 연산자 우선 순위를 참조하세요.

연산자 구문 설명
& expr1 & expr2 expr1expr2의 비트 AND을 반환합니다.
and expr1 and expr2 expr1expr2의 논리적 AND을 반환합니다.
* multiplier * multiplicand multipliermultiplicand를 곱한 값을 반환합니다.
!= expr1 != expr2 expr1expr2와 같지 않으면 true를 반환하고, 그렇지 않으면 false를 반환합니다.
! !expr 부울 식의 논리적 NOT을 반환합니다.
between expr1 [not] between expr2 and expr2 expr1expr2보다 크거나 같은지, expr3보다 작거나 같은지 테스트합니다.
[ ] arrayExpr [ indexExpr ] ARRAY arrayExpr의 요소 indexExprnd를 반환합니다.
[ ] mapExpr [ keyExpr ] MAP mapExprkeyExpr에서 값을 반환합니다.
^ expr1 ^ expr2 expr1expr2의 배타적 비트 OR (XOR)을 반환합니다.
: jsonStr : jsonPath jsonStr에서 추출된 필드를 반환합니다.
:: expr :: type expr을 대상 데이터 형식 type으로 캐스트합니다.
?:: expr ?:: type 가능하면 목표 데이터 유형 type에 값 expr를 캐스팅하고 그렇지 않으면 NULL를 반환합니다.
div dividend div divisor dividenddivisor로 나눈 값의 정수 부분을 반환합니다.
. mapExpr . keyIdentifier keyIdentifier에서 MAP 값을 반환합니다.
. structExpr . fieldIdentifier fieldIdentifier에서 STRUCT 필드를 반환합니다.
== expr1 == expr2 expr1expr2와 같으면 true을 반환하고, 그렇지 않으면 false을 반환합니다.
= expr1 = expr2 expr1expr2와 같으면 true을 반환하고, 그렇지 않으면 false을 반환합니다.
>= expr1 >= expr2 expr1expr2보다 크거나 같으면 true를 반환하고, 그렇지 않으면 false를 반환합니다.
> expr1 > expr2 expr1expr2보다 크면 true를 반환하고, 그렇지 않으면 false를 반환합니다.
exists exists(query) query에서 하나 이상의 행을 반환하면 true를 반환하고, 그렇지 않으면 false를 반환합니다.
ilike str [not] ilike (pattern[ESCAPE escape]) str이 대/소문자를 구분하지 않고 patternescape가 일치하지 않으면 true를 반환합니다.
ilike str [not] ilike {ANY\|SOME\|ALL}([pattern[, ...]]) str이 대/소문자를 구분하지 않고 일부/모든 패턴과 일치하지 않으면 true를 반환합니다.
in elem [not] in (expr1[, ...]) elemexprN과 같지 않으면 true를 반환합니다.
in elem [not] in (query) elemquery의 행과 같지 않으면 true를 반환합니다.
is distinct expr1 is [not] distinct from expr2 인수에 NULL이 비교 가능한 값으로 간주되는 다른 값이 있는지 여부를 테스트합니다.
is false expr is [not] false exprfalse인지 여부를 테스트합니다.
is null expr is [not] null exprNULL인지 여부에 관계없이 true를 반환합니다.
is true expr is [not] true exprtrue인지 여부를 테스트합니다.
like str [not] like (pattern[ESCAPE escape]) strpatternescape가 일치하지 않으면 true를 반환합니다.
like str [not] like {ANY\|SOME\|ALL}([pattern[, ...]]) str이 일부/모든 패턴과 일치하지 않으면 true를 반환합니다.
<=> expr1 <=> expr2 null이 아닌 피연산자의 경우 EQUAL(=)과 동일한 결과를 반환하지만, 둘 다 NULL이면 true를 반환하고 둘 중 하나가 NULL이면 false를 반환합니다.
<= expr1 <= expr2 expr1expr2보다 작거나 같으면 true를 반환하고, 그렇지 않으면 false를 반환합니다.
<> expr1 <> expr2 expr1expr2와 같지 않으면 true를 반환하고, 그렇지 않으면 false를 반환합니다.
< expr1 < expr2 expr1expr2보다 작으면 true를 반환하고 그렇지 않으면 false를 반환합니다.
- expr1 - expr2 expr1에서 expr2를 뺀 값을 반환합니다.
not not expr 부울 식의 논리적 NOT을 반환합니다.
or expr1 or expr2 expr1expr2의 논리적 OR을 반환합니다.
% dividend % divisor dividend / divisor 이후의 나머지를 반환합니다.
|| expr1 \|\| expr2 expr1expr2의 연결을 반환합니다.
| expr1 \| expr2 expr1expr2의 비트 OR을 반환합니다.
+ expr1 + expr2 expr1expr2의 합계를 반환합니다.
regexp str [not] regexp regex strregex와 일치하지 않으면 true를 반환합니다.
regexp_like str [not] regexp_like regex strregex와 일치하지 않으면 true를 반환합니다.
rlike str [not] rlike regex strregex와 일치하지 않으면 true를 반환합니다.
/ dividend / divisor divisor로 나눈 dividend 값을 반환합니다.
~ ~ expr expr의 비트 단위 NOT을 반환합니다.

연산자 우선 순위

우선 순위 연산자
1 :, ::, ?::[ ]
2 -(단항), +(단항), ~
3 *, /, %div
4 +, , -\|\|
5 &
6 ^
7 \|
8 =,==, <=>, <>, !=, <<=, >>=
9 not, exists
10 between, in, rlike, regexp, ilike, like, is [not] [NULL, true, false]is [not] distinct from
11 and
12 or

문자열 및 이진 함수

함수 설명
expr1 || expr2 expr1expr2의 연결을 반환합니다.
aes_decrypt(expr, key[, mode[, padding[, aad]]]) AES 암호화를 사용하여 expr 이진 파일의 암호를 해독합니다.
aes_encrypt(expr, key[, mode[, padding[, iv[, aad]]]]) AES 암호화를 사용하여 expr 이진 파일을 암호화합니다.
ascii(str) str의 첫 번째 문자에 대한 ASCII 코드 포인트를 반환합니다.
base64(expr) expr을 기본 64 문자열로 변환합니다.
bin(expr) expr의 이진 표현을 반환합니다.
binary(expr) expr의 값을 BINARY로 캐스팅합니다.
bit_length(expr) 문자열 데이터의 비트 길이 또는 이진 데이터의 비트 수를 반환합니다.
bitmap_count(expr) 비트맵을 나타내는 BINARY 문자열에 설정된 비트 수를 반환합니다.
btrim(str [, trimStr]) 선행 및 후행 문자가 제거된 str을 반환합니다.
char(expr) 제공된 UTF-16 코드 포인트에 있는 문자를 반환합니다.
char_length(expr) 문자열 데이터의 문자 길이 또는 이진 파일 데이터의 바이트 수를 반환합니다.
character_length(expr) 문자열 데이터의 문자 길이 또는 이진 파일 데이터의 바이트 수를 반환합니다.
charindex(substr, str[, pos]) pos 위치 다음의 str에서 substr이 처음 나타나는 위치를 반환합니다.
chr(expr) 제공된 UTF-16 코드 포인트에 있는 문자를 반환합니다.
concat(expr1, expr2[, …]) 인수의 연결을 반환합니다.
concat_ws(sep[, expr1[, …]]) sep로 구분된 연결 문자열을 반환합니다.
contains(expr, subExpr) expr STRING 또는 BINARYsubExpr가 포함되어 있으면 true를 반환합니다.
crc32(expr) expr의 순환 중복 검사 값을 반환합니다.
decode(expr, charSet) 문자 집합 인코딩 charSet를 사용하여 이진 expr을 문자열로 변환합니다.
encode(expr, charSet) charSet 문자 인코딩을 사용하여 문자열의 이진 표현을 반환합니다.
endswith(expr, endExpr) expr STRING 또는 BINARYendExpr로 끝나면 true를 반환합니다.
find_in_set(searchExpr, sourceExpr) 쉼표로 구분된 문자열 목록 내의 문자열 위치를 반환합니다.
format_number(expr, scale) expr의 형식이 scale 소수 자릿수로 반올림되는 #,###,###.##과 같습니다.
format_number(expr, fmt) expr의 형식이 fmt과 같습니다.
format_string(strfmt[, obj1 [, …]]) printf 스타일 형식 문자열의 형식 문자열을 반환합니다.
hex(expr) expr을 16진수로 변환합니다.
str ilike (pattern[ESCAPE escape]) str이 대/소문자를 구분하지 않고 escape가 있는 pattern과 일치하면 true를 반환합니다.
initcap(expr) 각 단어의 첫 글자가 대문자인 expr을 반환합니다.
instr(str, substr) str에서 substr의 첫 번째 항목에 대한 인덱스(1부터 시작)를 반환합니다.
lcase(expr) 모든 문자가 소문자로 변경된 expr을 반환합니다.
left(str, len) str에서 맨 왼쪽 len 문자를 반환합니다.
len(expr) 문자열 데이터의 문자 길이 또는 이진 파일 데이터의 바이트 수를 반환합니다.
length(expr) 문자열 데이터의 문자 길이 또는 이진 파일 데이터의 바이트 수를 반환합니다.
levenshtein(str1, str2) str1str2 문자열 사이의 Levenshtein 거리를 반환합니다.
str like (pattern[ESCAPE escape]) strpatternescape가 일치하면 true를 반환합니다.
locate(substr, str[, pos]) pos 위치 다음의 str에서 substr이 처음 나타나는 위치를 반환합니다.
lower(expr) 모든 문자가 소문자로 변경된 expr을 반환합니다.
lpad(expr, len[, pad]) 길이가 lenpad로 왼쪽 패딩된 expr을 반환합니다.
ltrim([trimstr,] str) trimStr이 제거된 선행 문자를 사용하여 str을 반환합니다.
mask(str[, upperChar[, lowerChar[, digitChar[, otherChar]]]]) 마스킹된 버전의 입력 str을 반환합니다.
md5(expr) expr의 MD5 128비트 체크섬을 16진수 문자열로 반환합니다.
octet_length(expr) 문자열 데이터의 바이트 길이 또는 이진 데이터의 바이트 수를 반환합니다.
overlay(input PLACING replace FROM pos [FOR len]) pos에서 시작되고 길이가 lenreplaceinput을 바꿉니다.
parse_url(url, partToExtract[, key]) url에서 일부를 추출합니다.
position(substr, str[, pos]) pos 위치 다음의 str에서 substr이 처음 나타나는 위치를 반환합니다.
position(subtr IN str) pos 위치 다음의 str에서 substr이 처음 나타나는 위치를 반환합니다.
printf(strfmt[, obj1 [, …]]) printf 스타일 형식 문자열의 형식 문자열을 반환합니다.
str regexp regex strregex와 일치하면 true를 반환합니다.
str regexp_like regex strregex와 일치하면 true를 반환합니다.
regexp_count(str, regexp) strregexp 패턴과 일치하는 횟수를 반환합니다.
regexp_extract(str, regexp[, idx]) str에서 regexp 식과 일치하고 regex 그룹 인덱스에 해당하는 첫 번째 문자열을 추출합니다.
regexp_extract_all(str, regexp[, idx]) regexp 식과 일치하고 regex 그룹 인덱스에 해당하는 str의 모든 문자열을 추출합니다.
regexp_instr(str, regexp) regexp와 일치하는 str의 첫 번째 하위 문자열 위치를 반환합니다.
regexp_replace(str, regexp, rep[, position]) regexp와 일치하는 str의 모든 부분 문자열을 rep로 대체합니다.
regexp_substr(str, regexp) regexp와 일치하는 str의 첫 번째 하위 문자열을 반환합니다.
repeat(expr, n) expr n를 여러 번 반복하는 문자열을 반환합니다.
바꾸기(str, search [, replace]) search의 모든 항목을 replace로 바꿉니다.
reverse(expr) 반전된 문자열 또는 요소의 순서가 반전된 배열을 반환합니다.
right(str, len) 문자열 str에서 가장 오른쪽에 있는 len 문자를 반환합니다.
str rlike regex strregex와 일치하면 true를 반환합니다.
rpad(expr, len[, pad]) 길이가 lenpad로 오른쪽 패딩된 expr을 반환합니다.
rtrim([trimStr,] str) 후행 문자가 제거된 str을 반환합니다.
sentences(str[, lang, country]) str을 단어 배열의 배열로 분할합니다.
sha(expr) sha1 해시 값을 expr의 16진수 문자열로 반환합니다.
sha1(expr) sha1 해시 값을 expr의 16진수 문자열로 반환합니다.
sha2(expr, bitLength) SHA-2 제품군의 체크섬을 expr의 16진수 문자열로 반환합니다.
soundex(expr) 문자열의 soundex 코드를 반환합니다.
space(n) n개의 공백으로 구성된 문자열을 반환합니다.
split(str, regex[, limit]) regex와 일치하는 항목을 중심으로 str을 분할하고 길이가 최대 limit인 배열을 반환합니다.
split_part(str, delim, partNum) delim의 발생 항목을 기준으로 str을 분할하고 partNum 파트를 반환합니다.
startswith(expr, startExpr) expr STRING 또는 BINARYstartExpr로 시작하면 true를 반환합니다.
string(expr) exprSTRING로 캐스팅합니다.
substr(expr, pos[, len]) pos에서 시작되고 길이가 lenexpr의 하위 문자열을 반환합니다.
substr(expr FROM pos[ FOR len]) pos에서 시작되고 길이가 lenexpr의 하위 문자열을 반환합니다.
substring(expr, pos[, len]) pos에서 시작되고 길이가 lenexpr의 하위 문자열을 반환합니다.
substring(expr FROM pos[ FOR len]) pos에서 시작되고 길이가 lenexpr의 하위 문자열을 반환합니다.
substring_index(expr, delim, count) 구분 기호 delimcount개 발생하기 전에 expr의 부분 문자열을 반환합니다.
to_binary(expr[, fmt]) fmt에 따라 이진 파일로 캐스팅된 expr를 반환합니다.
to_char(numExpr, fmt) fmt 형식을 사용하여 numExprSTRING로 반환합니다.”
to_varchar(numExpr, fmt) fmt 형식을 사용하여 numExprSTRING로 반환합니다.”
translate(expr, from, to) from의 모든 문자를 to의 문자로 바꾼 expr을 반환합니다.
trim([[BOTH | LEADING | TRAILING] [trimStr] FROM] str) 문자열에서 문자를 자릅니다.
try_aes_decrypt(expr, key[, mode[, padding[, aad]]]) AES 암호화를 사용하여 이진 expr를 복호화하고 오류가 있는 경우 NULL를 반환합니다.
try_to_binary(expr [, fmt]) 입력이 유효하지 않으면 fmt를 기준으로 exprBINARY로, 입력이 유효하지 않으면 NULL로 형변환하여 반환합니다.
try_url_decode(str) application/x-www-form-urlencoded 형식에서 문자열을 다시 변환하고 오류가 있는 경우 NULL를 반환합니다.
try_zstd_decompress(value) Zstandard 압축으로 압축 해제된 값을 반환하거나 입력이 유효하지 않은 경우 NULL를 반환합니다.
ucase(expr) 모든 문자가 대문자로 변경된 expr을 반환합니다.
unbase64(expr) 디코딩된 base64 문자열을 이진 형식으로 반환합니다.
unhex(expr) 16진수 exprBINARY로 변환합니다.
upper(expr) 모든 문자가 대문자로 변경된 expr을 반환합니다.
url_decode(str) 문자열을 application/x-www-form-urlencoded 형식에서 다시 변환합니다.
url_encode(str) 문자열을 application/x-www-form-urlencoded 형식으로 변환합니다.
zstd_compress (value[,level[,streaming_mode]]) Zstandard 압축을 사용하여 압축된 값을 반환합니다.
zstd_decompress(value) Zstandard 압축으로 압축 해제된 값을 반환합니다.

숫자 스칼라 함수

함수 설명
~ expr expr의 비트 단위 NOT을 반환합니다.
dividend / divisor divisor로 나눈 dividend 값을 반환합니다.
expr1 | expr2 expr1expr2의 비트 OR을 반환합니다.
- expr expr의 부정 값을 반환합니다.
expr1 - expr2 expr1에서 expr2를 뺀 값을 반환합니다.
+ expr expr의 값을 반환합니다.
expr1 + expr2 expr1expr2의 합계를 반환합니다.
dividend % divisor dividend / divisor 이후의 나머지를 반환합니다.
expr1 ^ expr2 expr1expr2의 배타적 비트 OR (XOR)을 반환합니다.
expr1 & expr2 expr1expr2의 비트 AND을 반환합니다.
multiplier * multiplicand multipliermultiplicand를 곱한 값을 반환합니다.
abs(expr) expr에서 숫자 값의 절대값을 반환합니다.
acos(expr) expr의 역 코사인(아크코사인)을 반환합니다.
acosh(expr) expr의 역쌍곡 코사인 값을 반환합니다.
asin(expr) expr의 역사인(아크사인) 값을 반환합니다.
asinh(expr) expr의 하이퍼볼릭 역 사인 값을 반환합니다.
atan(expr) expr의 역탄젠트(아크탄젠트)를 반환합니다.
atan2(exprY, exprX) 평면의 양의 x축과 좌표(exprX, exprY)로 지정된 점 사이의 각도를 라디안 단위로 반환합니다.
atanh(expr) expr의 하이퍼볼릭 역 탄젠트 값을 반환합니다.
bigint(expr) exprBIGINT로 캐스팅합니다.
bit_count(expr) 인수에 설정된 비트 수를 반환합니다.
bit_get(expr, pos) 정수 숫자의 이진 표현에서 비트 값을 반환합니다.
bit_reverse(expr) 인수의 비트 순서를 반대로 하여 얻은 값을 반환합니다.
bitmap_bit_position(expr) 버킷 내에서 주어진 BIGINT 숫자의 0 기준 비트 위치를 반환합니다.
bitmap_bucket_number(expr) 주어진 BIGINT 숫자에 대한 비트맵 버킷 번호를 반환합니다.
bround(expr[,targetScale]) HALF_EVEN 반올림 모드를 사용하여 반올림된 expr을 반환합니다.
cbrt(expr) expr의 세제곱근을 반환합니다.
ceil(expr[,targetScale]) 소수점을 기준으로 targetScale자리까지 반올림된 expr보다 작지 않으면서, 가장 작은 수를 반환합니다.
ceiling(expr[,targetScale]) 소수점을 기준으로 targetScale자리까지 반올림된 expr보다 작지 않으면서, 가장 작은 수를 반환합니다.
conv(num, fromBase, toBase) numfromBase에서 toBase로 변환합니다.
convert_timezone([sourceTz, ]targetTz, sourceTs) sourceTz 시간대의 TIMESTAMP_NTZ sourceTstargetTz로 변환합니다.
cos(expr) expr의 코사인을 반환합니다.
cosh(expr) expr의 하이퍼볼릭 코사인을 반환합니다.
cot(expr) expr의 코탄젠트를 반환합니다.
csc(expr) expr의 코시컨트를 반환합니다.
decimal(expr) exprDECIMAL로 캐스팅합니다.
degrees(expr) 라디안을 도로 변환합니다.
divisor div dividend divisordividend로 나눈 값의 정수 부분을 반환합니다.
double(expr) exprDOUBLE로 캐스팅합니다.
e() e 상수를 반환합니다.
exp(expr) eexpr제곱을 반환합니다.
expm1(expr) exp(expr) - 1을(를) 반환합니다.
factorial(expr) expr의 계승을 반환합니다.
float(expr) exprFLOAT로 캐스팅합니다.
floor(expr[,targetScale]) 소수점을 기준으로 targetScale자리까지 반올림하여 expr보자 작지 않은 가장 큰 수를 반환합니다.
getbit(expr, pos) 정수 숫자의 이진 표현에서 비트 값을 반환합니다.
hypot(expr1, expr2) sqrt(expr1 * expr1 + expr2 * expr2)을(를) 반환합니다.
int(expr) exprINTEGER로 캐스팅합니다.
isnan(expr) exprNaN이면 true를 반환합니다.
ln(expr) expr의 자연 로그(밑 e)를 반환합니다.
log([base,] expr) base를 사용하여 expr의 로그를 반환합니다.
log1p(expr) log(1 + expr)을(를) 반환합니다.
log2(expr) 밑이 2expr의 로그를 반환합니다.
log10(expr) 밑이 10expr의 로그를 반환합니다.
mod(dividend, divisor) dividend / divisor 이후의 나머지를 반환합니다.
nanvl(expr1, expr2) NaN이 아니면 expr1을 반환하고, 그렇지 않으면 expr2를 반환합니다.
negative(expr) expr의 부정 값을 반환합니다.
'nullifzero(expr)' expr 0 NULL 이 아니면 반환합니다.
pi() pi를 반환합니다.
pmod(dividend, divisor) dividend / divisor 이후의 양수 나머지를 반환합니다.
positive(expr) expr의 값을 반환합니다.
pow(expr1, expr2) 지수가 expr2expr1의 거듭제곱을 계산합니다.
power(expr1, expr2) 지수가 expr2expr1의 거듭제곱을 계산합니다.
radians(expr) 도 단위 expr을 라디안으로 변환합니다.
rand([seed]) 0에서 1 사이의 임의 값을 반환합니다.
randn([seed]) 표준 정규 분포에서 임의 값을 반환합니다.
random([seed]) 0에서 1 사이의 임의 값을 반환합니다.
rint(expr) expr를 정수로 반올림하여 DOUBLE로 반환합니다.
round(expr[,targetScale]) HALF_UP 반올림 모드를 사용하여 반올림된 expr을 반환합니다.
sec(expr) expr의 시컨트를 반환합니다.
shiftleft(expr, n) n 비트 단위로 왼쪽으로 이동한 비트를 반환합니다.
shiftright(expr, n) n비트만큼 오른쪽으로 이동한 비트 부호 있는 부호 있는 정수를 반환합니다.
shiftrightunsigned(expr, n) n비트로 오른쪽으로 이동된 비트 부호 없는 부호 있는 정수를 반환합니다.
sign(expr) expr이 음수, 0 또는 양수이므로 -1.0, 0.0 또는 1.0을 반환합니다.
signum(expr) expr이 음수, 0 또는 양수이므로 -1.0, 0.0 또는 1.0을 반환합니다.
sin(expr) expr의 사인을 반환합니다.
sinh(expr) expr의 하이퍼볼릭 사인을 반환합니다.
smallint(expr) exprSMALLINT로 캐스팅합니다.
sqrt(expr) expr의 제곱근을 반환합니다.
tan(expr) expr의 탄젠트를 반환합니다.
tanh(expr) expr의 하이퍼볼릭 탄젠트를 반환합니다.
tinyint(expr) expr에서 TINYINT로 캐스트.
to_number(expr, fmt ) fmt 형식을 사용하여 exprDECIMAL로 반환합니다.
try_add(expr1, expr2) expr1expr2의 합계 또는 오류가 있는 경우 NULL를 반환합니다.
try_divide(dividend, divisor) dividenddivisor로 나눈 값 또는 divisor가 0이면 NULL를 반환합니다.
try_mod(dividend, divisor) dividend / divisor를 제외한 나머지를 반환하거나 divisor가 0이면 NULL를 반환합니다.
try_multiply(multiplier, multiplicand) multipliermultiplicand의 곱 또는 오버플로의 NULL을 반환합니다.
try_subtract(expr1, expr2) expr1에서 expr2를 뺀 값이나, 오버플로에 대해 NULL을 반환합니다.
try_to_number(expr, fmt ) 형식 fmt를 사용하여 exprDECIMAL로 변환하거나, expr가 형식과 일치하지 않으면 NULL로 변환합니다.
width_bucket(expr, minExpr, maxExpr, numBuckets) 등 너비 히스토그램의 값에 대한 버킷 번호를 반환합니다.
'zeroifnull(expr)' 그렇지 않은 경우 반환하거나 0 그렇지 않은 NULL경우 반환 expr 합니다.

집계 함수

함수 설명
any(expr) 그룹에서 expr의 값 중 하나 이상이 true이면 true를 반환합니다.
any_value(expr[,ignoreNull]) 행 그룹에 대한 expr의 일부 값을 반환합니다.
approx_count_distinct(expr[,relativeSD]) 그룹 내의 expr에서 예상 고유 값 수를 반환합니다.
approx_percentile(expr,percentage[,accuracy]) 그룹 내 expr의 백분위수 근사치를 반환합니다.
approx_top_k(expr[,k[,maxItemsTracked]]) 대략적인 개수와 함께 expr에서 가장 자주 발생하는 상위 k 항목 값을 반환합니다.
array_agg(expr) 그룹 내 expr의 모든 값으로 구성된 배열을 반환합니다.
avg(expr) 그룹의 값에서 계산된 평균을 반환합니다.
bit_and(expr) 그룹 내 모든 입력 값의 비트 단위 AND를 반환합니다.
bit_or(expr) 그룹 내 모든 입력 값의 비트 단위 OR를 반환합니다.
bit_xor(expr) 그룹 내 모든 입력 값의 비트 단위 XOR를 반환합니다.
bitmap_construct_agg(expr) 그룹에 있는 모든 비트 위치 값의 비트 단위 OR를 반환합니다. 그룹에서 0에서 32767 사이의 값을 BINARY로 지정합니다.
bitmap_or_agg(expr) 그룹에 있는 모든 BINARY 입력 값의 비트 단위 OR를 반환합니다.
bool_and(expr) 그룹 내에서 expr의 모든 값이 true이면 true를 반환합니다.
bool_or(expr) 그룹 내에서 expr에 하나 이상의 값이 true이면 true를 반환합니다.
collect_list(expr) 그룹 내 expr의 모든 값으로 구성된 배열을 반환합니다.
collect_set(expr) 그룹 내 expr의 모든 고유 값으로 구성된 배열을 반환합니다.
corr(expr1,expr2) 숫자 쌍 그룹 간의 피어슨 상관 관계 계수를 반환합니다.
count(*) null이 있는 행을 포함하여 그룹에서 검색된 총 행 수를 반환합니다.
count(expr[, …]) 제공된 식이 모두 null이 아닌 그룹의 행 수를 반환합니다.
count_if(expr) expr의 그룹에 대한 true 값의 수를 반환합니다.
count_min_sketch(column,epsilon,confidence,seed) epsilon, confidenceseed를 사용하여 column에서 그룹의 모든 값에 대한 최소 개수 스케치를 반환합니다.
covar_pop(expr1,expr2) 그룹에 있는 숫자 쌍의 모집단 공 분산을 반환합니다.
covar_samp(expr1,expr2) 그룹에 있는 숫자 쌍의 표본 공 분산을 반환합니다.
every(expr) 그룹에 있는 expr의 모든 값이 true이면 true를 반환합니다.
first(expr[,ignoreNull]) 행 그룹에 대한 expr의 첫 번째 값을 반환합니다.
first_value(expr[,ignoreNull]) 행 그룹에 대한 expr의 첫 번째 값을 반환합니다.
histogram_numeric(expr,numBins) numBins 구간차원을 가진 expr에 대한 히스토그램을 계산하여 구간차원 중심을 나타내는 쌍의 배열을 반환합니다.
hll_sketch_agg(expr[,lgConfigK]) 고유 값 개수를 근사값으로 계산하는 데 사용되는 HyperLogLog 스케치를 반환합니다.
hll_union_agg(expr[,allowDifferentLgConfigK]) 행 그룹에 대한 HyperLogLog 스케치를 집계합니다.
kurtosis(expr) 그룹의 값에서 계산된 kurtosis 값을 반환합니다.
last(expr[,ignoreNull]) 행 그룹에 대한 expr의 마지막 값을 반환합니다.
last_value(expr[,ignoreNull]) 행 그룹에 대한 expr의 마지막 값을 반환합니다.
max(expr) 그룹의 expr 최댓값을 반환합니다.
max_by(expr1,expr2) 그룹의 expr2 최댓값과 연결된 expr1의 값을 반환합니다.
mean(expr) 그룹의 값에서 계산된 평균을 반환합니다.
median(expr) 그룹 값에서 계산된 중앙값을 반환합니다.
min(expr) 그룹에서 expr의 최솟값을 반환합니다.
min_by(expr1, expr2) 그룹의 최솟값 expr2와 연결된 expr1 값을 반환합니다.
mode(expr [,deterministic]) 그룹에서 가장 빈번한 NULL 값이 아닌 expr 값을 반환합니다.
percentile(expr, percentage [,frequency]) 지정된 percentage에서 expr의 정확한 백분위수 값을 반환합니다.
percentile_approx(expr,percentage[,accuracy]) 그룹 내 expr의 백분위수 근사치를 반환합니다.
percentile_cont(pct) WITHIN GROUP (ORDER BY key) 그룹 내에서 보간된 key의 백분위수를 반환합니다.
percentile_disc(pct) WITHIN GROUP (ORDER BY key) 그룹 내의 key에 대한 불연속 백분위수를 반환합니다.
regr_avgx(yExpr, xExpr) xExpryExprNOT NULL인 그룹의 값에서 계산된 xExpr의 평균을 반환합니다.
regr_avgy(yExpr, xExpr) xExpryExprNOT NULL인 그룹의 값에서 계산된 yExpr의 평균을 반환합니다.
regr_count(yExpr, xExpr) 그룹에 있는 Null이 아닌 값 쌍 yExpr, xExpr의 개수를 반환합니다.
regr_intercept(yExpr, xExpr) xExpryExpr이 NULL이 아닌 그룹에서 단변량 선형 회귀선의 절편을 반환합니다.
regr_r2(yExpr, xExpr) xExpryExpr이 NULL이 아닌 그룹의 값에서 결정 계수를 반환합니다.
regr_slope(yExpr, xExpr) 그룹에서 null이 아닌 값 쌍 yExpr, xExpr의 선형 회귀선의 기울기를 반환합니다.
regr_sxx(yExpr, xExpr) xExpryExpr이 NULL이 아닌 그룹의 xExpr 값에 대한 제곱합 합계를 반환합니다.
regr_sxy(yExpr, xExpr) xExpryExprNOT NULL인 그룹의 값에서 계산된 yExprxExpr의 곱의 합을 반환합니다.
regr_syy(yExpr, xExpr) xExpryExpr이 NULL이 아닌 그룹의 yExpr 값에 대한 제곱합 합계를 반환합니다.
schema_of_json_agg(json[, options]) 그룹에 있는 JSON 문자열의 결합된 스키마를 DDL 형식으로 반환합니다.
schema_of_variant_agg(variantExpr) 그룹에 있는 모든 VARIANT 값의 결합된 스키마를 DDL 형식으로 반환합니다.
skewness(expr) 그룹의 값에서 계산된 왜도 값을 반환합니다.
some(expr) 그룹에서 하나 이상의 expr 값이 true이면 true를 반환합니다.
std(expr) 그룹 내의 값에서 계산된 샘플 표준 편차를 반환합니다.
stddev(expr) 그룹 내의 값에서 계산된 샘플 표준 편차를 반환합니다.
stddev_pop(expr) 그룹 값에서 계산된 모집단 표준 편차를 반환합니다.
stddev_samp(expr) 그룹의 값에서 계산된 샘플 표준 편차를 반환합니다.
sum(expr) 그룹의 값에서 계산된 합계를 반환합니다.
try_avg(expr) 그룹의 값에서 계산된 평균을 반환하고, 오버플로가 있는 경우 NULL을 반환합니다.
try_sum(expr) 그룹의 값에서 계산된 합계를 반환하고, 오버플로가 있는 경우 NULL을 반환합니다.
var_pop(expr) 그룹 값에서 계산된 모집단 분산을 반환합니다.
var_samp(expr) 그룹의 값에서 계산된 표본 분산을 반환합니다.
variance(expr) 그룹의 값에서 계산된 표본 분산을 반환합니다.

Ranking window 함수

함수 설명
dense_rank() 파티션의 모든 값과 비교한 값의 순위를 반환합니다.
ntile(n) 각 창 파티션의 행을 1과 최대 n 사이의 n개 버킷으로 나눕니다.
percent_rank() 파티션 내 값의 백분율 순위를 계산합니다.
rank() 파티션의 모든 값과 비교한 값의 순위를 반환합니다.
row_number() 창 파티션 내의 행 순서에 따라 1부터 시작하여 각 행에 고유한 순차 번호를 할당합니다.

분석 창 함수

함수 설명
cume_dist() 파티션의 모든 값에 상대적인 값의 위치를 반환합니다.
lag(expr[,offset[,default]]) 파티션 내의 이전 행에서 expr의 값을 반환합니다.
lead(expr[,offset[,default]]) 파티션 내의 후속 행에서 expr 값을 반환합니다.
nth_value(expr, offset[, ignoreNulls]) window의 특정 offset에 있는 expr의 값을 반환합니다.

배열 함수

함수 설명
arrayExpr[indexExpr] arrayExpr ARRAY의 indexExpr 위치에 있는 요소를 반환합니다.
aggregate(expr,start,merge[,finish]) 사용자 지정 집계기를 사용하여 배열의 요소를 집계합니다.
array([expr [, …]]) expr의 요소가 있는 배열을 반환합니다.
array_append(array, elem) elem에 의해 추가된 array 값을 반환합니다.
array_compact(array) array에서 NULL 값을 제거합니다.
array_contains(array,value) arrayvalue가 포함되어 있으면 true를 반환합니다.
array_distinct(array) array에서 중복 값을 제거합니다.
array_except(array1,array2) array1에는 있지만 array2에는 없는 요소의 배열을 반환합니다.
array_insert(array, index, elem) index 위치에 elem가 삽입된 확장된 array를 반환합니다.
array_intersect(array1,array2) array1array2의 교집합에 있는 요소의 배열을 반환합니다.
array_join(array,delimiter[,nullReplacement]) array의 요소를 연결합니다.
array_max(array) array의 최댓값을 반환합니다.
array_min(array) array의 최솟값을 반환합니다.
array_position(array,element) array에서 처음으로 나오는 element의 위치를 반환합니다.
array_prepend(array, elem) elem가 앞에 붙은 array를 반환합니다.
array_remove(array,element) array에서 element의 모든 항목을 제거합니다.
array_repeat(element,count) count element회가 포함된 배열을 반환합니다.
array_size(array) array의 요소 수를 반환합니다.
array_sort(array,func) func에 따라 정렬된 array를 반환합니다.
array_union(array1,array2) array1array2의 합집합에 있는 요소의 배열을 중복 없이 반환합니다.
arrays_overlap(array1, array2) array1array2의 교집합이 비어 있지 않으면 true를 반환합니다.
arrays_zip(array1 [, …]) n번째 구조체가 입력 배열의 모든 N번째 값을 포함하는 병합된 구조체 배열을 반환합니다.
cardinality(expr) expr의 크기를 반환합니다.
concat(expr1, expr2 [, …]) 인수의 연결을 반환합니다.
element_at(arrayExpr, index) index에 있는 arrayExpr의 요소를 반환합니다.
exists(expr, pred) predexpr의 모든 요소에 대해 true이면 true를 반환합니다.
explode(collection) collection 중첩을 해제하여 행을 반환합니다.
explode_outer(collection) 외부 의미 체계를 사용하는 collection의 중첩을 해제하여 행을 반환합니다.
filter(expr,func) func 함수를 사용하여 expr의 배열을 필터링합니다.
flatten(arrayOfArrays) 배열의 배열을 단일 배열로 변환합니다.
forall(expr, predFunc) predFunc이 배열의 모든 요소에 대해 유지되는지 여부를 테스트합니다.
get(arrayExpr, index) index에서 0부터 arrayExpr의 요소를 반환합니다.
inline(expr) 구조체 배열을 테이블로 분해합니다.
inline_outer(expr) 구조체 배열을 외부 의미 체계가 있는 테이블로 분해합니다.
posexplode(expr) 위치 번호가 지정된 배열의 중첩을 해제하여 행을 반환합니다.
posexplode_outer(expr) OUTER 의미 체계를 사용하여 위치 번호가 지정된 배열의 중첩을 해제하여 행을 반환합니다.
reduce(expr,start,merge[,finish]) 사용자 지정 집계기를 사용하여 배열의 요소를 집계합니다.
reverse(array) 반전된 문자열 또는 요소의 순서가 반전된 배열을 반환합니다.
sequence(start,stop,step) start에서 stop(포함)까지의 요소의 배열을 생성하고 step 단위로 증분합니다.
shuffle(array) expr에서 배열의 임의 순열을 반환합니다.
size(expr) expr의 카디널리티를 반환합니다.
slice(expr,start,length) 배열의 하위 집합을 반환합니다.
sort_array(expr[,ascendingOrder]) expr의 배열을 정렬 순서로 반환합니다.
transform(expr, func) func 함수를 사용하여 expr에 있는 배열의 요소를 변환합니다.
try_element_at(arrayExpr, index) indexarrayExpr 요소 또는 NULL(index가 경계를 벗어난 경우)을 반환합니다.
zip_with(expr1, expr2, func) func을 사용하여 expr1expr2의 배열을 요소 단위로 단일 배열로 병합합니다.

Map 함수

함수 설명
mapExpr[keyExpr] mapExpr MAP의 keyExpr에 있는 값을 반환합니다.
cardinality(expr) expr의 크기를 반환합니다.
element_at(mapExpr, key) keymapExpr 값을 반환합니다.
explode(expr) expr 중첩을 해제하여 행을 반환합니다.
explode_outer(expr) 외부 의미 체계를 사용하는 expr의 중첩을 해제하여 행을 반환합니다.
map([{key1, value1}[, …]]) 지정된 키-값 쌍을 사용하여 맵을 만듭니다.
map_concat([expr1 [, …]]) 모든 expr 맵 식의 합집합을 반환합니다.
map_contains_key(map, key) mapkey가 포함된 경우 true를 반환하고 아닌 경우 false를 반환합니다.
map_entries(map) map에 있는 모든 항목의 순서가 지정되지 않은 배열을 반환합니다.
map_filter(expr, func) func 함수를 사용하여 expr에서 맵의 항목을 필터링합니다.
map_from_arrays(keys, values) 한 쌍의 keysvalues 배열을 사용하여 맵을 만듭니다.
map_from_entries(expr) 지정된 항목 배열에서 만들어진 맵을 만듭니다.
map_keys(map) map의 키를 포함하는 정렬되지 않은 배열을 반환합니다.
map_values(map) map의 값을 포함하는 순서가 지정되지 않은 배열을 반환합니다.
map_zip_with(map1, map2, func) map1map2를 단일 맵으로 병합합니다.
size(expr) expr의 카디널리티를 반환합니다.
str_to_map(expr[,pairDelim[,keyValueDelim]]) 구분 기호를 사용하여 expr을 키-값 쌍으로 분할한 후 맵을 반환합니다.
transform_keys(expr, func) func 함수를 사용하여 expr의 맵에 있는 키를 변환합니다.
transform_values(expr, func) func 함수를 사용하여 expr의 맵에 있는 값을 변환합니다.
try_element_at(mapExpr, key) keymapExpr 값 또는 NULL(key가 존재하지 않는 경우)을 반환합니다.

날짜, 타임스탬프 및 간격 함수

날짜 및 타임스탬프 형식에 대한 자세한 내용은 날짜/시간 패턴을 참조하세요.

함수 설명
intervalExpr / divisor 간격을 divisor로 나눈 값을 반환합니다.
- intervalExpr intervalExpr의 부정 값을 반환합니다.
intervalExpr1 - intervalExpr2 intervalExpr1에서 intervalExpr2를 뺀 값을 반환합니다.
datetimeExpr1 - datetimeExpr2 datetimeExpr1에서 datetimeExpr2를 뺀 값을 반환합니다.
+ intervalExpr intervalExpr의 값을 반환합니다.
intervalExpr1 + intervalExpr2 intervalExpr1intervalExpr2의 합계를 반환합니다.
intervalExpr * multiplicand intervalExprmultiplicand를 곱한 값을 반환합니다.
abs(expr) expr의 간격 값에 대한 절댓값을 반환합니다.
add_months(startDate,numMonths) startDate 이후의 numMonths 날짜를 반환합니다.
curdate() 쿼리 평가 시작 시 현재 날짜를 반환합니다.
current_date() 쿼리 평가 시작 시 현재 날짜를 반환합니다.
current_timestamp() 쿼리 평가 시작 시의 현재 타임스탬프를 반환합니다.
current_timezone() 현재 세션의 로컬 표준 시간대를 반환합니다.
date(expr) expr 값을 DATE로 캐스팅합니다.
date_add(startDate,numDays) startDate 이후의 날짜 numDays를 반환합니다.
date_add(unit, value, expr) 타임스탬프 exprvalue unit를 추가합니다.
date_diff(unit, start, stop) unit 단위로 측정된 두 타임스탬프의 차이를 반환합니다.
date_format(expr,fmt) 타임스탬프를 fmt형식의 문자열로 변환합니다.
date_from_unix_date(days) 1970-01-01 이후의 일 수에서 날짜를 만듭니다.
date_part(field,expr) 날짜, 타임스탬프 또는 간격의 일부를 추출합니다.
date_sub(startDate,numDays) startDate 이전의 날짜 numDays를 반환합니다.
date_trunc(unit,expr) unit에 지정된 단위로 잘린 타임스탬프를 반환합니다.
dateadd(startDate,numDays) startDate 이후의 날짜 numDays를 반환합니다.
dateadd(unit, value, expr) 타임스탬프 exprvalue unit를 추가합니다.
datediff(endDate,startDate) startDate에서 endDate까지의 일 수를 반환합니다.
datediff(unit, start, stop) unit 단위로 측정된 두 타임스탬프의 차이를 반환합니다.
day(expr) 날짜 또는 타임스탬프의 날짜를 반환합니다.
dayofmonth(expr) 날짜 또는 타임스탬프의 날짜를 반환합니다.
dayofweek(expr) 날짜 또는 타임스탬프의 요일을 반환합니다.
dayofyear(expr) 날짜 또는 타임스탬프의 연간 일자를 반환합니다.
divisor div dividend divisor 간격을 dividend 간격으로 나눈 값의 정수 부분을 반환합니다.
extract(field FROM source) sourcefield를 반환합니다.
from_unixtime(unixTime,fmt) fmtunixTime을 반환합니다.
from_utc_timestamp(expr,timezone) timeZone 표준 시간대에서 UTC로 지정된 expr 타임스탬프를 반환합니다.
getdate() 쿼리 평가 시작 시의 현재 타임스탬프를 반환합니다.
hour(expr) 타임스탬프의 시간 구성 요소를 반환합니다.
last_day(expr) 날짜가 속한 월의 마지막 날짜를 반환합니다.
make_date(year,month,day) year, month, day 필드에서 날짜를 만듭니다.
make_dt_interval([days[, hours[, mins[, secs]]]]) days, hours, minssecs에서 일-시간 간격을 만듭니다.
make_interval(years, months, weeks, days, hours, mins, secs) 사용되지 않음: years, months, weeks, days, hours, minssecs에서 간격을 만듭니다.
make_timestamp(year,month,day,hour,min,sec[,timezone]) year, month, day, hour, min, sectimezone 필드에서 타임스탬프를 만듭니다.
make_ym_interval([years[, months]]) yearsmonths에서 연-월 간격을 만듭니다.
minute(expr) expr에 있는 타임스탬프의 분 구성 요소를 반환합니다.
month(expr) expr에 있는 타임스탬프의 월 구성 요소를 반환합니다.
months_between(expr1,expr2[,roundOff]) expr1expr2에 있는 날짜 또는 타임스탬프 사이에서 경과된 월 수를 반환합니다.
next_day(expr,dayOfWeek) expr보다 나중이고 이름이 dayOfWeek인 첫 번째 날짜를 반환합니다.
now() 쿼리 평가 시작 시의 현재 타임스탬프를 반환합니다.
quarter(expr) 1에서 4 범위에서 expr의 연도 분기를 반환합니다.
second(expr) expr에 있는 타임스탬프의 초 구성 요소를 반환합니다.
session_window(expr, gpDuration) 타임스탬프 식을 통해 세션 창을 만듭니다.
sign(expr) expr 간격이 음수, 0 또는 양수일 때 -1.0, 0.0 또는 1.0을 반환합니다.
signum(expr) expr 간격이 음수, 0 또는 양수일 때 -1.0, 0.0 또는 1.0을 반환합니다.
timediff(unit, start, stop) unit 단위로 측정된 두 타임스탬프의 차이를 반환합니다.
timestamp(expr) expr에서 TIMESTAMP로 캐스트.
timestamp_micros(expr) UTC Epoch 이후 타임스탬프 expr 마이크로초를 만듭니다.
timestamp_millis(expr) UTC epoch 이후 타임스탬프 expr밀리초를 만듭니다.
timestamp_seconds(expr) UTC epoch 이후 타임스탬프 expr 초를 만듭니다.
timestampadd(unit, value, expr) 타임스탬프 exprvalue unit를 추가합니다.
timestampdiff(unit, start, stop) unit 단위로 측정된 두 타임스탬프의 차이를 반환합니다.
to_date(expr[,fmt]) 선택적 서식을 사용한 날짜로 캐스팅된 expr을 반환합니다.
to_timestamp(expr[,fmt]) 선택적 형식 지정을 사용하여 타임스탬프로 캐스팅된 expr을 반환합니다.
to_unix_timestamp(expr[,fmt]) expr의 타임스탬프를 UNIX 타임스탬프로 반환합니다.
to_utc_timestamp(expr,timezone) 다른 시간대의 expr 타임스탬프를 UTC로 반환합니다.
trunc(expr, fmt) 날짜의 일부가 형식 모델 fmt에 의해 지정된 단위로 잘린 날짜를 반환합니다.
try_add(expr1, expr2) expr1expr2의 합계를 반환하며 오류 발생 시 NULL을 반환합니다.
try_divide(dividend, divisor) dividenddivisor로 나눈 값을 반환하거나 divisor가 0이면 NULL을 반환합니다.
try_multiply(multiplier, multiplicand) multipliermultiplicand의 곱 또는 오버플로의 NULL을 반환합니다.
try_subtract(expr1, expr2) expr1에서 expr2를 뺀 값이나, 오버플로에 대해 NULL을 반환합니다.
try_to_timestamp(expr[,fmt]) 선택적 형식을 사용하여 타임스탬프로 캐스팅된 expr을 반환하거나 캐스팅이 실패하면 NULL을 반환합니다.
unix_date(expr) 1970-01-01 이후의 일 수를 반환합니다.
unix_micros(expr) 1970-01-01 00:00:00 UTC 이후 경과된 마이크로초 수를 반환합니다.
unix_millis(expr) 1970-01-01 00:00:00 UTC 이후 경과된 밀리초 수를 반환합니다.
unix_seconds(expr) 1970-01-01 00:00:00 UTC 이후 경과된 초 수를 반환합니다.
unix_timestamp([expr[, fmt]]) 현재 또는 지정된 시간의 UNIX 타임스탬프를 반환합니다.
weekday(expr) expr의 요일을 반환합니다.
weekofyear(expr) expr 연도의 주를 반환합니다.
year(expr) expr의 연도 구성 요소를 반환합니다.
window(expr, width[, step[, start]]) 타임스탬프 식에 대해 도약 기반 슬라이딩 윈도우를 만듭니다.
window_time(window) window 또는 session_window 함수에 의해 생성된 슬라이딩 윈도우의 포함 종료 시간을 반환합니다.

H3 지리 공간적 함수

H3 지리 공간적 함수에 대한 자세한 내용은 H3 지리 공간적 함수를 참조하세요.

캐스트 함수 및 생성자

형식 간 캐스팅에 대한 자세한 내용은 캐스트 함수try_cast 함수를 참조하세요.

함수 설명
array([expr [, …]]) expr의 요소가 있는 배열을 반환합니다.
bigint(expr) exprBIGINT로 캐스팅합니다.
binary(expr) expr의 값을 BINARY로 캐스팅합니다.
boolean(expr) expr에서 BOOLEAN로 캐스트.
cast(expr AS type) expr을 대상 데이터 형식 type으로 캐스트합니다.
expr :: type expr을 대상 데이터 형식 type으로 캐스트합니다.
date(expr) exprDATE로 캐스팅합니다.
decimal(expr) exprDECIMAL로 캐스팅합니다.
double(expr) exprDOUBLE로 캐스팅합니다.
float(expr) exprFLOAT로 캐스팅합니다.
int(expr) exprINTEGER로 캐스팅합니다.
make_date(year,month,day) year, month, day 필드에서 날짜를 만듭니다.
make_dt_interval([days[, hours[, mins[, secs]]]]) days, hours, minssecs에서 일-시간 간격을 만듭니다.
make_interval(years, months, weeks, days, hours, mins, secs) years, months, weeks, days, hours, minssecs에서 간격을 만듭니다.
make_timestamp(year,month,day,hour,min,sec[,timezone]) year, month, day, hour, min, sectimezone 필드에서 타임스탬프를 만듭니다.
make_ym_interval([years[, months]]) yearsmonths에서 연-월 간격을 만듭니다.
map([{key1, value1} [, …]]) 지정된 키-값 쌍을 사용하여 맵을 만듭니다.
named_struct({name1, val1} [, …]) 지정된 필드 이름 및 값을 사용하여 구조체를 만듭니다.
smallint(expr) exprSMALLINT로 캐스팅합니다.
string(expr) exprSTRING로 캐스팅합니다.
struct(expr1 [, …]) 지정된 필드 값으로 STRUCT를 생성합니다.
tinyint(expr) expr에서 TINYINT로 캐스트.
timestamp(expr) expr에서 TIMESTAMP로 캐스트.
to_char(expr, fmt) fmt 형식을 사용하여 exprSTRING로 반환합니다.”
to_date(expr[,fmt]) 선택적 서식을 사용한 날짜로 캐스팅된 expr을 반환합니다.
to_number(expr, fmt) fmt 형식을 사용하여 exprDECIMAL로 반환합니다.
to_timestamp(expr[,fmt]) 선택적 형식 지정을 사용하여 타임스탬프로 캐스팅된 expr을 반환합니다.
to_varchar(expr, fmt) fmt 형식을 사용하여 exprSTRING로 반환합니다.”
try_cast(expr AS type) expr 값을 type 대상 데이터 형식으로 안전하게 캐스팅합니다.
try_to_number(expr, fmt) 형식 fmt를 사용하여 exprDECIMAL로 형변환하거나, expr가 유효하지 않은 경우 NULL로 반환합니다.

CSV 및 Avro 함수

함수 설명
from_avro(avroBin, jsonSchema[, options]) 및 에 따라 avroBin 구조체 값을 반환합니다 jsonSchema.
from_csv(csvStr, schema[, options]) csvStrschema가 있는 구조체 값을 반환합니다.
schema_of_csv(csv[, options]) CSV 문자열의 스키마를 DDL 형식으로 반환합니다.
to_avro(expr[, options]) 지정된 구조체 값을 사용하여 Avro 이진 값을 반환합니다.
to_csv(expr[, options]) 지정된 구조체 값이 있는 CSV 문자열을 반환합니다.

JSON 함수

함수 설명
jsonStr : jsonPath jsonStr에서 추출된 필드를 반환합니다.
from_json(jsonStr, schema[, options]) jsonStrschema가 있는 구조체 값을 반환합니다.
get_json_object(expr, path) path에서 JSON 개체를 추출합니다.
json_array_length(jsonArray) 가장 바깥쪽 JSON 배열의 요소 수를 반환합니다.
json_object_keys(jsonObject) 가장 바깥쪽 JSON 개체의 모든 키를 배열로 반환합니다.
json_tuple(jsonStr, path1 [, …]) 여러 JSON 개체를 튜플로 반환합니다.
parse_json(jsonStr) jsonStr에서 VARIANT 값을 반환합니다.
schema_of_json(jsonStr[, options]) JSON 문자열의 스키마를 DDL 형식으로 반환합니다.
schema_of_json_agg(jsonStr[, options]) 그룹에 있는 JSON 문자열의 결합된 스키마를 DDL 형식으로 반환합니다.
to_json(expr[, options]) expr에 지정된 STRUCT 또는 VARIANT가 포함된 JSON 문자열을 반환합니다.

VARIANT 함수

함수 설명
variantExpr : jsonPath JSON 경로를 사용하여 variantExpr에서 추출한 필드를 반환합니다.
is_variant_null(variantExpr) 테스트 variantExprVARIANT로 인코딩된 NULL인지 여부를 확인합니다.
parse_json(jsonStr) jsonStr에서 VARIANT 값을 반환합니다.
schema_of_variant(variantExpr) VARIANT 식의 스키마를 DDL 형식으로 반환합니다.
schema_of_variant_agg(variantExpr) 그룹에 있는 모든 VARIANT 값의 결합된 스키마를 DDL 형식으로 반환합니다.
to_json(expr[, options]) expr에 지정된 STRUCT 또는 VARIANT가 포함된 JSON 문자열을 반환합니다.
try_parse_json(jsonStr) jsonStr가 가능한 경우 VARIANT 값을 반환합니다. NULL가 가능 하지 않은 경우 반환됩니다.
try_variant_get(variantExpr,path,type) 대상 형식으로 형변환할 수 없는 경우 path 또는 NULL로 지정된 variantExpr에서 type 형식의 값을 추출합니다.
variant_explode(variantExpr) variantExpr의 중첩을 해제하여 행 집합을 반환합니다.
variant_explode_outer(variantExpr) 외부 의미 체계를 사용하는 variantExpr의 중첩을 해제하여 행 집합을 반환합니다.
variant_get(variantExpr,path,type) path가 지정한 variantExpr에서 type 유형의 값을 추출합니다.

XPath 및 XML 함수

함수 설명
from_xml(xmlStr, schema[, options]) schema를 사용하여 xmlStr에서 구문 분석된 구조체 값을 반환합니다.
schema_of_xml(xmlStr[, options]) XML 문자열의 스키마를 DDL 형식으로 반환합니다.
xpath(xml, xpath) xpath와 일치하는 xml 노드 내의 값을 반환합니다.
xpath_boolean(xml, xpath) xpath 식이 true로 평가되거나 xml에서 일치하는 노드가 있으면 true를 반환합니다.
xpath_double(xml, xpath) XML 문서에서 DOUBLE값을 반환합니다.
xpath_float(xml, xpath) XML 문서에서 FLOAT값을 반환합니다.
xpath_int(xml, xpath) XML 문서에서 INTEGER값을 반환합니다.
xpath_long(xml, xpath) XML 문서에서 BIGINT값을 반환합니다.
xpath_number(xml, xpath) XML 문서에서 DOUBLE값을 반환합니다.
xpath_short(xml, xpath) XML 문서에서 SHORT값을 반환합니다.
xpath_string(xml, xpath) XPath 식과 일치하는 첫 번째 XML 노드의 콘텐츠를 반환합니다.

AI 함수

함수 설명
ai_analyze_sentiment(content) 텍스트의 감정을 반환합니다.
ai_classify(content, labels) 제공된 콘텐츠를 제공된 레이블 중 하나로 분류합니다.
ai_extract(content, labels) 지정된 텍스트에서 레이블로 지정된 엔터티를 추출합니다.
ai_fix_grammar(content) 지정된 텍스트의 문법 오류를 수정합니다.
ai_forecast(observed, time_col) 시계열 데이터를 미래로 내세울 수 있습니다.
ai_gen(content) Databricks Foundation 모델 API에서 최첨단 생성 AI 모델을 호출하여 사용자가 제공한 프롬프트에 응답합니다.
ai_generate_text(prompt, modelName[, param1, value1] [...]) 사용되지 않음: 프롬프트가 지정된 경우 선택한 LLM(큰 언어 모델)에서 생성된 텍스트를 반환합니다.
ai_mask(콘텐츠, 레이블) 지정된 텍스트 내에서 지정된 엔터티를 마스크합니다.
ai_query(endpointName, request, returnType) 엔드포인트를 제공하는 기존 Mosaic AI 모델을 호출하고 해당 응답을 구문 분석하고 반환합니다.
ai_similarity(strExpr1, strExpr2) 두 문자열을 비교하고 의미 체계 유사성 점수를 계산합니다.
ai_summarize(content[, max_words]) 지정된 텍스트의 요약을 생성합니다.
ai_translate(콘텐츠, to_lang) 텍스트를 지정된 대상 언어로 변환합니다.
vector_search(인덱스, 쿼리, num_results) SQL을 사용하여 Mosaic AI Vector Search 인덱스 쿼리

Read 함수

함수 설명
read_files(path, [optionKey => optionValue] [, ...]) 클라우드 스토리지에서 데이터 파일을 읽고 테이블 형식으로 반환합니다.
read_kafka([optionKey => optionValue] [, ...]) Apache Kafka 클러스터에서 레코드를 읽고 테이블 형식으로 반환합니다.
read_kinesis({parameter => value} [, ...]) 하나 이상의 스트림에서 Kinesis에서 읽은 레코드가 있는 테이블을 반환합니다.
read_pubsub([parameter => value] [, ...]) 토픽의 Pub/Sub에서 레코드를 읽는 테이블 반환 함수입니다.
read_pulsar({optionKey => optionValue} [, ...]) Pulsar에서 읽은 레코드가 있는 테이블을 반환합니다.
read_state_metadata(path) 스트리밍 쿼리 상태의 메타데이터를 나타내는 행이 있는 테이블을 반환합니다.
read_statestore(path [, option_key => option_value] [...]) 스트리밍 쿼리의 상태 저장소에서 레코드를 반환합니다.

기타 함수

함수 설명
assert_true(expr) expr이 true가 아니면 오류를 반환합니다.
CASE expr { WHEN opt1 THEN res1 } […] [ELSE def] END expr과 같은 첫 번째 optN에 대해 resN을 반환하거나 일치하는 항목이 없으면 def를 반환합니다.
CASE { WHEN cond1 THEN res1 } […] [ELSE def] END true로 평가되는 첫 번째 condN에 대한 resN을 반환하거나 해당 항목이 없으면 def를 반환합니다.
cloud_files_state( { TABLE(table) | checkpoint } ) 자동 로더 cloud_files 원본의 파일 수준 상태를 반환합니다.
coalesce(expr1, expr2 [, …]) Null이 아닌 첫 번째 인수를 반환합니다.
cube (expr1 [, …]) 지정된 식 열을 사용하여 다차원 큐브를 만듭니다.
current_catalog() 현재 카탈로그를 반환합니다.
current_database() 현재 스키마를 반환합니다.
current_metastore() 현재 Unity Catalog 메타스토어 ID를 반환합니다.
current_recipient(키) Delta 공유와 공유된 보기에서 현재 받는 사람의 속성을 반환합니다.
current_schema() 현재 스키마를 반환합니다.
current_user() 문을 실행하는 사용자를 반환합니다.
current_version() 현재 버전의 Azure Databricks를 반환합니다.
decode(expr, { key, value } [, …] [,defValue]) 키와 일치하는 값을 반환합니다.
elt(index, expr1 [, …] ) nth 식을 반환합니다.
equal_null(expr1, expr2) expr1expr2와 같거나 두 식이 모두 NULL이면 true를 반환합니다. 그렇지 않으면 false를 반환합니다.
event_log( { TABLE(table) | pipeline_id } ) 구체화된 뷰, 스트리밍 테이블 또는 DLT 파이프라인에 대한 새로 고침 기록 테이블을 반환합니다.
greatest(expr1, expr2 [, …]) 모든 인수 중에서 null 값을 건너뛰고 가장 큰 값을 반환합니다.
grouping(col) GROUPING SET, ROLLUP 또는 CUBE에 지정된 열이 부분합을 나타내는지 여부를 나타냅니다.
grouping_id([col1 [, …]]) 열 집합에 대한 그룹화 수준을 반환합니다.
hash(expr1 [, …]) 인수의 해시 값을 반환합니다.
hll_sketch_estimate(expr) HyperLogLog 스케치에서 수집된 고유 값의 수를 예측합니다.
hll_union(expr1, expr2 [,allowDifferentLgConfigK]) 두 개의 HyperLogLog 스케치를 결합합니다.
java_method(class, method[, arg1 [, …]]) 리플렉션을 사용하여 메서드를 호출합니다.
if(cond, expr1, expr2) condtrue인 경우 expr1를 반환하거나 그렇지 않으면 expr2을 반환합니다.
iff(cond, expr1, expr2) condtrue인 경우 expr1를 반환하거나 그렇지 않으면 expr2을 반환합니다.
ifnull(expr1, expr2) expr1NULL인 경우 expr2를 반환하거나 그렇지 않으면 expr1을 반환합니다.
input_file_block_length() 읽는 블록의 길이(바이트)를 반환합니다.
input_file_block_start() 읽고 있는 블록의 시작 오프셋을 바이트 단위로 반환합니다.
input_file_name() 읽고 있는 파일의 이름을 반환하거나, 사용할 수 없는 경우 빈 문자열을 반환합니다.
is_account_group_member(group) 현재 사용자가 계정 수준에서 그룹의 멤버인 경우 true를 반환합니다.
is_member(group) 현재 사용자가 작업 영역 수준에서 그룹의 멤버인 경우 true를 반환합니다.
isnull(expr) exprNULL이면 true를 반환합니다.
isnotnull(expr) exprNULL이 아니면 true를 반환합니다.
least(expr1, expr2 [, …]) 모든 인수 중에서 null 값을 건너뛰고 가장 작은 값을 반환합니다.
list_secrets([scopeStr]) 사용자가 Databricks 비밀 서비스에서 볼 수 있는 권한이 있는 전체 또는 하나의 범위의 키를 반환합니다.
luhn_check(numStr) numStrLuhn 알고리즘 검사를 통과하면 true를 반환합니다.
monotonically_increasing_id() 단조롭게 증가하는 64비트 정수를 반환합니다.
nullif(expr1, expr2) expr1expr2와 같으면 NULL을 반환하고, 그렇지 않으면 expr1을 반환합니다.
nvl(expr1, expr2) expr1NULL인 경우 expr2를 반환하거나 그렇지 않으면 expr1을 반환합니다.
nvl2(expr1, expr2, expr3) expr1NULL이 아닌 경우 expr2를 반환하거나 그렇지 않으면 expr3을 반환합니다.
raise_error(expr) expr을 메시지로 사용하여 예외를 throw합니다.
range(end) 지정된 범위 내의 값 테이블을 반환합니다.
range(start, end [, step [, numParts]]) 지정된 범위 내의 값 테이블을 반환합니다.
reflect(class, method[, arg1 [, …]]) 리플렉션을 사용하여 메서드를 호출합니다.
secret(scope, key) Databricks 비밀 서비스에서 지정된 scopekey로 비밀 값을 추출합니다.
session_user() Azure Databricks에 연결된 사용자를 반환합니다.
spark_partition_id() 현재 파티션 ID를 반환합니다.
sql_keywords() Azure Databricks에서 SQL 키워드 집합을 반환합니다.
stack(numRows, expr1 [, …]) expr1, …, exprNnumRows개 행으로 구분합니다.
table_changes(table_str, start [, end]) 변경 데이터 피드를 사용하도록 설정된 Delta Lake 테이블에 대한 변경 로그를 반환합니다.
try_reflect(class, method[, arg1 [, …]]) 리플렉션을 사용하여 메서드를 호출하고 NULL 메서드가 실패하면 반환합니다.
try_secret(scope, key) Databricks 비밀 서비스에서 주어진 scopekey를 사용하여 비밀 값을 추출하거나 키를 검색할 수 없는 경우 NULL를 추출합니다.
typeof(expr) expr 데이터 형식에 대한 DDL 형식 문자열을 반환합니다.
user() 문을 실행하는 사용자를 반환합니다.
uuid() UUID(범용 고유 식별자) 문자열을 반환합니다.
window(expr, width[, step [, start]]) 타임스탬프 식에 대해 도약 기반 슬라이딩 윈도우를 만듭니다.
xxhash64(expr1 [, …]) 인수의 64비트 해시 값을 반환합니다.
version() Apache Spark 버전을 반환합니다.