다음을 통해 공유


Functions 클래스

정의

DataFrame 작업에 사용할 수 있는 함수입니다.

public static class Functions
type Functions = class
Public Class Functions
상속
Functions

메서드

Abs(Column)

절대값을 계산합니다.

Acos(Column)

에 의해 java.lang.Math.acos계산된 것처럼 의 역 코사인column(라디안)입니다.

Acos(String)

에 의해 java.lang.Math.acos계산된 것처럼 의 역 코사인columnName(라디안)입니다.

AddMonths(Column, Column)

startDate 이후의 numMonths 날짜를 반환합니다.

AddMonths(Column, Int32)

startDate 이후의 numMonths 날짜를 반환합니다.

ApproxCountDistinct(Column)

그룹의 대략적인 고유 항목 수를 반환합니다.

ApproxCountDistinct(Column, Double)

그룹의 대략적인 고유 항목 수를 반환합니다.

ApproxCountDistinct(String)

그룹의 대략적인 고유 항목 수를 반환합니다.

ApproxCountDistinct(String, Double)

그룹의 대략적인 고유 항목 수를 반환합니다.

Array(Column[])

새 배열 열을 만듭니다. 입력 열은 모두 동일한 데이터 형식이어야 합니다.

Array(String, String[])

새 배열 열을 만듭니다. 입력 열은 모두 동일한 데이터 형식이어야 합니다.

ArrayContains(Column, Object)

배열이 null이면 null을 반환하고, 배열에 이 있으면 true를 반환하고, 그렇지 않으면 false를 반환합니다 value.

ArrayDistinct(Column)

배열에서 중복 값을 제거합니다.

ArrayExcept(Column, Column)

에 있는 요소의 배열을 col1 반환하지만 중복되지는 않습니다 col2. 결과의 요소 순서는 비결정적입니다.

ArrayIntersect(Column, Column)

지정된 두 배열의 교집합에 있는 요소의 배열을 중복 없이 반환합니다.

ArrayJoin(Column, String)

를 사용하여 의 column 요소를 연결합니다 delimiter.

ArrayJoin(Column, String, String)

를 사용하여 의 column 요소를 연결합니다 delimiter. Null 값은 로 nullReplacement대체됩니다.

ArrayMax(Column)

배열의 최대값을 반환합니다.

ArrayMin(Column)

배열의 최소값을 반환합니다.

ArrayPosition(Column, Object)

지정된 배열에서 값이 처음 나타나는 위치를 오랫동안 찾습니다. 인수 중 하나가 null이면 null을 반환합니다.

ArrayRemove(Column, Object)

지정된 배열에서 요소와 동일한 모든 요소를 제거합니다.

ArrayRepeat(Column, Column)

인수가 지정한 횟수를 반복하는 left 인수를 포함하는 배열을 right 만듭니다.

ArrayRepeat(Column, Int32)

횟수를 반복하는 인수를 left 포함하는 배열을 count 만듭니다.

ArraySort(Column)

입력 배열을 오름차순으로 정렬합니다. 입력 배열의 요소는 정렬 가능해야 합니다. null 요소는 반환된 배열의 끝에 배치됩니다.

ArraysOverlap(Column, Column)

null이 아닌 요소가 하나 이상 공통된 경우 a1a2 true를 반환합니다. 그렇지 않고 두 배열이 모두 비어 있지 않고 둘 중 어떤 배열에도 null이 포함되어 있으면 null이 반환됩니다. 그렇지 않으면 false를 반환합니다.

ArraysZip(Column[])

N번째 구조체에 입력 배열의 모든 N번째 값이 포함된 구조체의 병합된 배열을 반환합니다.

ArrayUnion(Column, Column)

중복 없이 지정된 두 배열의 공용 구조체에 있는 요소의 배열을 반환합니다.

Asc(String)

열의 오름차순에 따라 정렬 식을 반환합니다.

Ascii(Column)

문자열 열의 첫 번째 문자의 숫자 값을 계산하고 결과를 int 열로 반환합니다.

AscNullsFirst(String)

열의 오름차순에 따라 정렬 식을 반환하고 null 값은 null이 아닌 값 앞에 반환됩니다.

AscNullsLast(String)

열의 오름차순에 따라 정렬 식을 반환하고 null 값이 null이 아닌 값 다음에 나타납니다.

Asin(Column)

에 의해 java.lang.Math.asin계산된 것처럼 라디안의 의 사인 column 을 역으로 반환합니다.

Asin(String)

에 의해 java.lang.Math.asin계산된 것처럼 라디안의 의 사인 columnName 을 역으로 반환합니다.

Atan(Column)

에 의해 java.lang.Math.atan계산된 것처럼 의 역 탄젠트column(라디안)입니다.

Atan(String)

에 의해 java.lang.Math.atan계산된 것처럼 의 역 탄젠트columnName(라디안)입니다.

Atan2(Column, Column)

지정된 xy에 대한 atan2를 계산합니다.

Atan2(Column, Double)

지정된 xy에 대한 atan2를 계산합니다.

Atan2(Column, String)

지정된 xy에 대한 atan2를 계산합니다.

Atan2(Double, Column)

지정된 xy에 대한 atan2를 계산합니다.

Atan2(Double, String)

지정된 xy에 대한 atan2를 계산합니다.

Atan2(String, Column)

지정된 xy에 대한 atan2를 계산합니다.

Atan2(String, Double)

지정된 xy에 대한 atan2를 계산합니다.

Atan2(String, String)

지정된 xy에 대한 atan2를 계산합니다.

Avg(Column)

그룹 내 값의 평균을 반환합니다.

Avg(String)

그룹 내 값의 평균을 반환합니다.

Base64(Column)

이진 열의 BASE64 인코딩을 계산하고 문자열 열로 반환합니다.

Bin(Column)

지정된 long 열의 이진 값에 대한 문자열 표현을 반환하는 식입니다. 예를 들어 bin("12")은 "1100"을 반환합니다.

Bin(String)

지정된 long 열의 이진 값에 대한 문자열 표현을 반환하는 식입니다. 예를 들어 bin("12")은 "1100"을 반환합니다.

BitwiseNOT(Column)

비트 NOT를 계산합니다.

Broadcast(DataFrame)

브로드캐스트 조인에 사용할 수 있을 만큼 작은 데이터 프레임을 표시합니다.

Bround(Column)

HALF_EVEN 라운드 모드를 사용하여 반올림된 소수 자릿수의 값을 column 0으로 반환합니다.

Bround(Column, Int32)

HALF_EVEN 라운드 모드를 사용하여 scale 반올림된 소수 자릿수의 column 값을 반환합니다.

Bucket(Column, Column)

입력 열의 해시로 분할하는 모든 형식에 대한 변환입니다.

Bucket(Int32, Column)

입력 열의 해시로 분할하는 모든 형식에 대한 변환입니다.

CallUDF(String, Column[])

SparkSession.Udf()를 통해 등록된 사용자 정의 함수를 호출합니다. Register().

Cbrt(Column)

지정된 열의 큐브 루트를 계산합니다.

Cbrt(String)

지정된 열의 큐브 루트를 계산합니다.

Ceil(Column)

지정된 값의 최대값을 계산합니다.

Ceil(String)

지정된 값의 최대값을 계산합니다.

Coalesce(Column[])

null이 아닌 첫 번째 열을 반환하거나 모든 입력이 null인 경우 null을 반환합니다.

Col(String)

지정된 열 이름을 기준으로 열을 반환합니다. Column()의 별칭입니다.

CollectList(Column)

중복된 개체 목록을 반환합니다.

CollectList(String)

중복된 개체 목록을 반환합니다.

CollectSet(Column)

중복 요소가 제거된 개체 집합을 반환합니다.

CollectSet(String)

중복 요소가 제거된 개체 집합을 반환합니다.

Column(String)

지정된 열 이름을 기준으로 열을 반환합니다.

Concat(Column[])

여러 입력 열을 단일 열로 연결합니다.

ConcatWs(String, Column[])

지정된 구분 기호를 사용하여 여러 입력 문자열 열을 단일 문자열 열로 연결합니다.

Conv(Column, Int32, Int32)

문자열 열의 숫자를 한 베이스에서 다른 밑으로 변환합니다.

Corr(Column, Column)

두 열에 대한 Pearson 상관 관계 계수를 반환합니다.

Corr(String, String)

두 열에 대한 Pearson 상관 관계 계수를 반환합니다.

Cos(Column)

에서 계산하는 것처럼 각도의 코사인을 계산합니다. java.lang.Math.cos

Cos(String)

에서 계산하는 것처럼 각도의 코사인을 계산합니다. java.lang.Math.cos

Cosh(Column)

을 계산하는 것처럼 각도의 쌍곡선 코사인을 계산합니다. java.lang.Math.cosh

Cosh(String)

을 계산하는 것처럼 각도의 쌍곡선 코사인을 계산합니다. java.lang.Math.cosh

Count(Column)

그룹의 항목 개수를 반환합니다.

Count(String)

그룹의 항목 개수를 반환합니다.

CountDistinct(Column, Column[])

그룹의 고유 항목 수를 반환합니다.

CountDistinct(String, String[])

그룹의 고유 항목 수를 반환합니다.

CovarPop(Column, Column)

두 열의 모집단 공변을 반환합니다.

CovarPop(String, String)

두 열의 모집단 공변을 반환합니다.

CovarSamp(Column, Column)

두 열에 대한 샘플 공변을 반환합니다.

CovarSamp(String, String)

두 열에 대한 샘플 공변을 반환합니다.

Crc32(Column)

이진 열의 CRC32(순환 중복 검사 값)를 계산하고 값을 bigint로 반환합니다.

CumeDist()

Window 함수: 창 파티션 내 값의 누적 분포를 반환합니다. 즉, 현재 행 아래에 있는 행의 비율입니다.

CurrentDate()

현재 날짜를 날짜 열로 반환합니다.

CurrentRow()

창 함수: 창 파티션의 현재 행을 나타내는 특수 프레임 경계를 반환합니다.

CurrentTimestamp()

현재 타임스탬프를 타임스탬프 열로 반환합니다.

DateAdd(Column, Column)

일 후의 날짜를 반환합니다 daysstart.

DateAdd(Column, Int32)

일 후의 날짜를 반환합니다 daysstart.

DateDiff(Column, Column)

start에서 end까지의 일 수를 반환합니다.

DateFormat(Column, String)

date/timestamp/string을 두 번째 인수에서 지정한 날짜 형식으로 지정된 형식의 문자열 값으로 변환합니다.

DateSub(Column, Column)

일 전startdays 날짜를 반환합니다.

DateSub(Column, Int32)

일 전startdays 날짜를 반환합니다.

DateTrunc(String, Column)

형식으로 지정된 단위로 잘린 타임스탬프를 반환합니다.

DayOfMonth(Column)

지정된 날짜/타임스탬프/문자열에서 월의 날짜를 정수로 추출합니다.

DayOfWeek(Column)

지정된 날짜/타임스탬프/문자열에서 요일을 정수로 추출합니다.

DayOfYear(Column)

지정된 날짜/타임스탬프/문자열에서 해당 요일을 정수로 추출합니다.

Days(Column)

데이터를 일로 분할하는 타임스탬프 및 날짜에 대한 변환입니다.

Decode(Column, String)

제공된 문자 집합('US-ASCII', 'ISO-8859-1', 'UTF-8', 'UTF-16BE', 'UTF-16LE', 'UTF-16' 중 하나)을 사용하여 이진 파일의 문자열로 첫 번째 인수를 계산합니다.

Degrees(Column)

라디안 단위로 측정된 각도를 도 단위로 측정된 대략 동일한 각도로 변환합니다.

Degrees(String)

라디안 단위로 측정된 각도를 도 단위로 측정된 대략 동일한 각도로 변환합니다.

DenseRank()

Window 함수: 간격 없이 창 파티션 내의 행 순위를 반환합니다.

Desc(String)

열의 내림차순에 따라 정렬 식을 반환합니다.

DescNullsFirst(String)

열의 내림차순에 따라 정렬 식을 반환하고 null 값은 null이 아닌 값 앞에 반환됩니다.

DescNullsLast(String)

열의 내림차순에 따라 정렬 식을 반환하고 null 값이 null이 아닌 값 다음에 나타납니다.

ElementAt(Column, Object)

열이 배열인 경우 의 지정된 인덱스에서 value 배열의 요소를 반환합니다. 열이 map인 경우 에서 지정된 키의 value 값을 반환합니다.

Encode(Column, String)

제공된 문자 집합('US-ASCII', 'ISO-8859-1', 'UTF-8', 'UTF-16BE', 'UTF-16LE', 'UTF-16' 중 하나)을 사용하여 문자열에서 이진 파일로 첫 번째 인수를 계산합니다.

Exp(Column)

지정된 값의 지수를 계산합니다.

Exp(String)

지정된 값의 지수를 계산합니다.

Explode(Column)

지정된 배열 또는 맵 열의 각 요소에 대해 새 행을 만듭니다.

ExplodeOuter(Column)

지정된 배열 또는 맵 열의 각 요소에 대해 새 행을 만듭니다. Explode()와 달리 배열/맵이 null이거나 비어 있으면 null이 생성됩니다.

Expm1(Column)

지정된 값의 지수에서 1을 뺀 값을 계산합니다.

Expm1(String)

지정된 값의 지수에서 1을 뺀 값을 계산합니다.

Expr(String)

식 문자열을 나타내는 열로 구문 분석합니다.

Factorial(Column)

지정된 값의 요소를 계산합니다.

First(Column, Boolean)

그룹에 있는 열의 첫 번째 값을 반환합니다.

First(String, Boolean)

그룹에 있는 열의 첫 번째 값을 반환합니다.

Flatten(Column)

배열 배열에서 단일 배열을 만듭니다. 중첩된 배열의 구조가 두 수준보다 깊으면 한 수준의 중첩만 제거됩니다.

Floor(Column)

지정된 값의 바닥을 계산합니다.

Floor(String)

지정된 값의 바닥을 계산합니다.

FormatNumber(Column, Int32)

지정된 숫자 column 의 서식을 '#,##,##'과 같은 형식으로 지정하고, HALF_EVEN 라운드 모드가 있는 지정된 d 소수 자릿수로 반올림하고 결과를 문자열 열로 반환합니다.

FormatString(String, Column[])

인수의 형식을 printf 스타일로 지정하고 결과를 문자열 열로 반환합니다.

FromCsv(Column, Column, Dictionary<String,String>)

CSV 문자열이 포함된 열을 지정된 스키마가 있는 로 StructType 구문 분석합니다.

FromCsv(Column, StructType, Dictionary<String,String>)

CSV 문자열이 포함된 열을 지정된 스키마가 있는 로 StructType 구문 분석합니다.

FromJson(Column, Column, Dictionary<String,String>)

JSON 문자열이 포함된 열을 지정된 스키마를 StructType 사용하여 또는 ArrayTypeStructType열로 구문 분석합니다.

FromJson(Column, String, Dictionary<String,String>)

JSON 문자열이 포함된 열을 지정된 스키마를 StructType 사용하여 또는 ArrayTypeStructType열로 구문 분석합니다.

FromUnixTime(Column)

UNIX epoch(1970-01-01 00:00 UTC)의 초 수를 기본 형식 "yyyy-MM-dd HH:mm:ss"로 현재 시스템 표준 시간대에서 해당 순간의 타임스탬프를 나타내는 문자열로 변환합니다.

FromUnixTime(Column, String)

UNIX epoch(1970-01-01 00:00 UTC)의 초 수를 지정된 형식의 현재 시스템 표준 시간대에서 해당 순간의 타임스탬프를 나타내는 문자열로 변환합니다.

FromUtcTimestamp(Column, Column)

'2017-07-14 02:40:00.0'과 같은 타임스탬프가 제공되면 UTC로 해석하고 해당 시간을 지정된 표준 시간대의 타임스탬프로 렌더링합니다. 예를 들어 'GMT+1'은 '2017-07-14 03:40:00.0'을 생성합니다.

FromUtcTimestamp(Column, String)

'2017-07-14 02:40:00.0'과 같은 타임스탬프가 제공되면 UTC로 해석하고 해당 시간을 지정된 표준 시간대의 타임스탬프로 렌더링합니다. 예를 들어 'GMT+1'은 '2017-07-14 03:40:00.0'을 생성합니다.

GetJsonObject(Column, String)

지정된 경로에 따라 JSON 문자열에서 JSON 개체를 추출하고 추출된 JSON 개체의 JSON 문자열을 반환합니다.

Greatest(Column[])

null 값을 건너뛰고 값 목록의 가장 큰 값을 반환합니다.

Greatest(String, String[])

null 값을 건너뛰고 열 이름 목록의 가장 큰 값을 반환합니다.

Grouping(Column)

GROUP BY 목록의 지정된 열이 집계되는지 여부를 나타내며, 집계된 열의 경우 1을 반환하고 결과 집합에 집계되지 않은 경우 0을 반환합니다.

Grouping(String)

GROUP BY 목록의 지정된 열이 집계되는지 여부를 나타내며, 집계된 열의 경우 1을 반환하고 결과 집합에 집계되지 않은 경우 0을 반환합니다.

GroupingId(Column[])

그룹의 고유 항목 수를 반환합니다.

GroupingId(String, String[])

그룹의 고유 항목 수를 반환합니다.

Hash(Column[])

지정된 열의 해시 코드를 계산하고 결과를 int 열로 반환합니다.

Hex(Column)

지정된 열의 16진수 값을 계산합니다.

Hour(Column)

지정된 날짜/타임스탬프/문자열에서 시간을 정수로 추출합니다.

Hours(Column)

타임스탬프를 사용하여 데이터를 시간 단위로 분할하는 변환입니다.

Hypot(Column, Column)

sqrt(a^2^ + b^2^) 중간 오버플로 또는 언더플로가 없는 컴퓨팅.

Hypot(Column, Double)

sqrt(a^2^ + b^2^) 중간 오버플로 또는 언더플로가 없는 컴퓨팅.

Hypot(Column, String)

sqrt(a^2^ + b^2^) 중간 오버플로 또는 언더플로가 없는 컴퓨팅.

Hypot(Double, Column)

sqrt(a^2^ + b^2^) 중간 오버플로 또는 언더플로가 없는 컴퓨팅.

Hypot(Double, String)

sqrt(a^2^ + b^2^) 중간 오버플로 또는 언더플로가 없는 컴퓨팅.

Hypot(String, Column)

sqrt(a^2^ + b^2^) 중간 오버플로 또는 언더플로가 없는 컴퓨팅.

Hypot(String, Double)

sqrt(a^2^ + b^2^) 중간 오버플로 또는 언더플로가 없는 컴퓨팅.

Hypot(String, String)

sqrt(a^2^ + b^2^) 중간 오버플로 또는 언더플로가 없는 컴퓨팅.

InitCap(Column)

각 단어의 첫 글자를 대문자로 변환하여 새 문자열 열을 반환합니다. 단어는 공백으로 구분됩니다.

InputFileName()

현재 Spark 작업의 파일 이름에 대한 문자열 열을 만듭니다.

Instr(Column, String)

지정된 부분 문자열의 첫 번째 발생 위치를 찾습니다.

IsNaN(Column)

열이 NaN인 true iff를 반환합니다.

IsNull(Column)

열이 null인 true iff를 반환합니다.

JsonTuple(Column, String[])

지정된 필드 이름에 따라 JSON 열에 대한 새 행을 만듭니다.

Kurtosis(Column)

그룹에 있는 값의 첨도를 반환합니다.

Kurtosis(String)

그룹에 있는 값의 첨도를 반환합니다.

Lag(Column, Int32, Object)

Window 함수: 현재 행 앞에 'offset' 행인 값을 반환하고, 현재 행 앞에 'offset' 행이 없으면 null을 반환합니다. 예를 들어 하나의 '오프셋'은 창 파티션의 지정된 지점에서 이전 행을 반환합니다.

Lag(String, Int32, Object)

Window 함수: 현재 행 앞에 'offset' 행인 값을 반환하고, 현재 행 앞에 'offset' 행이 없으면 null을 반환합니다. 예를 들어 하나의 '오프셋'은 창 파티션의 지정된 지점에서 이전 행을 반환합니다.

Last(Column, Boolean)

그룹에 있는 열의 마지막 값을 반환합니다.

Last(String, Boolean)

그룹에 있는 열의 마지막 값을 반환합니다.

LastDay(Column)

지정된 날짜가 속한 월의 마지막 날짜를 반환합니다.

Lead(Column, Int32, Object)

Window 함수: 현재 행 뒤의 '오프셋' 행 값을 반환하고, 현재 행 뒤의 '오프셋' 행보다 작은 경우 null을 반환합니다. 예를 들어 하나의 '오프셋'은 창 파티션의 지정된 지점에서 다음 행을 반환합니다.

Lead(String, Int32, Object)

Window 함수: 현재 행 뒤의 '오프셋' 행 값을 반환하고, 현재 행 뒤의 '오프셋' 행보다 작은 경우 null을 반환합니다. 예를 들어 하나의 '오프셋'은 창 파티션의 지정된 지점에서 다음 행을 반환합니다.

Least(Column[])

null 값을 건너뛰고 값 목록의 최소 값을 반환합니다.

Least(String, String[])

null 값을 건너뛰고 값 목록의 최소 값을 반환합니다.

Length(Column)

지정된 문자열의 문자 길이 또는 이진 문자열의 바이트 수를 계산합니다.

Levenshtein(Column, Column)

지정된 두 문자열 열의 Levenshtein 거리를 계산합니다.

Lit(Object)

리터럴 값의 열을 만듭니다.

Locate(String, Column)

지정된 부분 문자열의 첫 번째 발생 위치를 찾습니다.

Locate(String, Column, Int32)

지정된 위치 오프셋에서 시작하는 지정된 부분 문자열의 첫 번째 발생 위치를 찾습니다.

Log(Column)

지정된 값의 자연 로그를 계산합니다.

Log(Double, Column)

두 번째 인수의 첫 번째 인수-기본 로그를 계산합니다.

Log(Double, String)

두 번째 인수의 첫 번째 인수-기본 로그를 계산합니다.

Log(String)

지정된 값의 자연 로그를 계산합니다.

Log10(Column)

기본 10에서 지정된 값의 로그를 계산합니다.

Log10(String)

기본 10에서 지정된 값의 로그를 계산합니다.

Log1p(Column)

지정된 값의 자연 로그와 1을 계산합니다.

Log1p(String)

지정된 값의 자연 로그와 1을 계산합니다.

Log2(Column)

기본 2에서 지정된 열의 로그를 계산합니다.

Log2(String)

기본 2에서 지정된 열의 로그를 계산합니다.

Lower(Column)

문자열 열을 소문자로 변환합니다.

Lpad(Column, Int32, String)

지정된 길이 len에 대한 패드가 있는 문자열 열을 왼쪽으로 패딩합니다. 문자열 열이 보다 len긴 경우 반환 값이 문자로 len 단축됩니다.

Ltrim(Column)

지정된 문자열 열의 왼쪽 끝에서 공백을 트리밍합니다.

Ltrim(Column, String)

지정된 문자열 열의 왼쪽 끝에서 지정된 문자열을 자꿉니다.

Map(Column[])

새 지도 열을 만듭니다.

MapConcat(Column[])

지정된 모든 맵의 공용 구조체를 반환합니다.

MapEntries(Column)

지정된 맵에 있는 모든 항목의 순서가 지정되지 않은 배열을 반환합니다.

MapFromArrays(Column, Column)

새 지도 열을 만듭니다. 첫 번째 열의 배열은 키에 사용됩니다. 두 번째 열의 배열은 값에 사용됩니다. 키에 대한 배열의 모든 요소는 null이 아니어야 합니다.

MapFromEntries(Column)

지정된 항목 배열에서 만든 맵을 반환합니다.

MapKeys(Column)

맵의 키를 포함하는 순서가 지정되지 않은 배열을 반환합니다.

MapValues(Column)

맵의 값을 포함하는 순서가 지정되지 않은 배열을 반환합니다.

Max(Column)

그룹에 있는 열의 최대값을 반환합니다.

Max(String)

그룹에 있는 열의 최대값을 반환합니다.

Md5(Column)

이진 열의 MD5 다이제스트를 계산하고 값을 32자 16진수 문자열로 반환합니다.

Mean(Column)

그룹에 있는 열의 평균 값을 반환합니다.

Mean(String)

그룹에 있는 열의 평균 값을 반환합니다.

Min(Column)

그룹에 있는 열의 최소값을 반환합니다.

Min(String)

그룹에 있는 열의 최소값을 반환합니다.

Minute(Column)

분을 지정된 날짜/타임스탬프/문자열에서 정수로 추출합니다.

MonotonicallyIncreasingId()

단조롭게 증가하는 64비트 정수를 생성하는 열 식입니다.

Month(Column)

지정된 날짜/타임스탬프/문자열에서 월을 정수로 추출합니다.

Months(Column)

데이터를 월로 분할하는 타임스탬프 및 날짜에 대한 변환입니다.

MonthsBetween(Column, Column)

날짜 end 와 사이의 월 수를 반환합니다 stasrt.

MonthsBetween(Column, Column, Boolean)

날짜 end 와 사이의 월 수를 반환합니다 start. 가 true로 설정된 경우 roundOff 결과는 8자리로 반올림됩니다. 그렇지 않으면 반올림되지 않습니다.

NaNvl(Column, Column)

NaN이 아니면 col1을 반환하고 col1이 NaN이면 col2를 반환합니다.

Negate(Column)

단항 빼기, 즉 식을 부정합니다.

NextDay(Column, String)

날짜 열이 지정된 경우 은 지정된 요일에 있는 날짜 열 값보다 오래된 첫 번째 날짜를 반환합니다.

Not(Column)

부울 식의 반전(예: NOT)

Ntile(Int32)

Window 함수: 순서가 지정된 창 파티션에서 ntile 그룹 ID(1 n 에서 포괄)를 반환합니다. 예를 들어 가 4이면 n 행의 1분기는 값 1을, 2분기는 2를, 3분기는 3을, 마지막 분기는 4를 얻습니다.

Overlay(Column, Column, Column)

의 바이트 위치에서 possrc시작하여 의 src 지정된 부분을 로 replace오버레이합니다.

Overlay(Column, Column, Column, Column)

의 지정된 부분을 srcreplace로 오버레이하고 의 바이트 위치에서 possrc 시작하여 바이트 단위로 len 진행합니다.

PercentRank()

Window 함수: 창 파티션 내 행의 상대 순위(즉, 백분위수)를 반환합니다.

Pmod(Column, Column)

배당 모드 수수의 양수 값을 반환합니다.

PosExplode(Column)

지정된 배열 또는 지도 열에 위치가 있는 각 요소에 대해 새 행을 만듭니다.

PosExplodeOuter(Column)

지정된 배열 또는 지도 열에 위치가 있는 각 요소에 대해 새 행을 만듭니다. Posexplode()와 달리 배열/맵이 null이거나 비어 있으면 row(null, null)가 생성됩니다.

Pow(Column, Column)

두 번째 인수의 권한으로 발생한 첫 번째 인수의 값을 반환합니다.

Pow(Column, Double)

두 번째 인수의 권한으로 발생한 첫 번째 인수의 값을 반환합니다.

Pow(Column, String)

두 번째 인수의 권한으로 발생한 첫 번째 인수의 값을 반환합니다.

Pow(Double, Column)

두 번째 인수의 권한으로 발생한 첫 번째 인수의 값을 반환합니다.

Pow(Double, String)

두 번째 인수의 권한으로 발생한 첫 번째 인수의 값을 반환합니다.

Pow(String, Column)

두 번째 인수의 권한으로 발생한 첫 번째 인수의 값을 반환합니다.

Pow(String, Double)

두 번째 인수의 권한으로 발생한 첫 번째 인수의 값을 반환합니다.

Pow(String, String)

두 번째 인수의 권한으로 발생한 첫 번째 인수의 값을 반환합니다.

Quarter(Column)

지정된 날짜/타임스탬프/문자열에서 분기를 정수로 추출합니다.

Radians(Column)

도 단위로 측정된 각도를 라디안 단위로 측정된 거의 동일한 각도로 변환합니다.

Radians(String)

도 단위로 측정된 각도를 라디안 단위로 측정된 거의 동일한 각도로 변환합니다.

Rand()

U[0.0, 1.0]에서 독립적이고 동일하게 분산된(i.i.d.) 샘플을 사용하여 임의 열을 생성합니다.

Rand(Int64)

U[0.0, 1.0]에서 독립적이고 동일하게 분산된(i.i.d.) 샘플을 사용하여 임의 열을 생성합니다.

Randn()

표준 정규 분포에서 독립적이고 동일하게 분산된(즉, d.d.) 샘플을 사용하여 임의 열을 생성합니다.

Randn(Int64)

표준 정규 분포에서 독립적이고 동일하게 분산된(즉, d.d.) 샘플을 사용하여 임의 열을 생성합니다.

Rank()

Window 함수: 창 파티션 내 행의 순위를 반환합니다.

RegexpExtract(Column, String, Int32)

지정된 문자열 열에서 Java regex와 일치하는 특정 그룹을 추출합니다.

RegexpReplace(Column, Column, Column)

패턴과 일치하는 지정된 문자열 값의 모든 부분 문자열을 지정된 대체 문자열로 바꿉니다.

RegexpReplace(Column, String, String)

패턴과 일치하는 지정된 문자열 값의 모든 부분 문자열을 지정된 대체 문자열로 바꿉니다.

Repeat(Column, Int32)

문자열 열을 n 여러 번 반복하고 새 문자열 열로 반환합니다.

Reverse(Column)

문자열 열을 역방향으로 바꾸고 새 문자열 열로 반환합니다.

Rint(Column)

인수에 가장 가깝고 수학 정수와 같은 double 값을 반환합니다.

Rint(String)

인수에 가장 가깝고 수학 정수와 같은 double 값을 반환합니다.

Round(Column)

HALF_UP 라운드 모드를 사용하여 반올림된 소수 자릿수의 값을 column 0으로 반환합니다.

Round(Column, Int32)

HALF_UP 라운드 모드를 column 사용하여 scale 반올림된 소수 자릿수의 값을 반환합니다.

RowNumber()

Window 함수: 창 파티션 내에서 1부터 시작하는 순차 번호를 반환합니다.

Rpad(Column, Int32, String)

지정된 길이 len에 대한 pad를 사용하여 문자열 열을 오른쪽 패드로 채 니다. 문자열 열이 보다 len긴 경우 반환 값이 문자로 len 단축됩니다.

Rtrim(Column)

지정한 문자열 값의 오른쪽 끝에서 공백을 잘라 니다.

Rtrim(Column, String)

지정된 문자열 열의 오른쪽 끝에서 지정된 문자열을 자른다.

SchemaOfCsv(Column)

CSV 문자열을 구문 분석하고 해당 스키마를 DDL 형식으로 유추합니다.

SchemaOfCsv(Column, Dictionary<String,String>)

CSV 문자열을 구문 분석하고 해당 스키마를 DDL 형식으로 유추합니다.

SchemaOfCsv(String)

CSV 문자열을 구문 분석하고 해당 스키마를 DDL 형식으로 유추합니다.

SchemaOfJson(Column)

JSON 문자열을 구문 분석하고 해당 스키마를 DDL 형식으로 유추합니다.

SchemaOfJson(Column, Dictionary<String,String>)

JSON 문자열을 구문 분석하고 해당 스키마를 DDL 형식으로 유추합니다.

SchemaOfJson(String)

JSON 문자열을 구문 분석하고 해당 스키마를 DDL 형식으로 유추합니다.

Second(Column)

지정된 날짜/타임스탬프/문자열에서 초를 정수로 추출합니다.

Sequence(Column, Column)

시작부터 중지까지 정수 시퀀스를 생성하고, 시작이 중지보다 작거나 같으면 1씩 증가합니다. 그렇지 않으면 -1입니다.

Sequence(Column, Column, Column)

에서 로 증분하는 정수 시퀀스를 생성합니다 startstopstep.

Sha1(Column)

이진 열의 SHA-1 다이제스트를 계산하고 값을 40자 16진수 문자열로 반환합니다.

Sha2(Column, Int32)

이진 열의 해시 함수 SHA-2 패밀리를 계산하고 값을 16진수 문자열로 반환합니다.

ShiftLeft(Column, Int32)

지정된 값을 numBits 왼쪽으로 이동합니다.

ShiftRight(Column, Int32)

(서명됨) 지정된 값을 numBits 오른쪽으로 이동합니다.

ShiftRightUnsigned(Column, Int32)

서명되지 않은 경우 지정된 값 numBits 이 오른쪽으로 이동합니다.

Shuffle(Column)

지정된 배열의 임의 순열을 반환합니다.

Signum(Column)

지정된 값의 기호를 계산합니다.

Signum(String)

지정된 값의 기호를 계산합니다.

Sin(Column)

에서 계산하는 것처럼 각도의 사인을 java.lang.Math.sin계산합니다.

Sin(String)

에서 계산하는 것처럼 각도의 사인을 java.lang.Math.sin계산합니다.

Sinh(Column)

에서 계산하는 것처럼 각도의 쌍곡선 사인을 java.lang.Math.sin계산합니다.

Sinh(String)

에서 계산하는 것처럼 각도의 쌍곡선 사인을 java.lang.Math.sin계산합니다.

Size(Column)

배열 또는 맵의 길이를 반환합니다.

Skewness(Column)

그룹에 있는 값의 기울이기를 반환합니다.

Skewness(String)

그룹에 있는 값의 기울이기를 반환합니다.

Slice(Column, Int32, Int32)

지정된 length를 사용하여 인덱 start 스에서 의 모든 요소를 column 포함하는 배열을 반환합니다(또는 가 음수이면 start 끝에서 시작).

SortArray(Column, Boolean)

지정된 열의 입력 배열을 배열 요소의 자연스러운 순서인 오름차순(기본값) 또는 내림차순으로 정렬합니다.

Soundex(Column)

지정된 식의 soundex 코드를 반환합니다.

SparkPartitionId()

파티션 ID입니다.

Split(Column, String)

정규식 패턴으로 문자열을 분할합니다.

Split(Column, String, Int32)

분할은 지정된 패턴의 일치 항목 주위에 스트럿됩니다.

Sqrt(Column)

지정된 float 값의 제곱근을 계산합니다.

Sqrt(String)

지정된 float 값의 제곱근을 계산합니다.

Stddev(Column)

StddevSamp()의 별칭입니다.

Stddev(String)

StddevSamp()의 별칭입니다.

StddevPop(Column)

그룹에 있는 식의 모집단 표준 편차를 반환합니다.

StddevPop(String)

그룹에 있는 식의 모집단 표준 편차를 반환합니다.

StddevSamp(Column)

그룹에 있는 식의 샘플 표준 편차를 반환합니다.

StddevSamp(String)

그룹에 있는 식의 샘플 표준 편차를 반환합니다.

Struct(Column[])

여러 입력 열을 구성하는 새 구조체 열을 만듭니다.

Struct(String, String[])

여러 입력 열을 구성하는 새 구조체 열을 만듭니다.

Substring(Column, Int32, Int32)

지정된 길이에 대해 지정된 위치에서 시작하는 부분 문자열(또는 바이트 배열 조각)을 반환합니다.

SubstringIndex(Column, String, Int32)

지정된 구분 기호가 발생하기 전에 count 지정된 문자열의 부분 문자열을 반환합니다.

Sum(Column)

식에 있는 모든 값의 합계를 반환합니다.

Sum(String)

식에 있는 모든 값의 합계를 반환합니다.

SumDistinct(Column)

식에 있는 고유 값의 합계를 반환합니다.

SumDistinct(String)

식에 있는 고유 값의 합계를 반환합니다.

Tan(Column)

에서 계산하는 것처럼 지정된 값의 탄젠트를 계산 java.lang.Math.tan합니다.

Tan(String)

에서 계산하는 것처럼 지정된 값의 탄젠트를 계산 java.lang.Math.tan합니다.

Tanh(Column)

에서 계산하는 것처럼 지정된 값의 쌍곡선 탄젠트를 계산 java.lang.Math.tanh합니다.

Tanh(String)

에서 계산하는 것처럼 지정된 값의 쌍곡선 탄젠트를 계산 java.lang.Math.tanh합니다.

ToCsv(Column)

가 포함된 StructType 열을 지정된 스키마가 있는 CSV 문자열로 변환합니다.

ToCsv(Column, Dictionary<String,String>)

가 포함된 StructType 열을 지정된 스키마가 있는 CSV 문자열로 변환합니다.

ToDate(Column)

규칙을 DateType로 캐스팅하여 열을 로 DateType 변환합니다.

ToDate(Column, String)

열을 지정된 형식의 로 DateType 변환합니다.

ToJson(Column, Dictionary<String,String>)

가 포함된 StructType열( sStructType, 또는 ArrayTypeMapType)을 MapType JSON 문자열로 변환 ArrayType 합니다.

ToTimestamp(Column)

규칙을 로 캐스팅하여 시간 문자열을 Unix 타임스탬프(초)로 TimestampType변환합니다.

ToTimestamp(Column, String)

시간 문자열을 지정된 형식의 Unix 타임스탬프(초)로 변환합니다.

ToUtcTimestamp(Column, Column)

'2017-07-14 02:40:00.0'과 같은 타임스탬프가 지정된 표준 시간대의 시간으로 해석되고 해당 시간을 UTC의 타임스탬프로 렌더링합니다. 예를 들어 'GMT+1'은 '2017-07-14 01:40:00.0'을 생성합니다.

ToUtcTimestamp(Column, String)

'2017-07-14 02:40:00.0'과 같은 타임스탬프가 지정된 표준 시간대의 시간으로 해석되고 해당 시간을 UTC의 타임스탬프로 렌더링합니다. 예를 들어 'GMT+1'은 '2017-07-14 01:40:00.0'을 생성합니다.

Translate(Column, String, String)

지정된 replaceString를 사용하여 열의 지정된 matchingString 와 일치하는 문자를 변환합니다.

Trim(Column)

지정된 문자열 열의 양쪽 끝에서 공백을 잘라냅니다.

Trim(Column, String)

지정된 문자열 열의 양쪽 끝에서 지정된 문자를 잘라냅니다.

Trunc(Column, String)

형식으로 지정된 단위로 잘린 날짜를 반환합니다.

Udf(Func<Row>, StructType)

지정된 대리자에서 UDF를 만듭니다.

Udf<A1,RT>(Func<A1,RT>)

지정된 대리자에서 UDF를 만듭니다.

Udf<T>(Func<T,Row>, StructType)

지정된 대리자에서 UDF를 만듭니다.

Udf<T1,T2,T3,T4,T5,T6,T7,T8,T9,T10,TResult>(Func<T1,T2,T3,T4,T5,T6,T7,T8,T9,T10,TResult>)

지정된 대리자에서 UDF를 만듭니다.

Udf<T1,T2,T3,T4,T5,T6,T7,T8,T9,T10>(Func<T1,T2,T3,T4,T5,T6,T7,T8,T9,T10,Row>, StructType)

지정된 대리자에서 UDF를 만듭니다.

Udf<T1,T2,T3,T4,T5,T6,T7,T8,T9,TResult>(Func<T1,T2,T3,T4,T5,T6,T7,T8,T9,TResult>)

지정된 대리자에서 UDF를 만듭니다.

Udf<T1,T2,T3,T4,T5,T6,T7,T8,T9>(Func<T1,T2,T3,T4,T5,T6,T7,T8,T9,Row>, StructType)

지정된 대리자에서 UDF를 만듭니다.

Udf<T1,T2,T3,T4,T5,T6,T7,T8,TResult>(Func<T1,T2,T3,T4,T5,T6,T7,T8,TResult>)

지정된 대리자에서 UDF를 만듭니다.

Udf<T1,T2,T3,T4,T5,T6,T7,T8>(Func<T1,T2,T3,T4,T5,T6,T7,T8,Row>, StructType)

지정된 대리자에서 UDF를 만듭니다.

Udf<T1,T2,T3,T4,T5,T6,T7,TResult>(Func<T1,T2,T3,T4,T5,T6,T7,TResult>)

지정된 대리자에서 UDF를 만듭니다.

Udf<T1,T2,T3,T4,T5,T6,T7>(Func<T1,T2,T3,T4,T5,T6,T7,Row>, StructType)

지정된 대리자에서 UDF를 만듭니다.

Udf<T1,T2,T3,T4,T5,T6,TResult>(Func<T1,T2,T3,T4,T5,T6,TResult>)

지정된 대리자에서 UDF를 만듭니다.

Udf<T1,T2,T3,T4,T5,T6>(Func<T1,T2,T3,T4,T5,T6,Row>, StructType)

지정된 대리자에서 UDF를 만듭니다.

Udf<T1,T2,T3,T4,T5,TResult>(Func<T1,T2,T3,T4,T5,TResult>)

지정된 대리자에서 UDF를 만듭니다.

Udf<T1,T2,T3,T4,T5>(Func<T1,T2,T3,T4,T5,Row>, StructType)

지정된 대리자에서 UDF를 만듭니다.

Udf<T1,T2,T3,T4,TResult>(Func<T1,T2,T3,T4,TResult>)

지정된 대리자에서 UDF를 만듭니다.

Udf<T1,T2,T3,T4>(Func<T1,T2,T3,T4,Row>, StructType)

지정된 대리자에서 UDF를 만듭니다.

Udf<T1,T2,T3,TResult>(Func<T1,T2,T3,TResult>)

지정된 대리자에서 UDF를 만듭니다.

Udf<T1,T2,T3>(Func<T1,T2,T3,Row>, StructType)

지정된 대리자에서 UDF를 만듭니다.

Udf<T1,T2,TResult>(Func<T1,T2,TResult>)

지정된 대리자에서 UDF를 만듭니다.

Udf<T1,T2>(Func<T1,T2,Row>, StructType)

지정된 대리자에서 UDF를 만듭니다.

Udf<TResult>(Func<TResult>)

지정된 대리자에서 UDF를 만듭니다.

Unbase64(Column)

BASE64로 인코딩된 문자열 열을 디코딩하고 이진 열로 반환합니다.

UnboundedFollowing()

창 함수: 창 파티션의 마지막 행을 나타내는 특수 프레임 경계를 반환합니다.

UnboundedPreceding()

Window 함수: 창 파티션의 첫 번째 행을 나타내는 특수 프레임 경계를 반환합니다.

Unhex(Column)

16진수와 반대입니다. 각 문자 쌍을 16진수로 해석하고 숫자의 바이트 표현으로 변환합니다.

UnixTimestamp()

현재 Unix 타임스탬프(초)를 반환합니다.

UnixTimestamp(Column)

기본 표준 시간대 및 기본 로캘을 사용하여 yyyy-MM-dd HH:mm:ss 형식의 시간 문자열을 Unix 타임스탬프(초)로 변환합니다.

UnixTimestamp(Column, String)

지정된 형식의 시간 문자열을 Unix 타임스탬프(초)로 변환합니다.

Upper(Column)

문자열 열을 대문자로 변환합니다.

Variance(Column)

VarSamp()의 별칭입니다.

Variance(String)

VarSamp()의 별칭입니다.

VarPop(Column)

그룹에 있는 값의 모집단 분산을 반환합니다.

VarPop(String)

그룹에 있는 값의 모집단 분산을 반환합니다.

VarSamp(Column)

그룹에 있는 값의 분산을 반환합니다.

VarSamp(String)

그룹에 있는 값의 분산을 반환합니다.

WeekOfYear(Column)

지정된 날짜/타임스탬프/문자열에서 주 번호를 정수로 추출합니다.

When(Column, Object)

조건을 평가하고 가능한 여러 결과 식 중 하나를 반환합니다. 그렇지 않으면 끝에 정의되지 않은 경우 일치하지 않는 조건에 대해 null이 반환됩니다.

Window(Column, String)

열을 지정하는 타임스탬프가 지정된 경우 연속 시간 창을 생성합니다.

Window(Column, String, String)

타임스탬프 열이 지정된 경우 행을 하나 이상의 시간 창으로 버킷화합니다.

Window(Column, String, String, String)

타임스탬프 열이 지정된 경우 행을 하나 이상의 시간 창으로 버킷화합니다.

XXHash64(Column[])

xxHash 알고리즘의 64비트 변형을 사용하여 지정된 열의 해시 코드를 계산하고 결과를 긴 열로 반환합니다.

Year(Column)

지정된 날짜/타임스탬프/문자열에서 연도를 정수로 추출합니다.

Years(Column)

데이터를 연도로 분할하기 위한 타임스탬프 및 날짜 변환입니다.

적용 대상