Functions 클래스
정의
중요
일부 정보는 릴리스되기 전에 상당 부분 수정될 수 있는 시험판 제품과 관련이 있습니다. Microsoft는 여기에 제공된 정보에 대해 어떠한 명시적이거나 묵시적인 보증도 하지 않습니다.
DataFrame 작업에 사용할 수 있는 함수입니다.
public static class Functions
type Functions = class
Public Class Functions
- 상속
-
Functions
메서드
| Abs(Column) |
절대값을 계산합니다. |
| Acos(Column) |
에 의해 |
| Acos(String) |
에 의해 |
| AddMonths(Column, Column) |
|
| AddMonths(Column, Int32) |
|
| ApproxCountDistinct(Column) |
그룹의 대략적인 고유 항목 수를 반환합니다. |
| ApproxCountDistinct(Column, Double) |
그룹의 대략적인 고유 항목 수를 반환합니다. |
| ApproxCountDistinct(String) |
그룹의 대략적인 고유 항목 수를 반환합니다. |
| ApproxCountDistinct(String, Double) |
그룹의 대략적인 고유 항목 수를 반환합니다. |
| Array(Column[]) |
새 배열 열을 만듭니다. 입력 열은 모두 동일한 데이터 형식이어야 합니다. |
| Array(String, String[]) |
새 배열 열을 만듭니다. 입력 열은 모두 동일한 데이터 형식이어야 합니다. |
| ArrayContains(Column, Object) |
배열이 null이면 null을 반환하고, 배열에 이 있으면 true를 반환하고, 그렇지 않으면 false를 반환합니다 |
| ArrayDistinct(Column) |
배열에서 중복 값을 제거합니다. |
| ArrayExcept(Column, Column) |
에 있는 요소의 배열을 |
| ArrayIntersect(Column, Column) |
지정된 두 배열의 교집합에 있는 요소의 배열을 중복 없이 반환합니다. |
| ArrayJoin(Column, String) |
를 사용하여 의 |
| ArrayJoin(Column, String, String) |
를 사용하여 의 |
| ArrayMax(Column) |
배열의 최대값을 반환합니다. |
| ArrayMin(Column) |
배열의 최소값을 반환합니다. |
| ArrayPosition(Column, Object) |
지정된 배열에서 값이 처음 나타나는 위치를 오랫동안 찾습니다. 인수 중 하나가 null이면 null을 반환합니다. |
| ArrayRemove(Column, Object) |
지정된 배열에서 요소와 동일한 모든 요소를 제거합니다. |
| ArrayRepeat(Column, Column) |
인수가 지정한 횟수를 반복하는 |
| ArrayRepeat(Column, Int32) |
횟수를 반복하는 인수를 |
| ArraySort(Column) |
입력 배열을 오름차순으로 정렬합니다. 입력 배열의 요소는 정렬 가능해야 합니다. null 요소는 반환된 배열의 끝에 배치됩니다. |
| ArraysOverlap(Column, Column) |
null이 아닌 요소가 하나 이상 공통된 경우 |
| ArraysZip(Column[]) |
N번째 구조체에 입력 배열의 모든 N번째 값이 포함된 구조체의 병합된 배열을 반환합니다. |
| ArrayUnion(Column, Column) |
중복 없이 지정된 두 배열의 공용 구조체에 있는 요소의 배열을 반환합니다. |
| Asc(String) |
열의 오름차순에 따라 정렬 식을 반환합니다. |
| Ascii(Column) |
문자열 열의 첫 번째 문자의 숫자 값을 계산하고 결과를 int 열로 반환합니다. |
| AscNullsFirst(String) |
열의 오름차순에 따라 정렬 식을 반환하고 null 값은 null이 아닌 값 앞에 반환됩니다. |
| AscNullsLast(String) |
열의 오름차순에 따라 정렬 식을 반환하고 null 값이 null이 아닌 값 다음에 나타납니다. |
| Asin(Column) |
에 의해 |
| Asin(String) |
에 의해 |
| Atan(Column) |
에 의해 |
| Atan(String) |
에 의해 |
| Atan2(Column, Column) |
지정된 |
| Atan2(Column, Double) |
지정된 |
| Atan2(Column, String) |
지정된 |
| Atan2(Double, Column) |
지정된 |
| Atan2(Double, String) |
지정된 |
| Atan2(String, Column) |
지정된 |
| Atan2(String, Double) |
지정된 |
| Atan2(String, String) |
지정된 |
| Avg(Column) |
그룹 내 값의 평균을 반환합니다. |
| Avg(String) |
그룹 내 값의 평균을 반환합니다. |
| Base64(Column) |
이진 열의 BASE64 인코딩을 계산하고 문자열 열로 반환합니다. |
| Bin(Column) |
지정된 long 열의 이진 값에 대한 문자열 표현을 반환하는 식입니다. 예를 들어 bin("12")은 "1100"을 반환합니다. |
| Bin(String) |
지정된 long 열의 이진 값에 대한 문자열 표현을 반환하는 식입니다. 예를 들어 bin("12")은 "1100"을 반환합니다. |
| BitwiseNOT(Column) |
비트 NOT를 계산합니다. |
| Broadcast(DataFrame) |
브로드캐스트 조인에 사용할 수 있을 만큼 작은 데이터 프레임을 표시합니다. |
| Bround(Column) |
HALF_EVEN 라운드 모드를 사용하여 반올림된 소수 자릿수의 값을 |
| Bround(Column, Int32) |
HALF_EVEN 라운드 모드를 사용하여 |
| Bucket(Column, Column) |
입력 열의 해시로 분할하는 모든 형식에 대한 변환입니다. |
| Bucket(Int32, Column) |
입력 열의 해시로 분할하는 모든 형식에 대한 변환입니다. |
| CallUDF(String, Column[]) |
SparkSession.Udf()를 통해 등록된 사용자 정의 함수를 호출합니다. Register(). |
| Cbrt(Column) |
지정된 열의 큐브 루트를 계산합니다. |
| Cbrt(String) |
지정된 열의 큐브 루트를 계산합니다. |
| Ceil(Column) |
지정된 값의 최대값을 계산합니다. |
| Ceil(String) |
지정된 값의 최대값을 계산합니다. |
| Coalesce(Column[]) |
null이 아닌 첫 번째 열을 반환하거나 모든 입력이 null인 경우 null을 반환합니다. |
| Col(String) |
지정된 열 이름을 기준으로 열을 반환합니다. Column()의 별칭입니다. |
| CollectList(Column) |
중복된 개체 목록을 반환합니다. |
| CollectList(String) |
중복된 개체 목록을 반환합니다. |
| CollectSet(Column) |
중복 요소가 제거된 개체 집합을 반환합니다. |
| CollectSet(String) |
중복 요소가 제거된 개체 집합을 반환합니다. |
| Column(String) |
지정된 열 이름을 기준으로 열을 반환합니다. |
| Concat(Column[]) |
여러 입력 열을 단일 열로 연결합니다. |
| ConcatWs(String, Column[]) |
지정된 구분 기호를 사용하여 여러 입력 문자열 열을 단일 문자열 열로 연결합니다. |
| Conv(Column, Int32, Int32) |
문자열 열의 숫자를 한 베이스에서 다른 밑으로 변환합니다. |
| Corr(Column, Column) |
두 열에 대한 Pearson 상관 관계 계수를 반환합니다. |
| Corr(String, String) |
두 열에 대한 Pearson 상관 관계 계수를 반환합니다. |
| Cos(Column) |
에서 계산하는 것처럼 각도의 코사인을 계산합니다. |
| Cos(String) |
에서 계산하는 것처럼 각도의 코사인을 계산합니다. |
| Cosh(Column) |
을 계산하는 것처럼 각도의 쌍곡선 코사인을 계산합니다. |
| Cosh(String) |
을 계산하는 것처럼 각도의 쌍곡선 코사인을 계산합니다. |
| Count(Column) |
그룹의 항목 개수를 반환합니다. |
| Count(String) |
그룹의 항목 개수를 반환합니다. |
| CountDistinct(Column, Column[]) |
그룹의 고유 항목 수를 반환합니다. |
| CountDistinct(String, String[]) |
그룹의 고유 항목 수를 반환합니다. |
| CovarPop(Column, Column) |
두 열의 모집단 공변을 반환합니다. |
| CovarPop(String, String) |
두 열의 모집단 공변을 반환합니다. |
| CovarSamp(Column, Column) |
두 열에 대한 샘플 공변을 반환합니다. |
| CovarSamp(String, String) |
두 열에 대한 샘플 공변을 반환합니다. |
| Crc32(Column) |
이진 열의 CRC32(순환 중복 검사 값)를 계산하고 값을 bigint로 반환합니다. |
| CumeDist() |
Window 함수: 창 파티션 내 값의 누적 분포를 반환합니다. 즉, 현재 행 아래에 있는 행의 비율입니다. |
| CurrentDate() |
현재 날짜를 날짜 열로 반환합니다. |
| CurrentRow() |
창 함수: 창 파티션의 현재 행을 나타내는 특수 프레임 경계를 반환합니다. |
| CurrentTimestamp() |
현재 타임스탬프를 타임스탬프 열로 반환합니다. |
| DateAdd(Column, Column) |
일 후의 날짜를 반환합니다 |
| DateAdd(Column, Int32) |
일 후의 날짜를 반환합니다 |
| DateDiff(Column, Column) |
|
| DateFormat(Column, String) |
date/timestamp/string을 두 번째 인수에서 지정한 날짜 형식으로 지정된 형식의 문자열 값으로 변환합니다. |
| DateSub(Column, Column) |
일 전 |
| DateSub(Column, Int32) |
일 전 |
| DateTrunc(String, Column) |
형식으로 지정된 단위로 잘린 타임스탬프를 반환합니다. |
| DayOfMonth(Column) |
지정된 날짜/타임스탬프/문자열에서 월의 날짜를 정수로 추출합니다. |
| DayOfWeek(Column) |
지정된 날짜/타임스탬프/문자열에서 요일을 정수로 추출합니다. |
| DayOfYear(Column) |
지정된 날짜/타임스탬프/문자열에서 해당 요일을 정수로 추출합니다. |
| Days(Column) |
데이터를 일로 분할하는 타임스탬프 및 날짜에 대한 변환입니다. |
| Decode(Column, String) |
제공된 문자 집합('US-ASCII', 'ISO-8859-1', 'UTF-8', 'UTF-16BE', 'UTF-16LE', 'UTF-16' 중 하나)을 사용하여 이진 파일의 문자열로 첫 번째 인수를 계산합니다. |
| Degrees(Column) |
라디안 단위로 측정된 각도를 도 단위로 측정된 대략 동일한 각도로 변환합니다. |
| Degrees(String) |
라디안 단위로 측정된 각도를 도 단위로 측정된 대략 동일한 각도로 변환합니다. |
| DenseRank() |
Window 함수: 간격 없이 창 파티션 내의 행 순위를 반환합니다. |
| Desc(String) |
열의 내림차순에 따라 정렬 식을 반환합니다. |
| DescNullsFirst(String) |
열의 내림차순에 따라 정렬 식을 반환하고 null 값은 null이 아닌 값 앞에 반환됩니다. |
| DescNullsLast(String) |
열의 내림차순에 따라 정렬 식을 반환하고 null 값이 null이 아닌 값 다음에 나타납니다. |
| ElementAt(Column, Object) |
열이 배열인 경우 의 지정된 인덱스에서 |
| Encode(Column, String) |
제공된 문자 집합('US-ASCII', 'ISO-8859-1', 'UTF-8', 'UTF-16BE', 'UTF-16LE', 'UTF-16' 중 하나)을 사용하여 문자열에서 이진 파일로 첫 번째 인수를 계산합니다. |
| Exp(Column) |
지정된 값의 지수를 계산합니다. |
| Exp(String) |
지정된 값의 지수를 계산합니다. |
| Explode(Column) |
지정된 배열 또는 맵 열의 각 요소에 대해 새 행을 만듭니다. |
| ExplodeOuter(Column) |
지정된 배열 또는 맵 열의 각 요소에 대해 새 행을 만듭니다. Explode()와 달리 배열/맵이 null이거나 비어 있으면 null이 생성됩니다. |
| Expm1(Column) |
지정된 값의 지수에서 1을 뺀 값을 계산합니다. |
| Expm1(String) |
지정된 값의 지수에서 1을 뺀 값을 계산합니다. |
| Expr(String) |
식 문자열을 나타내는 열로 구문 분석합니다. |
| Factorial(Column) |
지정된 값의 요소를 계산합니다. |
| First(Column, Boolean) |
그룹에 있는 열의 첫 번째 값을 반환합니다. |
| First(String, Boolean) |
그룹에 있는 열의 첫 번째 값을 반환합니다. |
| Flatten(Column) |
배열 배열에서 단일 배열을 만듭니다. 중첩된 배열의 구조가 두 수준보다 깊으면 한 수준의 중첩만 제거됩니다. |
| Floor(Column) |
지정된 값의 바닥을 계산합니다. |
| Floor(String) |
지정된 값의 바닥을 계산합니다. |
| FormatNumber(Column, Int32) |
지정된 숫자 |
| FormatString(String, Column[]) |
인수의 형식을 printf 스타일로 지정하고 결과를 문자열 열로 반환합니다. |
| FromCsv(Column, Column, Dictionary<String,String>) |
CSV 문자열이 포함된 열을 지정된 스키마가 있는 로 |
| FromCsv(Column, StructType, Dictionary<String,String>) |
CSV 문자열이 포함된 열을 지정된 스키마가 있는 로 |
| FromJson(Column, Column, Dictionary<String,String>) |
JSON 문자열이 포함된 열을 지정된 스키마를 |
| FromJson(Column, String, Dictionary<String,String>) |
JSON 문자열이 포함된 열을 지정된 스키마를 |
| FromUnixTime(Column) |
UNIX epoch(1970-01-01 00:00 UTC)의 초 수를 기본 형식 "yyyy-MM-dd HH:mm:ss"로 현재 시스템 표준 시간대에서 해당 순간의 타임스탬프를 나타내는 문자열로 변환합니다. |
| FromUnixTime(Column, String) |
UNIX epoch(1970-01-01 00:00 UTC)의 초 수를 지정된 형식의 현재 시스템 표준 시간대에서 해당 순간의 타임스탬프를 나타내는 문자열로 변환합니다. |
| FromUtcTimestamp(Column, Column) |
'2017-07-14 02:40:00.0'과 같은 타임스탬프가 제공되면 UTC로 해석하고 해당 시간을 지정된 표준 시간대의 타임스탬프로 렌더링합니다. 예를 들어 'GMT+1'은 '2017-07-14 03:40:00.0'을 생성합니다. |
| FromUtcTimestamp(Column, String) |
'2017-07-14 02:40:00.0'과 같은 타임스탬프가 제공되면 UTC로 해석하고 해당 시간을 지정된 표준 시간대의 타임스탬프로 렌더링합니다. 예를 들어 'GMT+1'은 '2017-07-14 03:40:00.0'을 생성합니다. |
| GetJsonObject(Column, String) |
지정된 경로에 따라 JSON 문자열에서 JSON 개체를 추출하고 추출된 JSON 개체의 JSON 문자열을 반환합니다. |
| Greatest(Column[]) |
null 값을 건너뛰고 값 목록의 가장 큰 값을 반환합니다. |
| Greatest(String, String[]) |
null 값을 건너뛰고 열 이름 목록의 가장 큰 값을 반환합니다. |
| Grouping(Column) |
GROUP BY 목록의 지정된 열이 집계되는지 여부를 나타내며, 집계된 열의 경우 1을 반환하고 결과 집합에 집계되지 않은 경우 0을 반환합니다. |
| Grouping(String) |
GROUP BY 목록의 지정된 열이 집계되는지 여부를 나타내며, 집계된 열의 경우 1을 반환하고 결과 집합에 집계되지 않은 경우 0을 반환합니다. |
| GroupingId(Column[]) |
그룹의 고유 항목 수를 반환합니다. |
| GroupingId(String, String[]) |
그룹의 고유 항목 수를 반환합니다. |
| Hash(Column[]) |
지정된 열의 해시 코드를 계산하고 결과를 int 열로 반환합니다. |
| Hex(Column) |
지정된 열의 16진수 값을 계산합니다. |
| Hour(Column) |
지정된 날짜/타임스탬프/문자열에서 시간을 정수로 추출합니다. |
| Hours(Column) |
타임스탬프를 사용하여 데이터를 시간 단위로 분할하는 변환입니다. |
| Hypot(Column, Column) |
|
| Hypot(Column, Double) |
|
| Hypot(Column, String) |
|
| Hypot(Double, Column) |
|
| Hypot(Double, String) |
|
| Hypot(String, Column) |
|
| Hypot(String, Double) |
|
| Hypot(String, String) |
|
| InitCap(Column) |
각 단어의 첫 글자를 대문자로 변환하여 새 문자열 열을 반환합니다. 단어는 공백으로 구분됩니다. |
| InputFileName() |
현재 Spark 작업의 파일 이름에 대한 문자열 열을 만듭니다. |
| Instr(Column, String) |
지정된 부분 문자열의 첫 번째 발생 위치를 찾습니다. |
| IsNaN(Column) |
열이 NaN인 true iff를 반환합니다. |
| IsNull(Column) |
열이 null인 true iff를 반환합니다. |
| JsonTuple(Column, String[]) |
지정된 필드 이름에 따라 JSON 열에 대한 새 행을 만듭니다. |
| Kurtosis(Column) |
그룹에 있는 값의 첨도를 반환합니다. |
| Kurtosis(String) |
그룹에 있는 값의 첨도를 반환합니다. |
| Lag(Column, Int32, Object) |
Window 함수: 현재 행 앞에 'offset' 행인 값을 반환하고, 현재 행 앞에 'offset' 행이 없으면 null을 반환합니다. 예를 들어 하나의 '오프셋'은 창 파티션의 지정된 지점에서 이전 행을 반환합니다. |
| Lag(String, Int32, Object) |
Window 함수: 현재 행 앞에 'offset' 행인 값을 반환하고, 현재 행 앞에 'offset' 행이 없으면 null을 반환합니다. 예를 들어 하나의 '오프셋'은 창 파티션의 지정된 지점에서 이전 행을 반환합니다. |
| Last(Column, Boolean) |
그룹에 있는 열의 마지막 값을 반환합니다. |
| Last(String, Boolean) |
그룹에 있는 열의 마지막 값을 반환합니다. |
| LastDay(Column) |
지정된 날짜가 속한 월의 마지막 날짜를 반환합니다. |
| Lead(Column, Int32, Object) |
Window 함수: 현재 행 뒤의 '오프셋' 행 값을 반환하고, 현재 행 뒤의 '오프셋' 행보다 작은 경우 null을 반환합니다. 예를 들어 하나의 '오프셋'은 창 파티션의 지정된 지점에서 다음 행을 반환합니다. |
| Lead(String, Int32, Object) |
Window 함수: 현재 행 뒤의 '오프셋' 행 값을 반환하고, 현재 행 뒤의 '오프셋' 행보다 작은 경우 null을 반환합니다. 예를 들어 하나의 '오프셋'은 창 파티션의 지정된 지점에서 다음 행을 반환합니다. |
| Least(Column[]) |
null 값을 건너뛰고 값 목록의 최소 값을 반환합니다. |
| Least(String, String[]) |
null 값을 건너뛰고 값 목록의 최소 값을 반환합니다. |
| Length(Column) |
지정된 문자열의 문자 길이 또는 이진 문자열의 바이트 수를 계산합니다. |
| Levenshtein(Column, Column) |
지정된 두 문자열 열의 Levenshtein 거리를 계산합니다. |
| Lit(Object) |
리터럴 값의 열을 만듭니다. |
| Locate(String, Column) |
지정된 부분 문자열의 첫 번째 발생 위치를 찾습니다. |
| Locate(String, Column, Int32) |
지정된 위치 오프셋에서 시작하는 지정된 부분 문자열의 첫 번째 발생 위치를 찾습니다. |
| Log(Column) |
지정된 값의 자연 로그를 계산합니다. |
| Log(Double, Column) |
두 번째 인수의 첫 번째 인수-기본 로그를 계산합니다. |
| Log(Double, String) |
두 번째 인수의 첫 번째 인수-기본 로그를 계산합니다. |
| Log(String) |
지정된 값의 자연 로그를 계산합니다. |
| Log10(Column) |
기본 10에서 지정된 값의 로그를 계산합니다. |
| Log10(String) |
기본 10에서 지정된 값의 로그를 계산합니다. |
| Log1p(Column) |
지정된 값의 자연 로그와 1을 계산합니다. |
| Log1p(String) |
지정된 값의 자연 로그와 1을 계산합니다. |
| Log2(Column) |
기본 2에서 지정된 열의 로그를 계산합니다. |
| Log2(String) |
기본 2에서 지정된 열의 로그를 계산합니다. |
| Lower(Column) |
문자열 열을 소문자로 변환합니다. |
| Lpad(Column, Int32, String) |
지정된 길이 |
| Ltrim(Column) |
지정된 문자열 열의 왼쪽 끝에서 공백을 트리밍합니다. |
| Ltrim(Column, String) |
지정된 문자열 열의 왼쪽 끝에서 지정된 문자열을 자꿉니다. |
| Map(Column[]) |
새 지도 열을 만듭니다. |
| MapConcat(Column[]) |
지정된 모든 맵의 공용 구조체를 반환합니다. |
| MapEntries(Column) |
지정된 맵에 있는 모든 항목의 순서가 지정되지 않은 배열을 반환합니다. |
| MapFromArrays(Column, Column) |
새 지도 열을 만듭니다. 첫 번째 열의 배열은 키에 사용됩니다. 두 번째 열의 배열은 값에 사용됩니다. 키에 대한 배열의 모든 요소는 null이 아니어야 합니다. |
| MapFromEntries(Column) |
지정된 항목 배열에서 만든 맵을 반환합니다. |
| MapKeys(Column) |
맵의 키를 포함하는 순서가 지정되지 않은 배열을 반환합니다. |
| MapValues(Column) |
맵의 값을 포함하는 순서가 지정되지 않은 배열을 반환합니다. |
| Max(Column) |
그룹에 있는 열의 최대값을 반환합니다. |
| Max(String) |
그룹에 있는 열의 최대값을 반환합니다. |
| Md5(Column) |
이진 열의 MD5 다이제스트를 계산하고 값을 32자 16진수 문자열로 반환합니다. |
| Mean(Column) |
그룹에 있는 열의 평균 값을 반환합니다. |
| Mean(String) |
그룹에 있는 열의 평균 값을 반환합니다. |
| Min(Column) |
그룹에 있는 열의 최소값을 반환합니다. |
| Min(String) |
그룹에 있는 열의 최소값을 반환합니다. |
| Minute(Column) |
분을 지정된 날짜/타임스탬프/문자열에서 정수로 추출합니다. |
| MonotonicallyIncreasingId() |
단조롭게 증가하는 64비트 정수를 생성하는 열 식입니다. |
| Month(Column) |
지정된 날짜/타임스탬프/문자열에서 월을 정수로 추출합니다. |
| Months(Column) |
데이터를 월로 분할하는 타임스탬프 및 날짜에 대한 변환입니다. |
| MonthsBetween(Column, Column) |
날짜 |
| MonthsBetween(Column, Column, Boolean) |
날짜 |
| NaNvl(Column, Column) |
NaN이 아니면 col1을 반환하고 col1이 NaN이면 col2를 반환합니다. |
| Negate(Column) |
단항 빼기, 즉 식을 부정합니다. |
| NextDay(Column, String) |
날짜 열이 지정된 경우 은 지정된 요일에 있는 날짜 열 값보다 오래된 첫 번째 날짜를 반환합니다. |
| Not(Column) |
부울 식의 반전(예: NOT) |
| Ntile(Int32) |
Window 함수: 순서가 지정된 창 파티션에서 ntile 그룹 ID(1 |
| Overlay(Column, Column, Column) |
의 바이트 위치에서 |
| Overlay(Column, Column, Column, Column) |
의 지정된 부분을 |
| PercentRank() |
Window 함수: 창 파티션 내 행의 상대 순위(즉, 백분위수)를 반환합니다. |
| Pmod(Column, Column) |
배당 모드 수수의 양수 값을 반환합니다. |
| PosExplode(Column) |
지정된 배열 또는 지도 열에 위치가 있는 각 요소에 대해 새 행을 만듭니다. |
| PosExplodeOuter(Column) |
지정된 배열 또는 지도 열에 위치가 있는 각 요소에 대해 새 행을 만듭니다. Posexplode()와 달리 배열/맵이 null이거나 비어 있으면 row(null, null)가 생성됩니다. |
| Pow(Column, Column) |
두 번째 인수의 권한으로 발생한 첫 번째 인수의 값을 반환합니다. |
| Pow(Column, Double) |
두 번째 인수의 권한으로 발생한 첫 번째 인수의 값을 반환합니다. |
| Pow(Column, String) |
두 번째 인수의 권한으로 발생한 첫 번째 인수의 값을 반환합니다. |
| Pow(Double, Column) |
두 번째 인수의 권한으로 발생한 첫 번째 인수의 값을 반환합니다. |
| Pow(Double, String) |
두 번째 인수의 권한으로 발생한 첫 번째 인수의 값을 반환합니다. |
| Pow(String, Column) |
두 번째 인수의 권한으로 발생한 첫 번째 인수의 값을 반환합니다. |
| Pow(String, Double) |
두 번째 인수의 권한으로 발생한 첫 번째 인수의 값을 반환합니다. |
| Pow(String, String) |
두 번째 인수의 권한으로 발생한 첫 번째 인수의 값을 반환합니다. |
| Quarter(Column) |
지정된 날짜/타임스탬프/문자열에서 분기를 정수로 추출합니다. |
| Radians(Column) |
도 단위로 측정된 각도를 라디안 단위로 측정된 거의 동일한 각도로 변환합니다. |
| Radians(String) |
도 단위로 측정된 각도를 라디안 단위로 측정된 거의 동일한 각도로 변환합니다. |
| Rand() |
U[0.0, 1.0]에서 독립적이고 동일하게 분산된(i.i.d.) 샘플을 사용하여 임의 열을 생성합니다. |
| Rand(Int64) |
U[0.0, 1.0]에서 독립적이고 동일하게 분산된(i.i.d.) 샘플을 사용하여 임의 열을 생성합니다. |
| Randn() |
표준 정규 분포에서 독립적이고 동일하게 분산된(즉, d.d.) 샘플을 사용하여 임의 열을 생성합니다. |
| Randn(Int64) |
표준 정규 분포에서 독립적이고 동일하게 분산된(즉, d.d.) 샘플을 사용하여 임의 열을 생성합니다. |
| Rank() |
Window 함수: 창 파티션 내 행의 순위를 반환합니다. |
| RegexpExtract(Column, String, Int32) |
지정된 문자열 열에서 Java regex와 일치하는 특정 그룹을 추출합니다. |
| RegexpReplace(Column, Column, Column) |
패턴과 일치하는 지정된 문자열 값의 모든 부분 문자열을 지정된 대체 문자열로 바꿉니다. |
| RegexpReplace(Column, String, String) |
패턴과 일치하는 지정된 문자열 값의 모든 부분 문자열을 지정된 대체 문자열로 바꿉니다. |
| Repeat(Column, Int32) |
문자열 열을 |
| Reverse(Column) |
문자열 열을 역방향으로 바꾸고 새 문자열 열로 반환합니다. |
| Rint(Column) |
인수에 가장 가깝고 수학 정수와 같은 double 값을 반환합니다. |
| Rint(String) |
인수에 가장 가깝고 수학 정수와 같은 double 값을 반환합니다. |
| Round(Column) |
HALF_UP 라운드 모드를 사용하여 반올림된 소수 자릿수의 값을 |
| Round(Column, Int32) |
HALF_UP 라운드 모드를 |
| RowNumber() |
Window 함수: 창 파티션 내에서 1부터 시작하는 순차 번호를 반환합니다. |
| Rpad(Column, Int32, String) |
지정된 길이 |
| Rtrim(Column) |
지정한 문자열 값의 오른쪽 끝에서 공백을 잘라 니다. |
| Rtrim(Column, String) |
지정된 문자열 열의 오른쪽 끝에서 지정된 문자열을 자른다. |
| SchemaOfCsv(Column) |
CSV 문자열을 구문 분석하고 해당 스키마를 DDL 형식으로 유추합니다. |
| SchemaOfCsv(Column, Dictionary<String,String>) |
CSV 문자열을 구문 분석하고 해당 스키마를 DDL 형식으로 유추합니다. |
| SchemaOfCsv(String) |
CSV 문자열을 구문 분석하고 해당 스키마를 DDL 형식으로 유추합니다. |
| SchemaOfJson(Column) |
JSON 문자열을 구문 분석하고 해당 스키마를 DDL 형식으로 유추합니다. |
| SchemaOfJson(Column, Dictionary<String,String>) |
JSON 문자열을 구문 분석하고 해당 스키마를 DDL 형식으로 유추합니다. |
| SchemaOfJson(String) |
JSON 문자열을 구문 분석하고 해당 스키마를 DDL 형식으로 유추합니다. |
| Second(Column) |
지정된 날짜/타임스탬프/문자열에서 초를 정수로 추출합니다. |
| Sequence(Column, Column) |
시작부터 중지까지 정수 시퀀스를 생성하고, 시작이 중지보다 작거나 같으면 1씩 증가합니다. 그렇지 않으면 -1입니다. |
| Sequence(Column, Column, Column) |
에서 로 증분하는 정수 시퀀스를 생성합니다 |
| Sha1(Column) |
이진 열의 SHA-1 다이제스트를 계산하고 값을 40자 16진수 문자열로 반환합니다. |
| Sha2(Column, Int32) |
이진 열의 해시 함수 SHA-2 패밀리를 계산하고 값을 16진수 문자열로 반환합니다. |
| ShiftLeft(Column, Int32) |
지정된 값을 |
| ShiftRight(Column, Int32) |
(서명됨) 지정된 값을 |
| ShiftRightUnsigned(Column, Int32) |
서명되지 않은 경우 지정된 값 |
| Shuffle(Column) |
지정된 배열의 임의 순열을 반환합니다. |
| Signum(Column) |
지정된 값의 기호를 계산합니다. |
| Signum(String) |
지정된 값의 기호를 계산합니다. |
| Sin(Column) |
에서 계산하는 것처럼 각도의 사인을 |
| Sin(String) |
에서 계산하는 것처럼 각도의 사인을 |
| Sinh(Column) |
에서 계산하는 것처럼 각도의 쌍곡선 사인을 |
| Sinh(String) |
에서 계산하는 것처럼 각도의 쌍곡선 사인을 |
| Size(Column) |
배열 또는 맵의 길이를 반환합니다. |
| Skewness(Column) |
그룹에 있는 값의 기울이기를 반환합니다. |
| Skewness(String) |
그룹에 있는 값의 기울이기를 반환합니다. |
| Slice(Column, Int32, Int32) |
지정된 |
| SortArray(Column, Boolean) |
지정된 열의 입력 배열을 배열 요소의 자연스러운 순서인 오름차순(기본값) 또는 내림차순으로 정렬합니다. |
| Soundex(Column) |
지정된 식의 soundex 코드를 반환합니다. |
| SparkPartitionId() |
파티션 ID입니다. |
| Split(Column, String) |
정규식 패턴으로 문자열을 분할합니다. |
| Split(Column, String, Int32) |
분할은 지정된 패턴의 일치 항목 주위에 스트럿됩니다. |
| Sqrt(Column) |
지정된 float 값의 제곱근을 계산합니다. |
| Sqrt(String) |
지정된 float 값의 제곱근을 계산합니다. |
| Stddev(Column) |
StddevSamp()의 별칭입니다. |
| Stddev(String) |
StddevSamp()의 별칭입니다. |
| StddevPop(Column) |
그룹에 있는 식의 모집단 표준 편차를 반환합니다. |
| StddevPop(String) |
그룹에 있는 식의 모집단 표준 편차를 반환합니다. |
| StddevSamp(Column) |
그룹에 있는 식의 샘플 표준 편차를 반환합니다. |
| StddevSamp(String) |
그룹에 있는 식의 샘플 표준 편차를 반환합니다. |
| Struct(Column[]) |
여러 입력 열을 구성하는 새 구조체 열을 만듭니다. |
| Struct(String, String[]) |
여러 입력 열을 구성하는 새 구조체 열을 만듭니다. |
| Substring(Column, Int32, Int32) |
지정된 길이에 대해 지정된 위치에서 시작하는 부분 문자열(또는 바이트 배열 조각)을 반환합니다. |
| SubstringIndex(Column, String, Int32) |
지정된 구분 기호가 발생하기 전에 |
| Sum(Column) |
식에 있는 모든 값의 합계를 반환합니다. |
| Sum(String) |
식에 있는 모든 값의 합계를 반환합니다. |
| SumDistinct(Column) |
식에 있는 고유 값의 합계를 반환합니다. |
| SumDistinct(String) |
식에 있는 고유 값의 합계를 반환합니다. |
| Tan(Column) |
에서 계산하는 것처럼 지정된 값의 탄젠트를 계산 |
| Tan(String) |
에서 계산하는 것처럼 지정된 값의 탄젠트를 계산 |
| Tanh(Column) |
에서 계산하는 것처럼 지정된 값의 쌍곡선 탄젠트를 계산 |
| Tanh(String) |
에서 계산하는 것처럼 지정된 값의 쌍곡선 탄젠트를 계산 |
| ToCsv(Column) |
가 포함된 |
| ToCsv(Column, Dictionary<String,String>) |
가 포함된 |
| ToDate(Column) |
규칙을 |
| ToDate(Column, String) |
열을 지정된 형식의 로 |
| ToJson(Column, Dictionary<String,String>) |
가 포함된 |
| ToTimestamp(Column) |
규칙을 로 캐스팅하여 시간 문자열을 Unix 타임스탬프(초)로 |
| ToTimestamp(Column, String) |
시간 문자열을 지정된 형식의 Unix 타임스탬프(초)로 변환합니다. |
| ToUtcTimestamp(Column, Column) |
'2017-07-14 02:40:00.0'과 같은 타임스탬프가 지정된 표준 시간대의 시간으로 해석되고 해당 시간을 UTC의 타임스탬프로 렌더링합니다. 예를 들어 'GMT+1'은 '2017-07-14 01:40:00.0'을 생성합니다. |
| ToUtcTimestamp(Column, String) |
'2017-07-14 02:40:00.0'과 같은 타임스탬프가 지정된 표준 시간대의 시간으로 해석되고 해당 시간을 UTC의 타임스탬프로 렌더링합니다. 예를 들어 'GMT+1'은 '2017-07-14 01:40:00.0'을 생성합니다. |
| Translate(Column, String, String) |
지정된 |
| Trim(Column) |
지정된 문자열 열의 양쪽 끝에서 공백을 잘라냅니다. |
| Trim(Column, String) |
지정된 문자열 열의 양쪽 끝에서 지정된 문자를 잘라냅니다. |
| Trunc(Column, String) |
형식으로 지정된 단위로 잘린 날짜를 반환합니다. |
| Udf(Func<Row>, StructType) |
지정된 대리자에서 UDF를 만듭니다. |
| Udf<A1,RT>(Func<A1,RT>) |
지정된 대리자에서 UDF를 만듭니다. |
| Udf<T>(Func<T,Row>, StructType) |
지정된 대리자에서 UDF를 만듭니다. |
| Udf<T1,T2,T3,T4,T5,T6,T7,T8,T9,T10,TResult>(Func<T1,T2,T3,T4,T5,T6,T7,T8,T9,T10,TResult>) |
지정된 대리자에서 UDF를 만듭니다. |
| Udf<T1,T2,T3,T4,T5,T6,T7,T8,T9,T10>(Func<T1,T2,T3,T4,T5,T6,T7,T8,T9,T10,Row>, StructType) |
지정된 대리자에서 UDF를 만듭니다. |
| Udf<T1,T2,T3,T4,T5,T6,T7,T8,T9,TResult>(Func<T1,T2,T3,T4,T5,T6,T7,T8,T9,TResult>) |
지정된 대리자에서 UDF를 만듭니다. |
| Udf<T1,T2,T3,T4,T5,T6,T7,T8,T9>(Func<T1,T2,T3,T4,T5,T6,T7,T8,T9,Row>, StructType) |
지정된 대리자에서 UDF를 만듭니다. |
| Udf<T1,T2,T3,T4,T5,T6,T7,T8,TResult>(Func<T1,T2,T3,T4,T5,T6,T7,T8,TResult>) |
지정된 대리자에서 UDF를 만듭니다. |
| Udf<T1,T2,T3,T4,T5,T6,T7,T8>(Func<T1,T2,T3,T4,T5,T6,T7,T8,Row>, StructType) |
지정된 대리자에서 UDF를 만듭니다. |
| Udf<T1,T2,T3,T4,T5,T6,T7,TResult>(Func<T1,T2,T3,T4,T5,T6,T7,TResult>) |
지정된 대리자에서 UDF를 만듭니다. |
| Udf<T1,T2,T3,T4,T5,T6,T7>(Func<T1,T2,T3,T4,T5,T6,T7,Row>, StructType) |
지정된 대리자에서 UDF를 만듭니다. |
| Udf<T1,T2,T3,T4,T5,T6,TResult>(Func<T1,T2,T3,T4,T5,T6,TResult>) |
지정된 대리자에서 UDF를 만듭니다. |
| Udf<T1,T2,T3,T4,T5,T6>(Func<T1,T2,T3,T4,T5,T6,Row>, StructType) |
지정된 대리자에서 UDF를 만듭니다. |
| Udf<T1,T2,T3,T4,T5,TResult>(Func<T1,T2,T3,T4,T5,TResult>) |
지정된 대리자에서 UDF를 만듭니다. |
| Udf<T1,T2,T3,T4,T5>(Func<T1,T2,T3,T4,T5,Row>, StructType) |
지정된 대리자에서 UDF를 만듭니다. |
| Udf<T1,T2,T3,T4,TResult>(Func<T1,T2,T3,T4,TResult>) |
지정된 대리자에서 UDF를 만듭니다. |
| Udf<T1,T2,T3,T4>(Func<T1,T2,T3,T4,Row>, StructType) |
지정된 대리자에서 UDF를 만듭니다. |
| Udf<T1,T2,T3,TResult>(Func<T1,T2,T3,TResult>) |
지정된 대리자에서 UDF를 만듭니다. |
| Udf<T1,T2,T3>(Func<T1,T2,T3,Row>, StructType) |
지정된 대리자에서 UDF를 만듭니다. |
| Udf<T1,T2,TResult>(Func<T1,T2,TResult>) |
지정된 대리자에서 UDF를 만듭니다. |
| Udf<T1,T2>(Func<T1,T2,Row>, StructType) |
지정된 대리자에서 UDF를 만듭니다. |
| Udf<TResult>(Func<TResult>) |
지정된 대리자에서 UDF를 만듭니다. |
| Unbase64(Column) |
BASE64로 인코딩된 문자열 열을 디코딩하고 이진 열로 반환합니다. |
| UnboundedFollowing() |
창 함수: 창 파티션의 마지막 행을 나타내는 특수 프레임 경계를 반환합니다. |
| UnboundedPreceding() |
Window 함수: 창 파티션의 첫 번째 행을 나타내는 특수 프레임 경계를 반환합니다. |
| Unhex(Column) |
16진수와 반대입니다. 각 문자 쌍을 16진수로 해석하고 숫자의 바이트 표현으로 변환합니다. |
| UnixTimestamp() |
현재 Unix 타임스탬프(초)를 반환합니다. |
| UnixTimestamp(Column) |
기본 표준 시간대 및 기본 로캘을 사용하여 yyyy-MM-dd HH:mm:ss 형식의 시간 문자열을 Unix 타임스탬프(초)로 변환합니다. |
| UnixTimestamp(Column, String) |
지정된 형식의 시간 문자열을 Unix 타임스탬프(초)로 변환합니다. |
| Upper(Column) |
문자열 열을 대문자로 변환합니다. |
| Variance(Column) |
VarSamp()의 별칭입니다. |
| Variance(String) |
VarSamp()의 별칭입니다. |
| VarPop(Column) |
그룹에 있는 값의 모집단 분산을 반환합니다. |
| VarPop(String) |
그룹에 있는 값의 모집단 분산을 반환합니다. |
| VarSamp(Column) |
그룹에 있는 값의 분산을 반환합니다. |
| VarSamp(String) |
그룹에 있는 값의 분산을 반환합니다. |
| WeekOfYear(Column) |
지정된 날짜/타임스탬프/문자열에서 주 번호를 정수로 추출합니다. |
| When(Column, Object) |
조건을 평가하고 가능한 여러 결과 식 중 하나를 반환합니다. 그렇지 않으면 끝에 정의되지 않은 경우 일치하지 않는 조건에 대해 null이 반환됩니다. |
| Window(Column, String) |
열을 지정하는 타임스탬프가 지정된 경우 연속 시간 창을 생성합니다. |
| Window(Column, String, String) |
타임스탬프 열이 지정된 경우 행을 하나 이상의 시간 창으로 버킷화합니다. |
| Window(Column, String, String, String) |
타임스탬프 열이 지정된 경우 행을 하나 이상의 시간 창으로 버킷화합니다. |
| XXHash64(Column[]) |
xxHash 알고리즘의 64비트 변형을 사용하여 지정된 열의 해시 코드를 계산하고 결과를 긴 열로 반환합니다. |
| Year(Column) |
지정된 날짜/타임스탬프/문자열에서 연도를 정수로 추출합니다. |
| Years(Column) |
데이터를 연도로 분할하기 위한 타임스탬프 및 날짜 변환입니다. |