Functions Třída

Definice

Funkce dostupné pro operace datového rámce

public static class Functions
type Functions = class
Public Class Functions
Dědičnost
Functions

Metody

Abs(Column)

Vypočítá absolutní hodnotu.

Acos(Column)

Inverzní kosinus v column radiánech, jako by se počítaly pomocí java.lang.Math.acos.

Acos(String)

Inverzní kosinus v columnName radiánech, jako by se počítaly pomocí java.lang.Math.acos.

AddMonths(Column, Column)

Vrátí datum, které následuje numMonths po startDate.

AddMonths(Column, Int32)

Vrátí datum, které následuje numMonths po startDate.

ApproxCountDistinct(Column)

Vrátí přibližný počet jedinečných položek ve skupině.

ApproxCountDistinct(Column, Double)

Vrátí přibližný počet jedinečných položek ve skupině.

ApproxCountDistinct(String)

Vrátí přibližný počet jedinečných položek ve skupině.

ApproxCountDistinct(String, Double)

Vrátí přibližný počet jedinečných položek ve skupině.

Array(Column[])

Vytvoří nový maticový sloupec. Všechny vstupní sloupce musí mít stejný datový typ.

Array(String, String[])

Vytvoří nový maticový sloupec. Všechny vstupní sloupce musí mít stejný datový typ.

ArrayContains(Column, Object)

Vrátí hodnotu null, pokud má pole hodnotu null, hodnotu true, pokud pole obsahuje value, a hodnotu false v opačném případě.

ArrayDistinct(Column)

Odebere duplicitní hodnoty z pole.

ArrayExcept(Column, Column)

Vrátí pole prvků v , col1 ale ne v col2, bez duplicit. Pořadí prvků ve výsledku je nedeterministické.

ArrayIntersect(Column, Column)

Vrátí matici prvků v průsečíku daných dvou polí bez duplicit.

ArrayJoin(Column, String)

Zřetězí prvky column pomocí delimiter.

ArrayJoin(Column, String, String)

Zřetězí prvky column pomocí delimiter. Hodnoty Null jsou nahrazeny nullReplacementhodnotou .

ArrayMax(Column)

Vrátí maximální hodnotu v poli.

ArrayMin(Column)

Vrátí minimální hodnotu v matici.

ArrayPosition(Column, Object)

Vyhledá pozici prvního výskytu hodnoty v daném poli tak dlouho. Vrátí hodnotu null, pokud je některý z argumentů null.

ArrayRemove(Column, Object)

Odeberte z daného pole všechny prvky, které se rovnají elementu.

ArrayRepeat(Column, Column)

Vytvoří pole obsahující left argument, který se opakuje kolikrát je daný argumentem right .

ArrayRepeat(Column, Int32)

Vytvoří matici left obsahující argument opakovaný count kolikrát.

ArraySort(Column)

Seřadí vstupní pole ve vzestupném pořadí. Prvky vstupního pole musí být seřazené. Prvky null budou umístěny na konci vráceného pole.

ArraysOverlap(Column, Column)

Vrátí hodnotu true, pokud a1 a a2 mají aspoň jeden společný prvek, který není null. Pokud ne a obě pole jsou neprázdná a některé z nich obsahují hodnotu null, vrátí hodnotu null. V opačném případě vrátí hodnotu false.

ArraysZip(Column[])

Vrátí sloučenou matici struktur, ve které N-ta struktura obsahuje všechny N-tý hodnoty vstupních polí.

ArrayUnion(Column, Column)

Vrátí pole prvků ve sjednocení daných dvou polí bez duplicit.

Asc(String)

Vrátí výraz řazení na základě vzestupného pořadí sloupce.

Ascii(Column)

Vypočítá číselnou hodnotu prvního znaku sloupce řetězce a vrátí výsledek jako sloupec typu int.

AscNullsFirst(String)

Vrátí výraz řazení na základě vzestupného pořadí sloupce a hodnoty null se vrátí před hodnotami, které nejsou null.

AscNullsLast(String)

Vrátí výraz řazení na základě vzestupného pořadí sloupce a hodnoty null se zobrazí po hodnotách, které nejsou null.

Asin(Column)

Inverzní sinus v column radiánech, jako by byl vypočítány pomocí java.lang.Math.asin.

Asin(String)

Inverzní sinus v columnName radiánech, jako by byl vypočítány pomocí java.lang.Math.asin.

Atan(Column)

Inverzní tangens funkce column v radiánech, jako by byl vypočítány pomocí java.lang.Math.atan.

Atan(String)

Inverzní tangens funkce columnName v radiánech, jako by byl vypočítány pomocí java.lang.Math.atan.

Atan2(Column, Column)

Vypočítá atan2 pro danou x hodnotu a y.

Atan2(Column, Double)

Vypočítá atan2 pro danou x hodnotu a y.

Atan2(Column, String)

Vypočítá atan2 pro danou x hodnotu a y.

Atan2(Double, Column)

Vypočítá atan2 pro danou x hodnotu a y.

Atan2(Double, String)

Vypočítá atan2 pro danou x hodnotu a y.

Atan2(String, Column)

Vypočítá atan2 pro danou x hodnotu a y.

Atan2(String, Double)

Vypočítá atan2 pro danou x hodnotu a y.

Atan2(String, String)

Vypočítá atan2 pro danou x hodnotu a y.

Avg(Column)

Vrátí průměr hodnot ve skupině.

Avg(String)

Vrátí průměr hodnot ve skupině.

Base64(Column)

Vypočítá kódování BASE64 binárního sloupce a vrátí ho jako sloupec řetězce.

Bin(Column)

Výraz, který vrací řetězcovou reprezentaci binární hodnoty daného dlouhého sloupce. Například bin("12") vrátí "1100".

Bin(String)

Výraz, který vrací řetězcovou reprezentaci binární hodnoty daného dlouhého sloupce. Například bin("12") vrátí "1100".

BitwiseNOT(Column)

Počítá bitové funkce NOT.

Broadcast(DataFrame)

Označí datový rámec jako dostatečně malý pro použití ve spojeních všesměrového vysílání.

Bround(Column)

Vrátí hodnotu column zaokrouhleného na 0 desetinných míst s HALF_EVEN kruhovým režimem.

Bround(Column, Int32)

Vrátí hodnotu column zaokrouhleného na scale desetinná místa s HALF_EVEN kruhovým režimem.

Bucket(Column, Column)

Transformace pro libovolný typ, který se dělí podle hodnoty hash vstupního sloupce.

Bucket(Int32, Column)

Transformace pro libovolný typ, který se dělí podle hodnoty hash vstupního sloupce.

CallUDF(String, Column[])

Zavolejte uživatelem definovanou funkci zaregistrovanou prostřednictvím SparkSession.Udf(). Register().

Cbrt(Column)

Vypočítá kořen datové krychle daného sloupce.

Cbrt(String)

Vypočítá kořen datové krychle daného sloupce.

Ceil(Column)

Vypočítá horní mez dané hodnoty.

Ceil(String)

Vypočítá horní mez dané hodnoty.

Coalesce(Column[])

Vrátí první sloupec, který nemá hodnotu null, nebo null, pokud všechny vstupy mají hodnotu null.

Col(String)

Vrátí sloupec na základě názvu daného sloupce. Alias pro Column().

CollectList(Column)

Vrátí seznam objektů s duplicitními položkami.

CollectList(String)

Vrátí seznam objektů s duplicitními položkami.

CollectSet(Column)

Vrátí sadu objektů s odstraněnými duplicitními prvky.

CollectSet(String)

Vrátí sadu objektů s odstraněnými duplicitními prvky.

Column(String)

Vrátí sloupec na základě názvu daného sloupce.

Concat(Column[])

Zřetězí více vstupních sloupců do jednoho sloupce.

ConcatWs(String, Column[])

Zřetězí více sloupců vstupního řetězce do jednoho sloupce řetězce pomocí daného oddělovače.

Conv(Column, Int32, Int32)

Převede číslo ve sloupci řetězce z jednoho základu na jiný.

Corr(Column, Column)

Vrátí Pearsonův korelační koeficient pro dva sloupce.

Corr(String, String)

Vrátí Pearsonův korelační koeficient pro dva sloupce.

Cos(Column)

Vypočítá kosinus úhlu, jako by java.lang.Math.cos

Cos(String)

Vypočítá kosinus úhlu, jako by java.lang.Math.cos

Cosh(Column)

Vypočítá hyperbolický kosinus úhlu, jako by java.lang.Math.cosh

Cosh(String)

Vypočítá hyperbolický kosinus úhlu, jako by java.lang.Math.cosh

Count(Column)

Vrátí počet položek ve skupině.

Count(String)

Vrátí počet položek ve skupině.

CountDistinct(Column, Column[])

Vrátí počet jedinečných položek ve skupině.

CountDistinct(String, String[])

Vrátí počet jedinečných položek ve skupině.

CovarPop(Column, Column)

Vrátí kovarianci základního souboru pro dva sloupce.

CovarPop(String, String)

Vrátí kovarianci základního souboru pro dva sloupce.

CovarSamp(Column, Column)

Vrátí kovarianci vzorku pro dva sloupce.

CovarSamp(String, String)

Vrátí kovarianci vzorku pro dva sloupce.

Crc32(Column)

Vypočítá hodnotu kontroly cyklické redundance (CRC32) binárního sloupce a vrátí hodnotu bigint.

CumeDist()

Funkce Window: vrátí kumulativní rozdělení hodnot v rámci oddílu okna, tj. zlomek řádků, které jsou pod aktuálním řádkem.

CurrentDate()

Vrátí aktuální datum jako sloupec kalendářního data.

CurrentRow()

Funkce Window: Vrátí speciální ohraničení rámečku, které představuje aktuální řádek v oddílu okna.

CurrentTimestamp()

Vrátí aktuální časové razítko jako sloupec časového razítka.

DateAdd(Column, Column)

Vrátí datum, které je days ve dnech po start.

DateAdd(Column, Int32)

Vrátí datum, které je days ve dnech po start.

DateDiff(Column, Column)

Vrátí počet dnů od start do end.

DateFormat(Column, String)

Převede datum,časové razítko/řetězec na hodnotu řetězce ve formátu určeném formátem data daným druhým argumentem.

DateSub(Column, Column)

Vrátí datum, které je days ve dnech před start.

DateSub(Column, Int32)

Vrátí datum, které je days ve dnech před start.

DateTrunc(String, Column)

Vrátí časové razítko zkrácené na jednotku určenou formátem.

DayOfMonth(Column)

Extrahuje den v měsíci jako celé číslo z daného data, časového razítka nebo řetězce.

DayOfWeek(Column)

Extrahuje den v týdnu jako celé číslo z daného data, časového razítka nebo řetězce.

DayOfYear(Column)

Extrahuje den v roce jako celé číslo z daného data, časového razítka nebo řetězce.

Days(Column)

Transformace časových razítek a kalendářních dat pro rozdělení dat na dny.

Decode(Column, String)

Vypočítá první argument do řetězce z binárního souboru pomocí poskytnuté znakové sady (jeden z US-ASCII, ISO-8859-1, UTF-8, UTF-16BE, UTF-16LE, UTF-16LE, UTF-16.

Degrees(Column)

Převede úhel měřený v radiánech na přibližně ekvivalentní úhel měřený ve stupních.

Degrees(String)

Převede úhel měřený v radiánech na přibližně ekvivalentní úhel měřený ve stupních.

DenseRank()

Funkce Window: Vrátí pořadí řádků v oddílu okna bez mezer.

Desc(String)

Vrátí výraz řazení na základě sestupného pořadí sloupce.

DescNullsFirst(String)

Vrátí výraz řazení na základě sestupného pořadí sloupce a hodnoty null se vrátí před hodnotami, které nejsou null.

DescNullsLast(String)

Vrátí výraz řazení na základě sestupného pořadí sloupce a hodnoty null se zobrazí za hodnotami, které nejsou null.

ElementAt(Column, Object)

Vrátí prvek pole v daném indexu v value případě, že sloupec je pole. Vrátí hodnotu pro daný klíč v value případě, že sloupec je mapový.

Encode(Column, String)

Vypočítá první argument do binárního souboru z řetězce pomocí poskytnuté znakové sady (jeden z US-ASCII, ISO-8859-1, UTF-8, UTF-16BE, UTF-16LE, UTF-16LE, UTF-16LE).

Exp(Column)

Vypočítá exponenciální hodnotu.

Exp(String)

Vypočítá exponenciální hodnotu.

Explode(Column)

Vytvoří nový řádek pro každý prvek v daném poli nebo sloupci mapy.

ExplodeOuter(Column)

Vytvoří nový řádek pro každý prvek v daném poli nebo sloupci mapy. Na rozdíl od Explode() pokud je pole nebo mapování null nebo prázdné, vytvoří se hodnota null.

Expm1(Column)

Vypočítá exponenciální hodnotu mínus jedna.

Expm1(String)

Vypočítá exponenciální hodnotu mínus jedna.

Expr(String)

Analyzuje řetězec výrazu do sloupce, který představuje.

Factorial(Column)

Vypočítá faktoriál dané hodnoty.

First(Column, Boolean)

Vrátí první hodnotu sloupce ve skupině.

First(String, Boolean)

Vrátí první hodnotu sloupce ve skupině.

Flatten(Column)

Vytvoří jednu matici z pole polí. Pokud je struktura vnořených polí hlubší než dvě úrovně, odebere se pouze jedna úroveň vnoření.

Floor(Column)

Vypočítá podlahu dané hodnoty.

Floor(String)

Vypočítá podlahu dané hodnoty.

FormatNumber(Column, Int32)

Naformátuje danou číselnou hodnotu column do formátu #,####.##,zaokrouhlené na daná d desetinná místa s HALF_EVEN zaokrouhleným režimem a vrátí výsledek jako sloupec řetězce.

FormatString(String, Column[])

Formátuje argumenty ve stylu printf a vrátí výsledek jako sloupec řetězce.

FromCsv(Column, Column, Dictionary<String,String>)

Analyzuje sloupec obsahující řetězec sdíleného svazku StructType clusteru do sloupce se zadaným schématem.

FromCsv(Column, StructType, Dictionary<String,String>)

Analyzuje sloupec obsahující řetězec sdíleného svazku StructType clusteru do sloupce se zadaným schématem.

FromJson(Column, Column, Dictionary<String,String>)

Parsuje sloupec obsahující řetězec JSON na hodnotu StructType nebo ArrayType s StructTypepomocí zadaného schématu.

FromJson(Column, String, Dictionary<String,String>)

Parsuje sloupec obsahující řetězec JSON na hodnotu StructType nebo ArrayType s StructTypepomocí zadaného schématu.

FromUnixTime(Column)

Převede počet sekund z unixové epochy (1970-01-01 00:00 UTC) na řetězec představující časové razítko daného okamžiku v aktuálním systémovém časovém pásmu s výchozím formátem "yyyy-MM-dd HH:mm:ss".

FromUnixTime(Column, String)

Převede počet sekund z epochy systému UNIX (1970-01-01 00:00 UTC) na řetězec představující časové razítko daného okamžiku v aktuálním systémovém časovém pásmu s daným formátem.

FromUtcTimestamp(Column, Column)

Časové razítko jako "2017-07-14 02:40:00.0", interpretuje ho jako čas ve formátu UTC a vykreslí tento čas jako časové razítko v daném časovém pásmu. Například GMT+1 by vynesla 2017-07-14 03:40:00.0.

FromUtcTimestamp(Column, String)

Časové razítko jako "2017-07-14 02:40:00.0", interpretuje ho jako čas ve formátu UTC a vykreslí tento čas jako časové razítko v daném časovém pásmu. Například GMT+1 by vynesla 2017-07-14 03:40:00.0.

GetJsonObject(Column, String)

Extrahuje objekt JSON z řetězce JSON na základě zadané cesty a vrátí řetězec JSON extrahovaného objektu JSON.

Greatest(Column[])

Vrátí nejvyšší hodnotu ze seznamu hodnot a přeskočí hodnoty null.

Greatest(String, String[])

Vrátí největší hodnotu seznamu názvů sloupců a přeskočí hodnoty null.

Grouping(Column)

Určuje, jestli je zadaný sloupec v seznamu GROUP BY agregovaný nebo ne, a vrátí hodnotu 1 pro agregované nebo 0 pro neagregované v sadě výsledků.

Grouping(String)

Určuje, jestli je zadaný sloupec v seznamu GROUP BY agregovaný nebo ne, a vrátí hodnotu 1 pro agregované nebo 0 pro neagregované v sadě výsledků.

GroupingId(Column[])

Vrátí počet jedinečných položek ve skupině.

GroupingId(String, String[])

Vrátí počet jedinečných položek ve skupině.

Hash(Column[])

Vypočítá hashovací kód daných sloupců a vrátí výsledek jako sloupec int.

Hex(Column)

Vypočítá šestnáctkovou hodnotu daného sloupce.

Hour(Column)

Extrahuje hodiny jako celé číslo z daného data, časového razítka nebo řetězce.

Hours(Column)

Transformace časových razítek pro rozdělení dat na hodiny.

Hypot(Column, Column)

sqrt(a^2^ + b^2^) Výpočty bez přechodného přetečení nebo podtečení.

Hypot(Column, Double)

sqrt(a^2^ + b^2^) Výpočty bez přechodného přetečení nebo podtečení.

Hypot(Column, String)

sqrt(a^2^ + b^2^) Výpočty bez přechodného přetečení nebo podtečení.

Hypot(Double, Column)

sqrt(a^2^ + b^2^) Výpočty bez přechodného přetečení nebo podtečení.

Hypot(Double, String)

sqrt(a^2^ + b^2^) Výpočty bez přechodného přetečení nebo podtečení.

Hypot(String, Column)

sqrt(a^2^ + b^2^) Výpočty bez přechodného přetečení nebo podtečení.

Hypot(String, Double)

sqrt(a^2^ + b^2^) Výpočty bez přechodného přetečení nebo podtečení.

Hypot(String, String)

sqrt(a^2^ + b^2^) Výpočty bez přechodného přetečení nebo podtečení.

InitCap(Column)

Vrátí nový sloupec řetězce převedením prvního písmena každého slova na velká písmena. Slova jsou oddělena prázdnými znaky.

InputFileName()

Vytvoří sloupec řetězce pro název souboru aktuální úlohy Sparku.

Instr(Column, String)

Vyhledejte pozici prvního výskytu daného podřetětce.

IsNaN(Column)

Vrátí hodnotu true a sloupec je NaN.

IsNull(Column)

Vrátí hodnotu true a sloupec má hodnotu null.

JsonTuple(Column, String[])

Vytvoří nový řádek pro sloupec JSON podle zadaných názvů polí.

Kurtosis(Column)

Vrátí kurtózu hodnot ve skupině.

Kurtosis(String)

Vrátí kurtózu hodnot ve skupině.

Lag(Column, Int32, Object)

Funkce Window: Vrátí hodnotu, která je posun řádků před aktuálním řádkem, a hodnotu null, pokud je před aktuálním řádkem menší než posun. Například posun jednoho vrátí předchozí řádek v libovolném bodě oddílu okna.

Lag(String, Int32, Object)

Funkce Window: Vrátí hodnotu, která je posun řádků před aktuálním řádkem, a hodnotu null, pokud je před aktuálním řádkem menší než posun. Například posun jednoho vrátí předchozí řádek v libovolném bodě oddílu okna.

Last(Column, Boolean)

Vrátí poslední hodnotu sloupce ve skupině.

Last(String, Boolean)

Vrátí poslední hodnotu sloupce ve skupině.

LastDay(Column)

Vrátí poslední den v měsíci, ke kterému dané datum patří.

Lead(Column, Int32, Object)

Funkce Window: Vrátí hodnotu, která je posun řádků za aktuálním řádkem, a null, pokud je za aktuálním řádkem menší než "posun". Například posun jednoho vrátí další řádek v libovolném bodě v oddílu okna.

Lead(String, Int32, Object)

Funkce Window: Vrátí hodnotu, která je posun řádků za aktuálním řádkem, a null, pokud je za aktuálním řádkem menší než "posun". Například posun jednoho vrátí další řádek v libovolném bodě v oddílu okna.

Least(Column[])

Vrátí nejnižší hodnotu seznamu hodnot a přeskočí hodnoty null.

Least(String, String[])

Vrátí nejnižší hodnotu seznamu hodnot a přeskočí hodnoty null.

Length(Column)

Vypočítá délku znaku daného řetězce nebo počet bajtů binárního řetězce.

Levenshtein(Column, Column)

Vypočítá levenshtein vzdálenost dvou zadaných řetězců.

Lit(Object)

Vytvoří sloupec hodnoty literálu.

Locate(String, Column)

Vyhledejte pozici prvního výskytu daného podřetětce.

Locate(String, Column, Int32)

Vyhledejte pozici prvního výskytu daného podřetětce od daného posunu pozice.

Log(Column)

Vypočítá přirozený logaritmus dané hodnoty.

Log(Double, Column)

Vypočítá první logaritmus základu argumentu druhého argumentu.

Log(Double, String)

Vypočítá první logaritmus základu argumentu druhého argumentu.

Log(String)

Vypočítá přirozený logaritmus dané hodnoty.

Log10(Column)

Vypočítá logaritmus dané hodnoty v základu 10.

Log10(String)

Vypočítá logaritmus dané hodnoty v základu 10.

Log1p(Column)

Vypočítá přirozený logaritmus dané hodnoty plus jedna.

Log1p(String)

Vypočítá přirozený logaritmus dané hodnoty plus jedna.

Log2(Column)

Vypočítá logaritmus daného sloupce v základu 2.

Log2(String)

Vypočítá logaritmus daného sloupce v základu 2.

Lower(Column)

Převede sloupec řetězce na malá písmena.

Lpad(Column, Int32, String)

Do levé části sloupce řetězce vložte panel na danou délku len. Pokud je sloupec řetězce delší než len, návratová hodnota se zkrátí na len znaky.

Ltrim(Column)

Ořízněte mezery od levého konce pro daný sloupec řetězce.

Ltrim(Column, String)

Oříznout zadaný řetězec znaků z levého konce pro daný sloupec řetězce.

Map(Column[])

Vytvoří nový sloupec mapy.

MapConcat(Column[])

Vrátí sjednocení všech daných map.

MapEntries(Column)

Vrátí neuspořádané pole všech položek v dané mapě.

MapFromArrays(Column, Column)

Vytvoří nový sloupec mapy. Pole v prvním sloupci se používá pro klíče. Pole ve druhém sloupci se používá pro hodnoty. Všechny prvky v poli pro klíč by neměly mít hodnotu null.

MapFromEntries(Column)

Vrátí mapu vytvořenou z daného pole položek.

MapKeys(Column)

Vrátí neuspořádané pole obsahující klíče mapy.

MapValues(Column)

Vrátí neuspořádané pole obsahující hodnoty mapy.

Max(Column)

Vrátí maximální hodnotu sloupce ve skupině.

Max(String)

Vrátí maximální hodnotu sloupce ve skupině.

Md5(Column)

Vypočítá hodnotu hash MD5 binárního sloupce a vrátí hodnotu jako šestnáctkový řetězec o 32 znacích.

Mean(Column)

Vrátí průměrnou hodnotu sloupce ve skupině.

Mean(String)

Vrátí průměrnou hodnotu sloupce ve skupině.

Min(Column)

Vrátí minimální hodnotu sloupce ve skupině.

Min(String)

Vrátí minimální hodnotu sloupce ve skupině.

Minute(Column)

Extrahuje minuty jako celé číslo z daného data, časového razítka nebo řetězce.

MonotonicallyIncreasingId()

Sloupcový výraz, který generuje monotónně rostoucí 64bitová celá čísla.

Month(Column)

Extrahuje měsíc jako celé číslo z daného data, časového razítka nebo řetězce.

Months(Column)

Transformace pro časová razítka a data pro rozdělení dat na měsíce.

MonthsBetween(Column, Column)

Vrátí počet měsíců mezi kalendářními daty end a stasrt.

MonthsBetween(Column, Column, Boolean)

Vrátí počet měsíců mezi kalendářními daty end a start. Pokud roundOff je nastavena hodnota true, výsledek se zaokrouhlí na 8 číslic; jinak se nezaokrouhlí.

NaNvl(Column, Column)

Vrátí sloupec col1, pokud není nan, nebo sloupec2, pokud sloupec1 je NaN.

Negate(Column)

Unární mínus, tj. neguje výraz.

NextDay(Column, String)

Při zadání sloupce kalendářního data vrátí první datum, které je pozdější než hodnota sloupce kalendářního data v zadaném dni v týdnu.

Not(Column)

Inverze logického výrazu, tj. NOT.

Ntile(Int32)

Funkce Window: vrátí ID skupiny ntile (od 1 po n včetně) v uspořádané části okna. Pokud n je například 4, první čtvrtletí řádků získá hodnotu 1, druhé čtvrtletí získá hodnotu 2, třetí čtvrtletí 3 a poslední čtvrtletí získá hodnotu 4.

Overlay(Column, Column, Column)

Překryjte zadanou část src řetězcem replace, počínaje od pozice pos bajtu z .src

Overlay(Column, Column, Column, Column)

Překryjte zadanou část src parametrem replace, počínaje od pozice pos bajtu src a pokračováním pro len bajty.

PercentRank()

Funkce Window: Vrátí relativní pořadí (tj. percentil) řádků v rámci oddílu okna.

Pmod(Column, Column)

Vrátí kladnou hodnotu dělitele dividend mod.

PosExplode(Column)

Vytvoří nový řádek pro každý prvek s pozicí v daném poli nebo sloupci mapy.

PosExplodeOuter(Column)

Vytvoří nový řádek pro každý prvek s pozicí v daném poli nebo sloupci mapy. Na rozdíl od Posexplode() je-li pole nebo mapování null nebo prázdné, vytvoří se řádek(null, null).

Pow(Column, Column)

Vrátí hodnotu prvního argumentu umocněné na mocninu druhého argumentu.

Pow(Column, Double)

Vrátí hodnotu prvního argumentu umocněné na mocninu druhého argumentu.

Pow(Column, String)

Vrátí hodnotu prvního argumentu umocněné na mocninu druhého argumentu.

Pow(Double, Column)

Vrátí hodnotu prvního argumentu umocněné na mocninu druhého argumentu.

Pow(Double, String)

Vrátí hodnotu prvního argumentu umocněné na mocninu druhého argumentu.

Pow(String, Column)

Vrátí hodnotu prvního argumentu umocněné na mocninu druhého argumentu.

Pow(String, Double)

Vrátí hodnotu prvního argumentu umocněné na mocninu druhého argumentu.

Pow(String, String)

Vrátí hodnotu prvního argumentu umocněné na mocninu druhého argumentu.

Quarter(Column)

Extrahuje čtvrtletí jako celé číslo z daného data, časového razítka nebo řetězce.

Radians(Column)

Převede úhel měřený ve stupních na přibližně ekvivalentní úhel měřený v radiánech.

Radians(String)

Převede úhel měřený ve stupních na přibližně ekvivalentní úhel měřený v radiánech.

Rand()

Vygeneruje náhodný sloupec s nezávislými a identicky distribuovanými vzorky z U[0.0, 1.0].

Rand(Int64)

Vygeneruje náhodný sloupec s nezávislými a identicky distribuovanými vzorky z U[0.0, 1.0].

Randn()

Vygeneruje náhodný sloupec s nezávislými a identicky distribuovanými vzorky ze standardního normálního rozdělení.

Randn(Int64)

Vygeneruje náhodný sloupec s nezávislými a identicky distribuovanými vzorky ze standardního normálního rozdělení.

Rank()

Funkce Window: vrátí pořadí řádků v rámci oddílu okna.

RegexpExtract(Column, String, Int32)

Extrahujte ze zadaného sloupce řetězce konkrétní skupinu odpovídající regulárnímu výrazu Java.

RegexpReplace(Column, Column, Column)

Nahraďte všechny podřetězce zadané řetězcové hodnoty, které odpovídají vzoru, daným náhradním řetězcem.

RegexpReplace(Column, String, String)

Nahraďte všechny podřetězce zadané řetězcové hodnoty, které odpovídají vzoru, daným náhradním řetězcem.

Repeat(Column, Int32)

Zopakuje řetězcový sloupec n times a vrátí ho jako nový sloupec řetězce.

Reverse(Column)

Obrátí sloupec řetězce a vrátí ho jako nový sloupec řetězce.

Rint(Column)

Vrátí dvojitou hodnotu, která je nejblíže argumentu a je rovna matematickému celočíselnému argumentu.

Rint(String)

Vrátí dvojitou hodnotu, která je nejblíže argumentu a je rovna matematickému celočíselnému argumentu.

Round(Column)

Vrátí hodnotu column zaokrouhlené na 0 desetinných míst s HALF_UP kruhovým režimem.

Round(Column, Int32)

Vrátí hodnotu column zaokrouhleného na scale desetinná místa s HALF_UP kruhovým režimem.

RowNumber()

Funkce Window: Vrátí pořadové číslo začínající číslem 1 v rámci oddílu okna.

Rpad(Column, Int32, String)

Dosadíte sloupec řetězce pravým tlačítkem na danou délku len. Pokud je sloupec řetězce delší než len, návratová hodnota se zkrátí na len znaky.

Rtrim(Column)

Ořízněte mezery od pravého konce pro zadanou řetězcovou hodnotu.

Rtrim(Column, String)

Oříznout zadaný řetězec znaků od pravého konce pro daný sloupec řetězce.

SchemaOfCsv(Column)

Analyzuje řetězec CSV a odvodí jeho schéma ve formátu DDL.

SchemaOfCsv(Column, Dictionary<String,String>)

Analyzuje řetězec CSV a odvodí jeho schéma ve formátu DDL.

SchemaOfCsv(String)

Analyzuje řetězec CSV a odvodí jeho schéma ve formátu DDL.

SchemaOfJson(Column)

Analyzuje řetězec JSON a odvodí jeho schéma ve formátu DDL.

SchemaOfJson(Column, Dictionary<String,String>)

Analyzuje řetězec JSON a odvodí jeho schéma ve formátu DDL.

SchemaOfJson(String)

Analyzuje řetězec JSON a odvodí jeho schéma ve formátu DDL.

Second(Column)

Extrahuje sekundy jako celé číslo z daného data, časového razítka nebo řetězce.

Sequence(Column, Column)

Vygenerujte sekvenci celých čísel od začátku do konce. Pokud je hodnota start menší nebo rovna zastavení, v opačném případě se hodnota -1 navyšuje o 1.

Sequence(Column, Column, Column)

Vygenerujte sekvenci celých čísel z start do stopa zvyšte o step.

Sha1(Column)

Vypočítá algoritmus hash SHA-1 binárního sloupce a vrátí hodnotu jako šestnáctkový řetězec o 40 znacích.

Sha2(Column, Int32)

Vypočítá rodinu sha-2 hash funkcí binárního sloupce a vrátí hodnotu jako šestnáctkový řetězec.

ShiftLeft(Column, Int32)

Posune danou hodnotu numBits doleva.

ShiftRight(Column, Int32)

(Signed) posune danou hodnotu numBits doprava.

ShiftRightUnsigned(Column, Int32)

Bez znaménka posune danou hodnotu numBits doprava.

Shuffle(Column)

Vrátí náhodnou permutaci daného pole.

Signum(Column)

Vypočítá znaménko dané hodnoty.

Signum(String)

Vypočítá znaménko dané hodnoty.

Sin(Column)

Vypočítá sinus úhlu, jako by byl vypočten pomocí java.lang.Math.sin.

Sin(String)

Vypočítá sinus úhlu, jako by byl vypočten pomocí java.lang.Math.sin.

Sinh(Column)

Vypočítá hyperbolický sinus úhlu, jako by byl vypočten pomocí java.lang.Math.sin.

Sinh(String)

Vypočítá hyperbolický sinus úhlu, jako by byl vypočten pomocí java.lang.Math.sin.

Size(Column)

Vrátí délku pole nebo mapy.

Skewness(Column)

Vrátí šikmost hodnot ve skupině.

Skewness(String)

Vrátí šikmost hodnot ve skupině.

Slice(Column, Int32, Int32)

Vrátí pole obsahující všechny prvky z column indexu start (nebo počínaje koncem, pokud start je záporná) se zadaným lengthparametrem .

SortArray(Column, Boolean)

Seřadí vstupní pole pro daný sloupec vzestupně (výchozí) nebo sestupně, přirozené pořadí prvků pole.

Soundex(Column)

Vrátí kód soundex pro zadaný výraz.

SparkPartitionId()

ID oddílu.

Split(Column, String)

Rozdělí řetězec pomocí vzoru regulárního výrazu.

Split(Column, String, Int32)

Rozdělí str kolem shod daného vzoru.

Sqrt(Column)

Vypočítá druhou odmocninu zadané hodnoty float.

Sqrt(String)

Vypočítá druhou odmocninu zadané hodnoty float.

Stddev(Column)

Alias pro StddevSamp().

Stddev(String)

Alias pro StddevSamp().

StddevPop(Column)

Vrátí směrodatnou odchylku základního souboru výrazu ve skupině.

StddevPop(String)

Vrátí směrodatnou odchylku základního souboru výrazu ve skupině.

StddevSamp(Column)

Vrátí vzorovou směrodatnou odchylku výrazu ve skupině.

StddevSamp(String)

Vrátí vzorovou směrodatnou odchylku výrazu ve skupině.

Struct(Column[])

Vytvoří nový sloupec struktury, který složí více vstupních sloupců.

Struct(String, String[])

Vytvoří nový sloupec struktury, který složí více vstupních sloupců.

Substring(Column, Int32, Int32)

Vrátí podřetěc (neboli řez pole bajtů) od dané pozice pro danou délku.

SubstringIndex(Column, String, Int32)

Vrátí podřetězc z daného řetězce před count výskyty daného oddělovače.

Sum(Column)

Vrátí součet všech hodnot ve výrazu.

Sum(String)

Vrátí součet všech hodnot ve výrazu.

SumDistinct(Column)

Vrátí součet jedinečných hodnot ve výrazu.

SumDistinct(String)

Vrátí součet jedinečných hodnot ve výrazu.

Tan(Column)

Vypočítá tangens dané hodnoty, jako by byl vypočten pomocí java.lang.Math.tan.

Tan(String)

Vypočítá tangens dané hodnoty, jako by byl vypočten pomocí java.lang.Math.tan.

Tanh(Column)

Vypočítá hyperbolický tangens dané hodnoty, jako by byl vypočten pomocí java.lang.Math.tanh.

Tanh(String)

Vypočítá hyperbolický tangens dané hodnoty, jako by byl vypočten pomocí java.lang.Math.tanh.

ToCsv(Column)

Převede sloupec obsahující StructType řetězec csv se zadaným schématem.

ToCsv(Column, Dictionary<String,String>)

Převede sloupec obsahující StructType řetězec csv se zadaným schématem.

ToDate(Column)

Převede sloupec DateType na přetypováním pravidel na DateType.

ToDate(Column, String)

Převede sloupec na sloupec DateType se zadaným formátem.

ToJson(Column, Dictionary<String,String>)

Převede sloupec obsahující StructType, ArrayType of StructTypes, a MapType nebo ArrayType s MapTypena řetězec JSON.

ToTimestamp(Column)

Převeďte časový řetězec na časové razítko unixu (v sekundách) přetypováním pravidel na TimestampType.

ToTimestamp(Column, String)

Převeďte časový řetězec na časové razítko systému Unix (v sekundách) se zadaným formátem.

ToUtcTimestamp(Column, Column)

Časové razítko, jako je "2017-07-14 02:40:00.0", interpretuje ho jako čas v daném časovém pásmu a vykreslí tento čas jako časové razítko ve formátu UTC. Například GMT+1 by vynesla 2017-07-14 01:40:00.0.

ToUtcTimestamp(Column, String)

Časové razítko, jako je "2017-07-14 02:40:00.0", interpretuje ho jako čas v daném časovém pásmu a vykreslí tento čas jako časové razítko ve formátu UTC. Například GMT+1 by vynesla 2017-07-14 01:40:00.0.

Translate(Column, String, String)

Přeložte všechny znaky, které odpovídají danému matchingString znaku replaceStringve sloupci .

Trim(Column)

Ořízněte mezery z obou konců zadaného sloupce řetězce.

Trim(Column, String)

Ořízněte zadaný znak z obou konců zadaného sloupce řetězce.

Trunc(Column, String)

Vrátí datum zkrácené na jednotku určenou formátem.

Udf(Func<Row>, StructType)

Vytvoří UDF ze zadaného delegáta.

Udf<A1,RT>(Func<A1,RT>)

Vytvoří UDF ze zadaného delegáta.

Udf<T>(Func<T,Row>, StructType)

Vytvoří UDF ze zadaného delegáta.

Udf<T1,T2,T3,T4,T5,T6,T7,T8,T9,T10,TResult>(Func<T1,T2,T3,T4,T5,T6,T7,T8,T9,T10,TResult>)

Vytvoří UDF ze zadaného delegáta.

Udf<T1,T2,T3,T4,T5,T6,T7,T8,T9,T10>(Func<T1,T2,T3,T4,T5,T6,T7,T8,T9,T10,Row>, StructType)

Vytvoří UDF ze zadaného delegáta.

Udf<T1,T2,T3,T4,T5,T6,T7,T8,T9,TResult>(Func<T1,T2,T3,T4,T5,T6,T7,T8,T9,TResult>)

Vytvoří UDF ze zadaného delegáta.

Udf<T1,T2,T3,T4,T5,T6,T7,T8,T9>(Func<T1,T2,T3,T4,T5,T6,T7,T8,T9,Row>, StructType)

Vytvoří UDF ze zadaného delegáta.

Udf<T1,T2,T3,T4,T5,T6,T7,T8,TResult>(Func<T1,T2,T3,T4,T5,T6,T7,T8,TResult>)

Vytvoří UDF ze zadaného delegáta.

Udf<T1,T2,T3,T4,T5,T6,T7,T8>(Func<T1,T2,T3,T4,T5,T6,T7,T8,Row>, StructType)

Vytvoří UDF ze zadaného delegáta.

Udf<T1,T2,T3,T4,T5,T6,T7,TResult>(Func<T1,T2,T3,T4,T5,T6,T7,TResult>)

Vytvoří UDF ze zadaného delegáta.

Udf<T1,T2,T3,T4,T5,T6,T7>(Func<T1,T2,T3,T4,T5,T6,T7,Row>, StructType)

Vytvoří UDF ze zadaného delegáta.

Udf<T1,T2,T3,T4,T5,T6,TResult>(Func<T1,T2,T3,T4,T5,T6,TResult>)

Vytvoří UDF ze zadaného delegáta.

Udf<T1,T2,T3,T4,T5,T6>(Func<T1,T2,T3,T4,T5,T6,Row>, StructType)

Vytvoří UDF ze zadaného delegáta.

Udf<T1,T2,T3,T4,T5,TResult>(Func<T1,T2,T3,T4,T5,TResult>)

Vytvoří UDF ze zadaného delegáta.

Udf<T1,T2,T3,T4,T5>(Func<T1,T2,T3,T4,T5,Row>, StructType)

Vytvoří UDF ze zadaného delegáta.

Udf<T1,T2,T3,T4,TResult>(Func<T1,T2,T3,T4,TResult>)

Vytvoří UDF ze zadaného delegáta.

Udf<T1,T2,T3,T4>(Func<T1,T2,T3,T4,Row>, StructType)

Vytvoří UDF ze zadaného delegáta.

Udf<T1,T2,T3,TResult>(Func<T1,T2,T3,TResult>)

Vytvoří UDF ze zadaného delegáta.

Udf<T1,T2,T3>(Func<T1,T2,T3,Row>, StructType)

Vytvoří UDF ze zadaného delegáta.

Udf<T1,T2,TResult>(Func<T1,T2,TResult>)

Vytvoří UDF ze zadaného delegáta.

Udf<T1,T2>(Func<T1,T2,Row>, StructType)

Vytvoří UDF ze zadaného delegáta.

Udf<TResult>(Func<TResult>)

Vytvoří UDF ze zadaného delegáta.

Unbase64(Column)

Dekóduje sloupec řetězce s kódováním BASE64 a vrátí ho jako binární sloupec.

UnboundedFollowing()

Funkce Window: Vrátí speciální ohraničení rámečku, které představuje poslední řádek v oddílu okna.

UnboundedPreceding()

Funkce Window: Vrátí speciální ohraničení rámečku, které představuje první řádek v oddílu okna.

Unhex(Column)

Inverzní k hexu. Interpretuje každou dvojici znaků jako šestnáctkové číslo a převede na bajtové vyjádření čísla.

UnixTimestamp()

Vrátí aktuální časové razítko systému Unix (v sekundách).

UnixTimestamp(Column)

Převede časový řetězec ve formátu yyyy-MM-dd HH:mm:ss na časové razítko unixu (v sekundách) s použitím výchozího časového pásma a výchozího národního prostředí.

UnixTimestamp(Column, String)

Převede časový řetězec s daným formátem na časové razítko systému Unix (v sekundách).

Upper(Column)

Převede sloupec řetězce na velká písmena.

Variance(Column)

Alias pro VarSamp().

Variance(String)

Alias pro VarSamp().

VarPop(Column)

Vrátí rozptyl základního souboru hodnot ve skupině.

VarPop(String)

Vrátí rozptyl základního souboru hodnot ve skupině.

VarSamp(Column)

Vrátí nezaujatý rozptyl hodnot ve skupině.

VarSamp(String)

Vrátí nezaujatý rozptyl hodnot ve skupině.

WeekOfYear(Column)

Extrahuje číslo týdne jako celé číslo z daného data, časového razítka nebo řetězce.

When(Column, Object)

Vyhodnotí podmínku a vrátí jeden z více možných výrazů výsledku. Pokud na konci není definováno jinak, vrátí se hodnota null pro nesplněné podmínky.

Window(Column, String)

Vygeneruje časové intervaly přeskakování s časovým razítkem určujícím sloupec.

Window(Column, String, String)

Rozdělte řádky do jednoho nebo více časových intervalů s daným sloupcem časového razítka.

Window(Column, String, String, String)

Rozdělte řádky do jednoho nebo více časových intervalů s daným sloupcem časového razítka.

XXHash64(Column[])

Vypočítá hashovací kód daných sloupců pomocí 64bitové varianty algoritmu xxHash a vrátí výsledek jako dlouhý sloupec.

Year(Column)

Extrahuje rok jako celé číslo z daného data, časového razítka nebo řetězce.

Years(Column)

Transformace časových razítek a kalendářních dat pro rozdělení dat na roky.

Platí pro