Functions Třída

Reference

Definice

Obor názvů:: Microsoft.Spark.Sql

Sestavení:: Microsoft.Spark.dll

Balíček:: Microsoft.Spark v1.0.0

Důležité

Některé informace platí pro předběžně vydaný produkt, který se může zásadně změnit, než ho výrobce nebo autor vydá. Microsoft neposkytuje žádné záruky, výslovné ani předpokládané, týkající se zde uváděných informací.

Funkce dostupné pro operace datového rámce

public static class Functions

type Functions = class

Public Class Functions

Dědičnost: Object
Functions

Metody

Abs(Column)	Vypočítá absolutní hodnotu.
Acos(Column)	Inverzní kosinus v `column` radiánech, jako by se počítaly pomocí `java.lang.Math.acos`.
Acos(String)	Inverzní kosinus v `columnName` radiánech, jako by se počítaly pomocí `java.lang.Math.acos`.
AddMonths(Column, Column)	Vrátí datum, které následuje `numMonths` po `startDate`.
AddMonths(Column, Int32)	Vrátí datum, které následuje `numMonths` po `startDate`.
ApproxCountDistinct(Column)	Vrátí přibližný počet jedinečných položek ve skupině.
ApproxCountDistinct(Column, Double)	Vrátí přibližný počet jedinečných položek ve skupině.
ApproxCountDistinct(String)	Vrátí přibližný počet jedinečných položek ve skupině.
ApproxCountDistinct(String, Double)	Vrátí přibližný počet jedinečných položek ve skupině.
Array(Column[])	Vytvoří nový maticový sloupec. Všechny vstupní sloupce musí mít stejný datový typ.
Array(String, String[])	Vytvoří nový maticový sloupec. Všechny vstupní sloupce musí mít stejný datový typ.
ArrayContains(Column, Object)	Vrátí hodnotu null, pokud má pole hodnotu null, hodnotu true, pokud pole obsahuje `value`, a hodnotu false v opačném případě.
ArrayDistinct(Column)	Odebere duplicitní hodnoty z pole.
ArrayExcept(Column, Column)	Vrátí pole prvků v , `col1` ale ne v `col2`, bez duplicit. Pořadí prvků ve výsledku je nedeterministické.
ArrayIntersect(Column, Column)	Vrátí matici prvků v průsečíku daných dvou polí bez duplicit.
ArrayJoin(Column, String)	Zřetězí prvky `column` pomocí `delimiter`.
ArrayJoin(Column, String, String)	Zřetězí prvky `column` pomocí `delimiter`. Hodnoty Null jsou nahrazeny `nullReplacement`hodnotou .
ArrayMax(Column)	Vrátí maximální hodnotu v poli.
ArrayMin(Column)	Vrátí minimální hodnotu v matici.
ArrayPosition(Column, Object)	Vyhledá pozici prvního výskytu hodnoty v daném poli tak dlouho. Vrátí hodnotu null, pokud je některý z argumentů null.
ArrayRemove(Column, Object)	Odeberte z daného pole všechny prvky, které se rovnají elementu.
ArrayRepeat(Column, Column)	Vytvoří pole obsahující `left` argument, který se opakuje kolikrát je daný argumentem `right` .
ArrayRepeat(Column, Int32)	Vytvoří matici `left` obsahující argument opakovaný `count` kolikrát.
ArraySort(Column)	Seřadí vstupní pole ve vzestupném pořadí. Prvky vstupního pole musí být seřazené. Prvky null budou umístěny na konci vráceného pole.
ArraysOverlap(Column, Column)	Vrátí hodnotu true, pokud `a1` a `a2` mají aspoň jeden společný prvek, který není null. Pokud ne a obě pole jsou neprázdná a některé z nich obsahují hodnotu null, vrátí hodnotu null. V opačném případě vrátí hodnotu false.
ArraysZip(Column[])	Vrátí sloučenou matici struktur, ve které N-ta struktura obsahuje všechny N-tý hodnoty vstupních polí.
ArrayUnion(Column, Column)	Vrátí pole prvků ve sjednocení daných dvou polí bez duplicit.
Asc(String)	Vrátí výraz řazení na základě vzestupného pořadí sloupce.
Ascii(Column)	Vypočítá číselnou hodnotu prvního znaku sloupce řetězce a vrátí výsledek jako sloupec typu int.
AscNullsFirst(String)	Vrátí výraz řazení na základě vzestupného pořadí sloupce a hodnoty null se vrátí před hodnotami, které nejsou null.
AscNullsLast(String)	Vrátí výraz řazení na základě vzestupného pořadí sloupce a hodnoty null se zobrazí po hodnotách, které nejsou null.
Asin(Column)	Inverzní sinus v `column` radiánech, jako by byl vypočítány pomocí `java.lang.Math.asin`.
Asin(String)	Inverzní sinus v `columnName` radiánech, jako by byl vypočítány pomocí `java.lang.Math.asin`.
Atan(Column)	Inverzní tangens funkce `column` v radiánech, jako by byl vypočítány pomocí `java.lang.Math.atan`.
Atan(String)	Inverzní tangens funkce `columnName` v radiánech, jako by byl vypočítány pomocí `java.lang.Math.atan`.
Atan2(Column, Column)	Vypočítá atan2 pro danou `x` hodnotu a `y`.
Atan2(Column, Double)	Vypočítá atan2 pro danou `x` hodnotu a `y`.
Atan2(Column, String)	Vypočítá atan2 pro danou `x` hodnotu a `y`.
Atan2(Double, Column)	Vypočítá atan2 pro danou `x` hodnotu a `y`.
Atan2(Double, String)	Vypočítá atan2 pro danou `x` hodnotu a `y`.
Atan2(String, Column)	Vypočítá atan2 pro danou `x` hodnotu a `y`.
Atan2(String, Double)	Vypočítá atan2 pro danou `x` hodnotu a `y`.
Atan2(String, String)	Vypočítá atan2 pro danou `x` hodnotu a `y`.
Avg(Column)	Vrátí průměr hodnot ve skupině.
Avg(String)	Vrátí průměr hodnot ve skupině.
Base64(Column)	Vypočítá kódování BASE64 binárního sloupce a vrátí ho jako sloupec řetězce.
Bin(Column)	Výraz, který vrací řetězcovou reprezentaci binární hodnoty daného dlouhého sloupce. Například bin("12") vrátí "1100".
Bin(String)	Výraz, který vrací řetězcovou reprezentaci binární hodnoty daného dlouhého sloupce. Například bin("12") vrátí "1100".
BitwiseNOT(Column)	Počítá bitové funkce NOT.
Broadcast(DataFrame)	Označí datový rámec jako dostatečně malý pro použití ve spojeních všesměrového vysílání.
Bround(Column)	Vrátí hodnotu `column` zaokrouhleného na 0 desetinných míst s HALF_EVEN kruhovým režimem.
Bround(Column, Int32)	Vrátí hodnotu `column` zaokrouhleného na `scale` desetinná místa s HALF_EVEN kruhovým režimem.
Bucket(Column, Column)	Transformace pro libovolný typ, který se dělí podle hodnoty hash vstupního sloupce.
Bucket(Int32, Column)	Transformace pro libovolný typ, který se dělí podle hodnoty hash vstupního sloupce.
CallUDF(String, Column[])	Zavolejte uživatelem definovanou funkci zaregistrovanou prostřednictvím SparkSession.Udf(). Register().
Cbrt(Column)	Vypočítá kořen datové krychle daného sloupce.
Cbrt(String)	Vypočítá kořen datové krychle daného sloupce.
Ceil(Column)	Vypočítá horní mez dané hodnoty.
Ceil(String)	Vypočítá horní mez dané hodnoty.
Coalesce(Column[])	Vrátí první sloupec, který nemá hodnotu null, nebo null, pokud všechny vstupy mají hodnotu null.
Col(String)	Vrátí sloupec na základě názvu daného sloupce. Alias pro Column().
CollectList(Column)	Vrátí seznam objektů s duplicitními položkami.
CollectList(String)	Vrátí seznam objektů s duplicitními položkami.
CollectSet(Column)	Vrátí sadu objektů s odstraněnými duplicitními prvky.
CollectSet(String)	Vrátí sadu objektů s odstraněnými duplicitními prvky.
Column(String)	Vrátí sloupec na základě názvu daného sloupce.
Concat(Column[])	Zřetězí více vstupních sloupců do jednoho sloupce.
ConcatWs(String, Column[])	Zřetězí více sloupců vstupního řetězce do jednoho sloupce řetězce pomocí daného oddělovače.
Conv(Column, Int32, Int32)	Převede číslo ve sloupci řetězce z jednoho základu na jiný.
Corr(Column, Column)	Vrátí Pearsonův korelační koeficient pro dva sloupce.
Corr(String, String)	Vrátí Pearsonův korelační koeficient pro dva sloupce.
Cos(Column)	Vypočítá kosinus úhlu, jako by `java.lang.Math.cos`
Cos(String)	Vypočítá kosinus úhlu, jako by `java.lang.Math.cos`
Cosh(Column)	Vypočítá hyperbolický kosinus úhlu, jako by `java.lang.Math.cosh`
Cosh(String)	Vypočítá hyperbolický kosinus úhlu, jako by `java.lang.Math.cosh`
Count(Column)	Vrátí počet položek ve skupině.
Count(String)	Vrátí počet položek ve skupině.
CountDistinct(Column, Column[])	Vrátí počet jedinečných položek ve skupině.
CountDistinct(String, String[])	Vrátí počet jedinečných položek ve skupině.
CovarPop(Column, Column)	Vrátí kovarianci základního souboru pro dva sloupce.
CovarPop(String, String)	Vrátí kovarianci základního souboru pro dva sloupce.
CovarSamp(Column, Column)	Vrátí kovarianci vzorku pro dva sloupce.
CovarSamp(String, String)	Vrátí kovarianci vzorku pro dva sloupce.
Crc32(Column)	Vypočítá hodnotu kontroly cyklické redundance (CRC32) binárního sloupce a vrátí hodnotu bigint.
CumeDist()	Funkce Window: vrátí kumulativní rozdělení hodnot v rámci oddílu okna, tj. zlomek řádků, které jsou pod aktuálním řádkem.
CurrentDate()	Vrátí aktuální datum jako sloupec kalendářního data.
CurrentRow()	Funkce Window: Vrátí speciální ohraničení rámečku, které představuje aktuální řádek v oddílu okna.
CurrentTimestamp()	Vrátí aktuální časové razítko jako sloupec časového razítka.
DateAdd(Column, Column)	Vrátí datum, které je `days` ve dnech po `start`.
DateAdd(Column, Int32)	Vrátí datum, které je `days` ve dnech po `start`.
DateDiff(Column, Column)	Vrátí počet dnů od `start` do `end`.
DateFormat(Column, String)	Převede datum,časové razítko/řetězec na hodnotu řetězce ve formátu určeném formátem data daným druhým argumentem.
DateSub(Column, Column)	Vrátí datum, které je `days` ve dnech před `start`.
DateSub(Column, Int32)	Vrátí datum, které je `days` ve dnech před `start`.
DateTrunc(String, Column)	Vrátí časové razítko zkrácené na jednotku určenou formátem.
DayOfMonth(Column)	Extrahuje den v měsíci jako celé číslo z daného data, časového razítka nebo řetězce.
DayOfWeek(Column)	Extrahuje den v týdnu jako celé číslo z daného data, časového razítka nebo řetězce.
DayOfYear(Column)	Extrahuje den v roce jako celé číslo z daného data, časového razítka nebo řetězce.
Days(Column)	Transformace časových razítek a kalendářních dat pro rozdělení dat na dny.
Decode(Column, String)	Vypočítá první argument do řetězce z binárního souboru pomocí poskytnuté znakové sady (jeden z US-ASCII, ISO-8859-1, UTF-8, UTF-16BE, UTF-16LE, UTF-16LE, UTF-16.
Degrees(Column)	Převede úhel měřený v radiánech na přibližně ekvivalentní úhel měřený ve stupních.
Degrees(String)	Převede úhel měřený v radiánech na přibližně ekvivalentní úhel měřený ve stupních.
DenseRank()	Funkce Window: Vrátí pořadí řádků v oddílu okna bez mezer.
Desc(String)	Vrátí výraz řazení na základě sestupného pořadí sloupce.
DescNullsFirst(String)	Vrátí výraz řazení na základě sestupného pořadí sloupce a hodnoty null se vrátí před hodnotami, které nejsou null.
DescNullsLast(String)	Vrátí výraz řazení na základě sestupného pořadí sloupce a hodnoty null se zobrazí za hodnotami, které nejsou null.
ElementAt(Column, Object)	Vrátí prvek pole v daném indexu v `value` případě, že sloupec je pole. Vrátí hodnotu pro daný klíč v `value` případě, že sloupec je mapový.
Encode(Column, String)	Vypočítá první argument do binárního souboru z řetězce pomocí poskytnuté znakové sady (jeden z US-ASCII, ISO-8859-1, UTF-8, UTF-16BE, UTF-16LE, UTF-16LE, UTF-16LE).
Exp(Column)	Vypočítá exponenciální hodnotu.
Exp(String)	Vypočítá exponenciální hodnotu.
Explode(Column)	Vytvoří nový řádek pro každý prvek v daném poli nebo sloupci mapy.
ExplodeOuter(Column)	Vytvoří nový řádek pro každý prvek v daném poli nebo sloupci mapy. Na rozdíl od Explode() pokud je pole nebo mapování null nebo prázdné, vytvoří se hodnota null.
Expm1(Column)	Vypočítá exponenciální hodnotu mínus jedna.
Expm1(String)	Vypočítá exponenciální hodnotu mínus jedna.
Expr(String)	Analyzuje řetězec výrazu do sloupce, který představuje.
Factorial(Column)	Vypočítá faktoriál dané hodnoty.
First(Column, Boolean)	Vrátí první hodnotu sloupce ve skupině.
First(String, Boolean)	Vrátí první hodnotu sloupce ve skupině.
Flatten(Column)	Vytvoří jednu matici z pole polí. Pokud je struktura vnořených polí hlubší než dvě úrovně, odebere se pouze jedna úroveň vnoření.
Floor(Column)	Vypočítá podlahu dané hodnoty.
Floor(String)	Vypočítá podlahu dané hodnoty.
FormatNumber(Column, Int32)	Naformátuje danou číselnou hodnotu `column` do formátu #,####.##,zaokrouhlené na daná `d` desetinná místa s HALF_EVEN zaokrouhleným režimem a vrátí výsledek jako sloupec řetězce.
FormatString(String, Column[])	Formátuje argumenty ve stylu printf a vrátí výsledek jako sloupec řetězce.
FromCsv(Column, Column, Dictionary<String,String>)	Analyzuje sloupec obsahující řetězec sdíleného svazku `StructType` clusteru do sloupce se zadaným schématem.
FromCsv(Column, StructType, Dictionary<String,String>)	Analyzuje sloupec obsahující řetězec sdíleného svazku `StructType` clusteru do sloupce se zadaným schématem.
FromJson(Column, Column, Dictionary<String,String>)	Parsuje sloupec obsahující řetězec JSON na hodnotu `StructType` nebo `ArrayType` s `StructType`pomocí zadaného schématu.
FromJson(Column, String, Dictionary<String,String>)	Parsuje sloupec obsahující řetězec JSON na hodnotu `StructType` nebo `ArrayType` s `StructType`pomocí zadaného schématu.
FromUnixTime(Column)	Převede počet sekund z unixové epochy (1970-01-01 00:00 UTC) na řetězec představující časové razítko daného okamžiku v aktuálním systémovém časovém pásmu s výchozím formátem "yyyy-MM-dd HH:mm:ss".
FromUnixTime(Column, String)	Převede počet sekund z epochy systému UNIX (1970-01-01 00:00 UTC) na řetězec představující časové razítko daného okamžiku v aktuálním systémovém časovém pásmu s daným formátem.
FromUtcTimestamp(Column, Column)	Časové razítko jako "2017-07-14 02:40:00.0", interpretuje ho jako čas ve formátu UTC a vykreslí tento čas jako časové razítko v daném časovém pásmu. Například GMT+1 by vynesla 2017-07-14 03:40:00.0.
FromUtcTimestamp(Column, String)	Časové razítko jako "2017-07-14 02:40:00.0", interpretuje ho jako čas ve formátu UTC a vykreslí tento čas jako časové razítko v daném časovém pásmu. Například GMT+1 by vynesla 2017-07-14 03:40:00.0.
GetJsonObject(Column, String)	Extrahuje objekt JSON z řetězce JSON na základě zadané cesty a vrátí řetězec JSON extrahovaného objektu JSON.
Greatest(Column[])	Vrátí nejvyšší hodnotu ze seznamu hodnot a přeskočí hodnoty null.
Greatest(String, String[])	Vrátí největší hodnotu seznamu názvů sloupců a přeskočí hodnoty null.
Grouping(Column)	Určuje, jestli je zadaný sloupec v seznamu GROUP BY agregovaný nebo ne, a vrátí hodnotu 1 pro agregované nebo 0 pro neagregované v sadě výsledků.
Grouping(String)	Určuje, jestli je zadaný sloupec v seznamu GROUP BY agregovaný nebo ne, a vrátí hodnotu 1 pro agregované nebo 0 pro neagregované v sadě výsledků.
GroupingId(Column[])	Vrátí počet jedinečných položek ve skupině.
GroupingId(String, String[])	Vrátí počet jedinečných položek ve skupině.
Hash(Column[])	Vypočítá hashovací kód daných sloupců a vrátí výsledek jako sloupec int.
Hex(Column)	Vypočítá šestnáctkovou hodnotu daného sloupce.
Hour(Column)	Extrahuje hodiny jako celé číslo z daného data, časového razítka nebo řetězce.
Hours(Column)	Transformace časových razítek pro rozdělení dat na hodiny.
Hypot(Column, Column)	`sqrt(a^2^ + b^2^)` Výpočty bez přechodného přetečení nebo podtečení.
Hypot(Column, Double)	`sqrt(a^2^ + b^2^)` Výpočty bez přechodného přetečení nebo podtečení.
Hypot(Column, String)	`sqrt(a^2^ + b^2^)` Výpočty bez přechodného přetečení nebo podtečení.
Hypot(Double, Column)	`sqrt(a^2^ + b^2^)` Výpočty bez přechodného přetečení nebo podtečení.
Hypot(Double, String)	`sqrt(a^2^ + b^2^)` Výpočty bez přechodného přetečení nebo podtečení.
Hypot(String, Column)	`sqrt(a^2^ + b^2^)` Výpočty bez přechodného přetečení nebo podtečení.
Hypot(String, Double)	`sqrt(a^2^ + b^2^)` Výpočty bez přechodného přetečení nebo podtečení.
Hypot(String, String)	`sqrt(a^2^ + b^2^)` Výpočty bez přechodného přetečení nebo podtečení.
InitCap(Column)	Vrátí nový sloupec řetězce převedením prvního písmena každého slova na velká písmena. Slova jsou oddělena prázdnými znaky.
InputFileName()	Vytvoří sloupec řetězce pro název souboru aktuální úlohy Sparku.
Instr(Column, String)	Vyhledejte pozici prvního výskytu daného podřetětce.
IsNaN(Column)	Vrátí hodnotu true a sloupec je NaN.
IsNull(Column)	Vrátí hodnotu true a sloupec má hodnotu null.
JsonTuple(Column, String[])	Vytvoří nový řádek pro sloupec JSON podle zadaných názvů polí.
Kurtosis(Column)	Vrátí kurtózu hodnot ve skupině.
Kurtosis(String)	Vrátí kurtózu hodnot ve skupině.
Lag(Column, Int32, Object)	Funkce Window: Vrátí hodnotu, která je posun řádků před aktuálním řádkem, a hodnotu null, pokud je před aktuálním řádkem menší než posun. Například posun jednoho vrátí předchozí řádek v libovolném bodě oddílu okna.
Lag(String, Int32, Object)	Funkce Window: Vrátí hodnotu, která je posun řádků před aktuálním řádkem, a hodnotu null, pokud je před aktuálním řádkem menší než posun. Například posun jednoho vrátí předchozí řádek v libovolném bodě oddílu okna.
Last(Column, Boolean)	Vrátí poslední hodnotu sloupce ve skupině.
Last(String, Boolean)	Vrátí poslední hodnotu sloupce ve skupině.
LastDay(Column)	Vrátí poslední den v měsíci, ke kterému dané datum patří.
Lead(Column, Int32, Object)	Funkce Window: Vrátí hodnotu, která je posun řádků za aktuálním řádkem, a null, pokud je za aktuálním řádkem menší než "posun". Například posun jednoho vrátí další řádek v libovolném bodě v oddílu okna.
Lead(String, Int32, Object)	Funkce Window: Vrátí hodnotu, která je posun řádků za aktuálním řádkem, a null, pokud je za aktuálním řádkem menší než "posun". Například posun jednoho vrátí další řádek v libovolném bodě v oddílu okna.
Least(Column[])	Vrátí nejnižší hodnotu seznamu hodnot a přeskočí hodnoty null.
Least(String, String[])	Vrátí nejnižší hodnotu seznamu hodnot a přeskočí hodnoty null.
Length(Column)	Vypočítá délku znaku daného řetězce nebo počet bajtů binárního řetězce.
Levenshtein(Column, Column)	Vypočítá levenshtein vzdálenost dvou zadaných řetězců.
Lit(Object)	Vytvoří sloupec hodnoty literálu.
Locate(String, Column)	Vyhledejte pozici prvního výskytu daného podřetětce.
Locate(String, Column, Int32)	Vyhledejte pozici prvního výskytu daného podřetětce od daného posunu pozice.
Log(Column)	Vypočítá přirozený logaritmus dané hodnoty.
Log(Double, Column)	Vypočítá první logaritmus základu argumentu druhého argumentu.
Log(Double, String)	Vypočítá první logaritmus základu argumentu druhého argumentu.
Log(String)	Vypočítá přirozený logaritmus dané hodnoty.
Log10(Column)	Vypočítá logaritmus dané hodnoty v základu 10.
Log10(String)	Vypočítá logaritmus dané hodnoty v základu 10.
Log1p(Column)	Vypočítá přirozený logaritmus dané hodnoty plus jedna.
Log1p(String)	Vypočítá přirozený logaritmus dané hodnoty plus jedna.
Log2(Column)	Vypočítá logaritmus daného sloupce v základu 2.
Log2(String)	Vypočítá logaritmus daného sloupce v základu 2.
Lower(Column)	Převede sloupec řetězce na malá písmena.
Lpad(Column, Int32, String)	Do levé části sloupce řetězce vložte panel na danou délku `len`. Pokud je sloupec řetězce delší než `len`, návratová hodnota se zkrátí na `len` znaky.
Ltrim(Column)	Ořízněte mezery od levého konce pro daný sloupec řetězce.
Ltrim(Column, String)	Oříznout zadaný řetězec znaků z levého konce pro daný sloupec řetězce.
Map(Column[])	Vytvoří nový sloupec mapy.
MapConcat(Column[])	Vrátí sjednocení všech daných map.
MapEntries(Column)	Vrátí neuspořádané pole všech položek v dané mapě.
MapFromArrays(Column, Column)	Vytvoří nový sloupec mapy. Pole v prvním sloupci se používá pro klíče. Pole ve druhém sloupci se používá pro hodnoty. Všechny prvky v poli pro klíč by neměly mít hodnotu null.
MapFromEntries(Column)	Vrátí mapu vytvořenou z daného pole položek.
MapKeys(Column)	Vrátí neuspořádané pole obsahující klíče mapy.
MapValues(Column)	Vrátí neuspořádané pole obsahující hodnoty mapy.
Max(Column)	Vrátí maximální hodnotu sloupce ve skupině.
Max(String)	Vrátí maximální hodnotu sloupce ve skupině.
Md5(Column)	Vypočítá hodnotu hash MD5 binárního sloupce a vrátí hodnotu jako šestnáctkový řetězec o 32 znacích.
Mean(Column)	Vrátí průměrnou hodnotu sloupce ve skupině.
Mean(String)	Vrátí průměrnou hodnotu sloupce ve skupině.
Min(Column)	Vrátí minimální hodnotu sloupce ve skupině.
Min(String)	Vrátí minimální hodnotu sloupce ve skupině.
Minute(Column)	Extrahuje minuty jako celé číslo z daného data, časového razítka nebo řetězce.
MonotonicallyIncreasingId()	Sloupcový výraz, který generuje monotónně rostoucí 64bitová celá čísla.
Month(Column)	Extrahuje měsíc jako celé číslo z daného data, časového razítka nebo řetězce.
Months(Column)	Transformace pro časová razítka a data pro rozdělení dat na měsíce.
MonthsBetween(Column, Column)	Vrátí počet měsíců mezi kalendářními daty `end` a `stasrt`.
MonthsBetween(Column, Column, Boolean)	Vrátí počet měsíců mezi kalendářními daty `end` a `start`. Pokud `roundOff` je nastavena hodnota true, výsledek se zaokrouhlí na 8 číslic; jinak se nezaokrouhlí.
NaNvl(Column, Column)	Vrátí sloupec col1, pokud není nan, nebo sloupec2, pokud sloupec1 je NaN.
Negate(Column)	Unární mínus, tj. neguje výraz.
NextDay(Column, String)	Při zadání sloupce kalendářního data vrátí první datum, které je pozdější než hodnota sloupce kalendářního data v zadaném dni v týdnu.
Not(Column)	Inverze logického výrazu, tj. NOT.
Ntile(Int32)	Funkce Window: vrátí ID skupiny ntile (od 1 po `n` včetně) v uspořádané části okna. Pokud `n` je například 4, první čtvrtletí řádků získá hodnotu 1, druhé čtvrtletí získá hodnotu 2, třetí čtvrtletí 3 a poslední čtvrtletí získá hodnotu 4.
Overlay(Column, Column, Column)	Překryjte zadanou část `src` řetězcem `replace`, počínaje od pozice `pos` bajtu z .`src`
Overlay(Column, Column, Column, Column)	Překryjte zadanou část `src` parametrem `replace`, počínaje od pozice `pos` bajtu `src` a pokračováním pro `len` bajty.
PercentRank()	Funkce Window: Vrátí relativní pořadí (tj. percentil) řádků v rámci oddílu okna.
Pmod(Column, Column)	Vrátí kladnou hodnotu dělitele dividend mod.
PosExplode(Column)	Vytvoří nový řádek pro každý prvek s pozicí v daném poli nebo sloupci mapy.
PosExplodeOuter(Column)	Vytvoří nový řádek pro každý prvek s pozicí v daném poli nebo sloupci mapy. Na rozdíl od Posexplode() je-li pole nebo mapování null nebo prázdné, vytvoří se řádek(null, null).
Pow(Column, Column)	Vrátí hodnotu prvního argumentu umocněné na mocninu druhého argumentu.
Pow(Column, Double)	Vrátí hodnotu prvního argumentu umocněné na mocninu druhého argumentu.
Pow(Column, String)	Vrátí hodnotu prvního argumentu umocněné na mocninu druhého argumentu.
Pow(Double, Column)	Vrátí hodnotu prvního argumentu umocněné na mocninu druhého argumentu.
Pow(Double, String)	Vrátí hodnotu prvního argumentu umocněné na mocninu druhého argumentu.
Pow(String, Column)	Vrátí hodnotu prvního argumentu umocněné na mocninu druhého argumentu.
Pow(String, Double)	Vrátí hodnotu prvního argumentu umocněné na mocninu druhého argumentu.
Pow(String, String)	Vrátí hodnotu prvního argumentu umocněné na mocninu druhého argumentu.
Quarter(Column)	Extrahuje čtvrtletí jako celé číslo z daného data, časového razítka nebo řetězce.
Radians(Column)	Převede úhel měřený ve stupních na přibližně ekvivalentní úhel měřený v radiánech.
Radians(String)	Převede úhel měřený ve stupních na přibližně ekvivalentní úhel měřený v radiánech.
Rand()	Vygeneruje náhodný sloupec s nezávislými a identicky distribuovanými vzorky z U[0.0, 1.0].
Rand(Int64)	Vygeneruje náhodný sloupec s nezávislými a identicky distribuovanými vzorky z U[0.0, 1.0].
Randn()	Vygeneruje náhodný sloupec s nezávislými a identicky distribuovanými vzorky ze standardního normálního rozdělení.
Randn(Int64)	Vygeneruje náhodný sloupec s nezávislými a identicky distribuovanými vzorky ze standardního normálního rozdělení.
Rank()	Funkce Window: vrátí pořadí řádků v rámci oddílu okna.
RegexpExtract(Column, String, Int32)	Extrahujte ze zadaného sloupce řetězce konkrétní skupinu odpovídající regulárnímu výrazu Java.
RegexpReplace(Column, Column, Column)	Nahraďte všechny podřetězce zadané řetězcové hodnoty, které odpovídají vzoru, daným náhradním řetězcem.
RegexpReplace(Column, String, String)	Nahraďte všechny podřetězce zadané řetězcové hodnoty, které odpovídají vzoru, daným náhradním řetězcem.
Repeat(Column, Int32)	Zopakuje řetězcový sloupec `n` times a vrátí ho jako nový sloupec řetězce.
Reverse(Column)	Obrátí sloupec řetězce a vrátí ho jako nový sloupec řetězce.
Rint(Column)	Vrátí dvojitou hodnotu, která je nejblíže argumentu a je rovna matematickému celočíselnému argumentu.
Rint(String)	Vrátí dvojitou hodnotu, která je nejblíže argumentu a je rovna matematickému celočíselnému argumentu.
Round(Column)	Vrátí hodnotu `column` zaokrouhlené na 0 desetinných míst s HALF_UP kruhovým režimem.
Round(Column, Int32)	Vrátí hodnotu `column` zaokrouhleného na `scale` desetinná místa s HALF_UP kruhovým režimem.
RowNumber()	Funkce Window: Vrátí pořadové číslo začínající číslem 1 v rámci oddílu okna.
Rpad(Column, Int32, String)	Dosadíte sloupec řetězce pravým tlačítkem na danou délku `len`. Pokud je sloupec řetězce delší než `len`, návratová hodnota se zkrátí na `len` znaky.
Rtrim(Column)	Ořízněte mezery od pravého konce pro zadanou řetězcovou hodnotu.
Rtrim(Column, String)	Oříznout zadaný řetězec znaků od pravého konce pro daný sloupec řetězce.
SchemaOfCsv(Column)	Analyzuje řetězec CSV a odvodí jeho schéma ve formátu DDL.
SchemaOfCsv(Column, Dictionary<String,String>)	Analyzuje řetězec CSV a odvodí jeho schéma ve formátu DDL.
SchemaOfCsv(String)	Analyzuje řetězec CSV a odvodí jeho schéma ve formátu DDL.
SchemaOfJson(Column)	Analyzuje řetězec JSON a odvodí jeho schéma ve formátu DDL.
SchemaOfJson(Column, Dictionary<String,String>)	Analyzuje řetězec JSON a odvodí jeho schéma ve formátu DDL.
SchemaOfJson(String)	Analyzuje řetězec JSON a odvodí jeho schéma ve formátu DDL.
Second(Column)	Extrahuje sekundy jako celé číslo z daného data, časového razítka nebo řetězce.
Sequence(Column, Column)	Vygenerujte sekvenci celých čísel od začátku do konce. Pokud je hodnota start menší nebo rovna zastavení, v opačném případě se hodnota -1 navyšuje o 1.
Sequence(Column, Column, Column)	Vygenerujte sekvenci celých čísel z `start` do `stop`a zvyšte o `step`.
Sha1(Column)	Vypočítá algoritmus hash SHA-1 binárního sloupce a vrátí hodnotu jako šestnáctkový řetězec o 40 znacích.
Sha2(Column, Int32)	Vypočítá rodinu sha-2 hash funkcí binárního sloupce a vrátí hodnotu jako šestnáctkový řetězec.
ShiftLeft(Column, Int32)	Posune danou hodnotu `numBits` doleva.
ShiftRight(Column, Int32)	(Signed) posune danou hodnotu `numBits` doprava.
ShiftRightUnsigned(Column, Int32)	Bez znaménka posune danou hodnotu `numBits` doprava.
Shuffle(Column)	Vrátí náhodnou permutaci daného pole.
Signum(Column)	Vypočítá znaménko dané hodnoty.
Signum(String)	Vypočítá znaménko dané hodnoty.
Sin(Column)	Vypočítá sinus úhlu, jako by byl vypočten pomocí `java.lang.Math.sin`.
Sin(String)	Vypočítá sinus úhlu, jako by byl vypočten pomocí `java.lang.Math.sin`.
Sinh(Column)	Vypočítá hyperbolický sinus úhlu, jako by byl vypočten pomocí `java.lang.Math.sin`.
Sinh(String)	Vypočítá hyperbolický sinus úhlu, jako by byl vypočten pomocí `java.lang.Math.sin`.
Size(Column)	Vrátí délku pole nebo mapy.
Skewness(Column)	Vrátí šikmost hodnot ve skupině.
Skewness(String)	Vrátí šikmost hodnot ve skupině.
Slice(Column, Int32, Int32)	Vrátí pole obsahující všechny prvky z `column` indexu `start` (nebo počínaje koncem, pokud `start` je záporná) se zadaným `length`parametrem .
SortArray(Column, Boolean)	Seřadí vstupní pole pro daný sloupec vzestupně (výchozí) nebo sestupně, přirozené pořadí prvků pole.
Soundex(Column)	Vrátí kód soundex pro zadaný výraz.
SparkPartitionId()	ID oddílu.
Split(Column, String)	Rozdělí řetězec pomocí vzoru regulárního výrazu.
Split(Column, String, Int32)	Rozdělí str kolem shod daného vzoru.
Sqrt(Column)	Vypočítá druhou odmocninu zadané hodnoty float.
Sqrt(String)	Vypočítá druhou odmocninu zadané hodnoty float.
Stddev(Column)	Alias pro StddevSamp().
Stddev(String)	Alias pro StddevSamp().
StddevPop(Column)	Vrátí směrodatnou odchylku základního souboru výrazu ve skupině.
StddevPop(String)	Vrátí směrodatnou odchylku základního souboru výrazu ve skupině.
StddevSamp(Column)	Vrátí vzorovou směrodatnou odchylku výrazu ve skupině.
StddevSamp(String)	Vrátí vzorovou směrodatnou odchylku výrazu ve skupině.
Struct(Column[])	Vytvoří nový sloupec struktury, který složí více vstupních sloupců.
Struct(String, String[])	Vytvoří nový sloupec struktury, který složí více vstupních sloupců.
Substring(Column, Int32, Int32)	Vrátí podřetěc (neboli řez pole bajtů) od dané pozice pro danou délku.
SubstringIndex(Column, String, Int32)	Vrátí podřetězc z daného řetězce před `count` výskyty daného oddělovače.
Sum(Column)	Vrátí součet všech hodnot ve výrazu.
Sum(String)	Vrátí součet všech hodnot ve výrazu.
SumDistinct(Column)	Vrátí součet jedinečných hodnot ve výrazu.
SumDistinct(String)	Vrátí součet jedinečných hodnot ve výrazu.
Tan(Column)	Vypočítá tangens dané hodnoty, jako by byl vypočten pomocí `java.lang.Math.tan`.
Tan(String)	Vypočítá tangens dané hodnoty, jako by byl vypočten pomocí `java.lang.Math.tan`.
Tanh(Column)	Vypočítá hyperbolický tangens dané hodnoty, jako by byl vypočten pomocí `java.lang.Math.tanh`.
Tanh(String)	Vypočítá hyperbolický tangens dané hodnoty, jako by byl vypočten pomocí `java.lang.Math.tanh`.
ToCsv(Column)	Převede sloupec obsahující `StructType` řetězec csv se zadaným schématem.
ToCsv(Column, Dictionary<String,String>)	Převede sloupec obsahující `StructType` řetězec csv se zadaným schématem.
ToDate(Column)	Převede sloupec `DateType` na přetypováním pravidel na `DateType`.
ToDate(Column, String)	Převede sloupec na sloupec `DateType` se zadaným formátem.
ToJson(Column, Dictionary<String,String>)	Převede sloupec obsahující `StructType`, `ArrayType` of `StructType`s, a `MapType` nebo `ArrayType` s `MapType`na řetězec JSON.
ToTimestamp(Column)	Převeďte časový řetězec na časové razítko unixu (v sekundách) přetypováním pravidel na `TimestampType`.
ToTimestamp(Column, String)	Převeďte časový řetězec na časové razítko systému Unix (v sekundách) se zadaným formátem.
ToUtcTimestamp(Column, Column)	Časové razítko, jako je "2017-07-14 02:40:00.0", interpretuje ho jako čas v daném časovém pásmu a vykreslí tento čas jako časové razítko ve formátu UTC. Například GMT+1 by vynesla 2017-07-14 01:40:00.0.
ToUtcTimestamp(Column, String)	Časové razítko, jako je "2017-07-14 02:40:00.0", interpretuje ho jako čas v daném časovém pásmu a vykreslí tento čas jako časové razítko ve formátu UTC. Například GMT+1 by vynesla 2017-07-14 01:40:00.0.
Translate(Column, String, String)	Přeložte všechny znaky, které odpovídají danému `matchingString` znaku `replaceString`ve sloupci .
Trim(Column)	Ořízněte mezery z obou konců zadaného sloupce řetězce.
Trim(Column, String)	Ořízněte zadaný znak z obou konců zadaného sloupce řetězce.
Trunc(Column, String)	Vrátí datum zkrácené na jednotku určenou formátem.
Udf(Func<Row>, StructType)	Vytvoří UDF ze zadaného delegáta.
Udf<A1,RT>(Func<A1,RT>)	Vytvoří UDF ze zadaného delegáta.
Udf<T>(Func<T,Row>, StructType)	Vytvoří UDF ze zadaného delegáta.
Udf<T1,T2,T3,T4,T5,T6,T7,T8,T9,T10,TResult>(Func<T1,T2,T3,T4,T5,T6,T7,T8,T9,T10,TResult>)	Vytvoří UDF ze zadaného delegáta.
Udf<T1,T2,T3,T4,T5,T6,T7,T8,T9,T10>(Func<T1,T2,T3,T4,T5,T6,T7,T8,T9,T10,Row>, StructType)	Vytvoří UDF ze zadaného delegáta.
Udf<T1,T2,T3,T4,T5,T6,T7,T8,T9,TResult>(Func<T1,T2,T3,T4,T5,T6,T7,T8,T9,TResult>)	Vytvoří UDF ze zadaného delegáta.
Udf<T1,T2,T3,T4,T5,T6,T7,T8,T9>(Func<T1,T2,T3,T4,T5,T6,T7,T8,T9,Row>, StructType)	Vytvoří UDF ze zadaného delegáta.
Udf<T1,T2,T3,T4,T5,T6,T7,T8,TResult>(Func<T1,T2,T3,T4,T5,T6,T7,T8,TResult>)	Vytvoří UDF ze zadaného delegáta.
Udf<T1,T2,T3,T4,T5,T6,T7,T8>(Func<T1,T2,T3,T4,T5,T6,T7,T8,Row>, StructType)	Vytvoří UDF ze zadaného delegáta.
Udf<T1,T2,T3,T4,T5,T6,T7,TResult>(Func<T1,T2,T3,T4,T5,T6,T7,TResult>)	Vytvoří UDF ze zadaného delegáta.
Udf<T1,T2,T3,T4,T5,T6,T7>(Func<T1,T2,T3,T4,T5,T6,T7,Row>, StructType)	Vytvoří UDF ze zadaného delegáta.
Udf<T1,T2,T3,T4,T5,T6,TResult>(Func<T1,T2,T3,T4,T5,T6,TResult>)	Vytvoří UDF ze zadaného delegáta.
Udf<T1,T2,T3,T4,T5,T6>(Func<T1,T2,T3,T4,T5,T6,Row>, StructType)	Vytvoří UDF ze zadaného delegáta.
Udf<T1,T2,T3,T4,T5,TResult>(Func<T1,T2,T3,T4,T5,TResult>)	Vytvoří UDF ze zadaného delegáta.
Udf<T1,T2,T3,T4,T5>(Func<T1,T2,T3,T4,T5,Row>, StructType)	Vytvoří UDF ze zadaného delegáta.
Udf<T1,T2,T3,T4,TResult>(Func<T1,T2,T3,T4,TResult>)	Vytvoří UDF ze zadaného delegáta.
Udf<T1,T2,T3,T4>(Func<T1,T2,T3,T4,Row>, StructType)	Vytvoří UDF ze zadaného delegáta.
Udf<T1,T2,T3,TResult>(Func<T1,T2,T3,TResult>)	Vytvoří UDF ze zadaného delegáta.
Udf<T1,T2,T3>(Func<T1,T2,T3,Row>, StructType)	Vytvoří UDF ze zadaného delegáta.
Udf<T1,T2,TResult>(Func<T1,T2,TResult>)	Vytvoří UDF ze zadaného delegáta.
Udf<T1,T2>(Func<T1,T2,Row>, StructType)	Vytvoří UDF ze zadaného delegáta.
Udf<TResult>(Func<TResult>)	Vytvoří UDF ze zadaného delegáta.
Unbase64(Column)	Dekóduje sloupec řetězce s kódováním BASE64 a vrátí ho jako binární sloupec.
UnboundedFollowing()	Funkce Window: Vrátí speciální ohraničení rámečku, které představuje poslední řádek v oddílu okna.
UnboundedPreceding()	Funkce Window: Vrátí speciální ohraničení rámečku, které představuje první řádek v oddílu okna.
Unhex(Column)	Inverzní k hexu. Interpretuje každou dvojici znaků jako šestnáctkové číslo a převede na bajtové vyjádření čísla.
UnixTimestamp()	Vrátí aktuální časové razítko systému Unix (v sekundách).
UnixTimestamp(Column)	Převede časový řetězec ve formátu yyyy-MM-dd HH:mm:ss na časové razítko unixu (v sekundách) s použitím výchozího časového pásma a výchozího národního prostředí.
UnixTimestamp(Column, String)	Převede časový řetězec s daným formátem na časové razítko systému Unix (v sekundách).
Upper(Column)	Převede sloupec řetězce na velká písmena.
Variance(Column)	Alias pro VarSamp().
Variance(String)	Alias pro VarSamp().
VarPop(Column)	Vrátí rozptyl základního souboru hodnot ve skupině.
VarPop(String)	Vrátí rozptyl základního souboru hodnot ve skupině.
VarSamp(Column)	Vrátí nezaujatý rozptyl hodnot ve skupině.
VarSamp(String)	Vrátí nezaujatý rozptyl hodnot ve skupině.
WeekOfYear(Column)	Extrahuje číslo týdne jako celé číslo z daného data, časového razítka nebo řetězce.
When(Column, Object)	Vyhodnotí podmínku a vrátí jeden z více možných výrazů výsledku. Pokud na konci není definováno jinak, vrátí se hodnota null pro nesplněné podmínky.
Window(Column, String)	Vygeneruje časové intervaly přeskakování s časovým razítkem určujícím sloupec.
Window(Column, String, String)	Rozdělte řádky do jednoho nebo více časových intervalů s daným sloupcem časového razítka.
Window(Column, String, String, String)	Rozdělte řádky do jednoho nebo více časových intervalů s daným sloupcem časového razítka.
XXHash64(Column[])	Vypočítá hashovací kód daných sloupců pomocí 64bitové varianty algoritmu xxHash a vrátí výsledek jako dlouhý sloupec.
Year(Column)	Extrahuje rok jako celé číslo z daného data, časového razítka nebo řetězce.
Years(Column)	Transformace časových razítek a kalendářních dat pro rozdělení dat na roky.

Platí pro