Functions クラス

リファレンス

定義

名前空間:: Microsoft.Spark.Sql

アセンブリ:: Microsoft.Spark.dll

パッケージ:: Microsoft.Spark v1.0.0

重要

一部の情報は、リリース前に大きく変更される可能性があるプレリリースされた製品に関するものです。 Microsoft は、ここに記載されている情報について、明示または黙示を問わず、一切保証しません。

DataFrame 操作で使用できる関数。

public static class Functions

type Functions = class

Public Class Functions

継承: Object
Functions

メソッド

Abs(Column)	絶対値を計算します。
Acos(Column)	によって計算される`java.lang.Math.acos`場合と同様に、ラジアン単位のの逆コサイン`column`。
Acos(String)	によって計算される`java.lang.Math.acos`場合と同様に、ラジアン単位のの逆コサイン`columnName`。
AddMonths(Column, Column)	`startDate` の後の `numMonths` である日付を返します。
AddMonths(Column, Int32)	`startDate` の後の `numMonths` である日付を返します。
ApproxCountDistinct(Column)	グループ内の個別の項目のおおよその数を返します。
ApproxCountDistinct(Column, Double)	グループ内の個別の項目のおおよその数を返します。
ApproxCountDistinct(String)	グループ内の個別の項目のおおよその数を返します。
ApproxCountDistinct(String, Double)	グループ内の個別の項目のおおよその数を返します。
Array(Column[])	新しい配列列を作成します。入力列はすべて同じデータ型である必要があります。
Array(String, String[])	新しい配列列を作成します。入力列はすべて同じデータ型である必要があります。
ArrayContains(Column, Object)	配列が null の場合は null、配列にが含まれている場合は true、それ以外の `value`場合は false を返します。
ArrayDistinct(Column)	配列から重複する値を削除します。
ArrayExcept(Column, Column)	内の要素 `col1` の配列を返しますが、では `col2`重複しません。結果内の要素の順序は非決定的です。
ArrayIntersect(Column, Column)	指定された 2 つの配列の交差部分にある要素の配列を、重複せずに返します。
ArrayJoin(Column, String)	を使用しての `column` 要素を連結します `delimiter`。
ArrayJoin(Column, String, String)	を使用しての `column` 要素を連結します `delimiter`。 Null 値はに `nullReplacement`置き換えられます。
ArrayMax(Column)	配列内の最大値を返します。
ArrayMin(Column)	配列の最小値を返します。
ArrayPosition(Column, Object)	指定された配列内の値が最初に出現する位置を、長い間検索します。いずれかの引数が null の場合は null を返します。
ArrayRemove(Column, Object)	指定された配列から element と等しいすべての要素を削除します。
ArrayRepeat(Column, Column)	引数によって指定された回数繰り返される引数を含む `left` 配列を `right` 作成します。
ArrayRepeat(Column, Int32)	引数が繰り返される回数を `left` 含む配列を `count` 作成します。
ArraySort(Column)	入力配列を昇順で並べ替えます。入力配列の要素は並べ替え可能である必要があります。 null 要素は、返される配列の末尾に配置されます。
ArraysOverlap(Column, Column)	共通の null 以外の要素が 1 つ以上ある場合`a1a2`は true を返します。が指定されておらず、両方の配列が空ではなく、いずれかの配列に null が含まれている場合は、null が返されます。それ以外の場合は false を返します。
ArraysZip(Column[])	N 番目の構造体に入力配列のすべての N 番目の値が含まれている構造体のマージされた配列を返します。
ArrayUnion(Column, Column)	指定された 2 つの配列の和集合内の要素の配列を、重複せずに返します。
Asc(String)	列の昇順に基づいて並べ替え式を返します。
Ascii(Column)	文字列列の最初の文字の数値を計算し、結果を int 列として返します。
AscNullsFirst(String)	列の昇順に基づいて並べ替え式を返し、null 以外の値の前に null 値を返します。
AscNullsLast(String)	列の昇順に基づいて並べ替え式を返し、null 以外の値の後に null 値が表示されます。
Asin(Column)	によって計算される`java.lang.Math.asin`場合と同様に、ラジアン単位のの逆サイン`column`。
Asin(String)	によって計算される`java.lang.Math.asin`場合と同様に、ラジアン単位のの逆サイン`columnName`。
Atan(Column)	によって計算される`java.lang.Math.atan`場合と同様に、ラジアン単位のの逆正接`column`。
Atan(String)	によって計算される`java.lang.Math.atan`場合と同様に、ラジアン単位のの逆正接`columnName`。
Atan2(Column, Column)	指定 `x` されたと `y`の atan2 を計算します。
Atan2(Column, Double)	指定 `x` されたと `y`の atan2 を計算します。
Atan2(Column, String)	指定 `x` されたと `y`の atan2 を計算します。
Atan2(Double, Column)	指定 `x` されたと `y`の atan2 を計算します。
Atan2(Double, String)	指定 `x` されたと `y`の atan2 を計算します。
Atan2(String, Column)	指定 `x` されたと `y`の atan2 を計算します。
Atan2(String, Double)	指定 `x` されたと `y`の atan2 を計算します。
Atan2(String, String)	指定 `x` されたと `y`の atan2 を計算します。
Avg(Column)	グループ内の値の平均を返します。
Avg(String)	グループ内の値の平均を返します。
Base64(Column)	バイナリ列の BASE64 エンコードを計算し、文字列列として返します。
Bin(Column)	指定された long 列のバイナリ値の文字列表現を返す式。たとえば、bin("12") は "1100" を返します。
Bin(String)	指定された long 列のバイナリ値の文字列表現を返す式。たとえば、bin("12") は "1100" を返します。
BitwiseNOT(Column)	ビットごとの NOT を計算します。
Broadcast(DataFrame)	DataFrame をブロードキャスト結合で使用するのに十分な小さいものとしてマークします。
Bround(Column)	丸めモードで小数点以下 0 桁に丸められたの値 `column` HALF_EVEN返します。
Bround(Column, Int32)	丸めモードで小数点以下に丸められた `scale` の`column`値HALF_EVEN返します。
Bucket(Column, Column)	入力列のハッシュによってパーティション分割される任意の型の変換。
Bucket(Int32, Column)	入力列のハッシュによってパーティション分割される任意の型の変換。
CallUDF(String, Column[])	SparkSession.Udf() を介して登録されたユーザー定義関数を呼び出します。Register()。
Cbrt(Column)	指定された列のキューブルートを計算します。
Cbrt(String)	指定された列のキューブルートを計算します。
Ceil(Column)	指定された値の上限を計算します。
Ceil(String)	指定された値の上限を計算します。
Coalesce(Column[])	null ではない最初の列を返します。すべての入力が null の場合は null を返します。
Col(String)	指定した列名に基づいて Column を返します。 Column() のエイリアス。
CollectList(Column)	重複するオブジェクトの一覧を返します。
CollectList(String)	重複するオブジェクトの一覧を返します。
CollectSet(Column)	重複する要素が削除されたオブジェクトのセットを返します。
CollectSet(String)	重複する要素が削除されたオブジェクトのセットを返します。
Column(String)	指定した列名に基づいて Column を返します。
Concat(Column[])	複数の入力列を 1 つの列に連結します。
ConcatWs(String, Column[])	指定された区切り記号を使用して、複数の入力文字列列を 1 つの文字列列に連結します。
Conv(Column, Int32, Int32)	文字列列の数値をベース間で変換します。
Corr(Column, Column)	2 つの列のピアソン相関係数を返します。
Corr(String, String)	2 つの列のピアソン相関係数を返します。
Cos(Column)	によって計算されるかのように、角度のコサインを計算します `java.lang.Math.cos`
Cos(String)	によって計算されるかのように、角度のコサインを計算します `java.lang.Math.cos`
Cosh(Column)	によって計算されるかのように、角度の双曲線余弦を計算します `java.lang.Math.cosh`
Cosh(String)	によって計算されるかのように、角度の双曲線余弦を計算します `java.lang.Math.cosh`
Count(Column)	グループ内のアイテムの数を返します。
Count(String)	グループ内のアイテムの数を返します。
CountDistinct(Column, Column[])	グループ内の個別の項目の数を返します。
CountDistinct(String, String[])	グループ内の個別の項目の数を返します。
CovarPop(Column, Column)	2 つの列の母集団共分散を返します。
CovarPop(String, String)	2 つの列の母集団共分散を返します。
CovarSamp(Column, Column)	2 つの列のサンプル共分散を返します。
CovarSamp(String, String)	2 つの列のサンプル共分散を返します。
Crc32(Column)	バイナリ列の循環冗長チェック値 (CRC32) を計算し、その値を bigint として返します。
CumeDist()	Window 関数: ウィンドウパーティション内の値の累積分布 (つまり、現在の行の下にある行の割合) を返します。
CurrentDate()	現在の日付を日付列として返します。
CurrentRow()	Window 関数: ウィンドウパーティションの現在の行を表す特別なフレーム境界を返します。
CurrentTimestamp()	現在のタイムスタンプをタイムスタンプ列として返します。
DateAdd(Column, Column)	の後`start`の日数を`days`返します。
DateAdd(Column, Int32)	の後`start`の日数を`days`返します。
DateDiff(Column, Column)	`start` から `end` までの日数を返します。
DateFormat(Column, String)	日付/タイムスタンプ/文字列を、2 番目の引数で指定された日付形式で指定された形式の文字列の値に変換します。
DateSub(Column, Column)	より前`start`の日を`days`返します。
DateSub(Column, Int32)	より前`start`の日を`days`返します。
DateTrunc(String, Column)	形式で指定された単位に切り捨てられたタイムスタンプを返します。
DayOfMonth(Column)	指定した日付/タイムスタンプ/文字列から月の日を整数として抽出します。
DayOfWeek(Column)	指定した日付/タイムスタンプ/文字列から曜日を整数として抽出します。
DayOfYear(Column)	指定した日付/タイムスタンプ/文字列から年の日を整数として抽出します。
Days(Column)	データを日に分割するためのタイムスタンプと日付の変換。
Decode(Column, String)	指定された文字セット ('US-ASCII'、'ISO-8859-1'、'UTF-8'、'UTF-16BE'、'UTF-16LE'、'UTF-16') を使用して、バイナリから文字列に最初の引数を計算します。
Degrees(Column)	ラジアン単位で測定された角度を、度単位で測定されたほぼ等価の角度に変換します。
Degrees(String)	ラジアン単位で測定された角度を、度単位で測定されたほぼ等価の角度に変換します。
DenseRank()	Window 関数: ギャップなしで、ウィンドウパーティション内の行のランクを返します。
Desc(String)	列の降順に基づいて並べ替え式を返します。
DescNullsFirst(String)	列の降順に基づいて並べ替え式を返し、null 以外の値の前に null 値を返します。
DescNullsLast(String)	列の降順に基づいて並べ替え式を返し、null 以外の値の後に null 値が表示されます。
ElementAt(Column, Object)	column が array の場合は、内の指定されたインデックス位置にある配列の `value` 要素を返します。 column が map の場合、で指定されたキーの `value` 値を返します。
Encode(Column, String)	指定された文字セット ('US-ASCII'、'ISO-8859-1'、'UTF-8'、'UTF-16BE'、'UTF-16LE'、'UTF-16') を使用して、文字列からバイナリに最初の引数を計算します。
Exp(Column)	指定された値の指数を計算します。
Exp(String)	指定された値の指数を計算します。
Explode(Column)	指定された配列またはマップ列の各要素に対して新しい行を作成します。
ExplodeOuter(Column)	指定された配列またはマップ列の各要素に対して新しい行を作成します。 Explode() とは異なり、配列/マップが null または空の場合、null が生成されます。
Expm1(Column)	指定された値から 1 を引いた指数を計算します。
Expm1(String)	指定された値から 1 を引いた指数を計算します。
Expr(String)	式文字列を、それが表す列に解析します。
Factorial(Column)	指定された値の階乗を計算します。
First(Column, Boolean)	グループ内の列の最初の値を返します。
First(String, Boolean)	グループ内の列の最初の値を返します。
Flatten(Column)	配列の配列から 1 つの配列を作成します。入れ子になった配列の構造が 2 つのレベルより深い場合、入れ子のレベルは 1 つだけ削除されます。
Floor(Column)	指定された値のフロアを計算します。
Floor(String)	指定された値のフロアを計算します。
FormatNumber(Column, Int32)	指定した数値 `column` の書式を、"#,###,#.##" のような形式に設定し、指定した `d` 小数点以下の桁数に丸めて、HALF_EVEN丸めモードで丸め、結果を文字列列として返します。
FormatString(String, Column[])	引数を printf スタイルで書式設定し、結果を文字列列として返します。
FromCsv(Column, Column, Dictionary<String,String>)	CSV 文字列 `StructType` を含む列を、指定したスキーマを持つに解析します。
FromCsv(Column, StructType, Dictionary<String,String>)	CSV 文字列 `StructType` を含む列を、指定したスキーマを持つに解析します。
FromJson(Column, Column, Dictionary<String,String>)	JSON 文字列を含む列を、指定したスキーマの `StructType`または `ArrayType` に`StructType`解析します。
FromJson(Column, String, Dictionary<String,String>)	JSON 文字列を含む列を、指定したスキーマの `StructType`または `ArrayType` に`StructType`解析します。
FromUnixTime(Column)	UNIX エポック (1970-01-01 00:00:00 UTC) の秒数を、既定の形式 "yyyy-MM-dd HH:mm:ss" の現在のシステムタイムゾーンのその時点のタイムスタンプを表す文字列に変換します。
FromUnixTime(Column, String)	UNIX エポック (1970-01-01 00:00:00 UTC) の秒数を、指定された形式の現在のシステムタイムゾーンでその時点のタイムスタンプを表す文字列に変換します。
FromUtcTimestamp(Column, Column)	'2017-07-14 02:40:00.0' のようなタイムスタンプを指定すると、それを UTC の時刻として解釈し、その時刻を特定のタイムゾーンのタイムスタンプとしてレンダリングします。たとえば、'GMT+1' では '2017-07-14 03:40:00.0' が生成されます。
FromUtcTimestamp(Column, String)	'2017-07-14 02:40:00.0' のようなタイムスタンプを指定すると、それを UTC の時刻として解釈し、その時刻を特定のタイムゾーンのタイムスタンプとしてレンダリングします。たとえば、'GMT+1' では '2017-07-14 03:40:00.0' が生成されます。
GetJsonObject(Column, String)	指定されたパスに基づいて JSON 文字列から JSON オブジェクトを抽出し、抽出された JSON オブジェクトの JSON 文字列を返します。
Greatest(Column[])	null 値をスキップして、値の一覧の最大値を返します。
Greatest(String, String[])	列名の一覧の最大値を返し、null 値はスキップします。
Grouping(Column)	GROUP BY リスト内の指定された列を集計するかどうかを示します。集計の場合は 1、結果セットで集計されていない場合は 0 を返します。
Grouping(String)	GROUP BY リスト内の指定された列を集計するかどうかを示します。集計の場合は 1、結果セットで集計されていない場合は 0 を返します。
GroupingId(Column[])	グループ内の個別の項目の数を返します。
GroupingId(String, String[])	グループ内の個別の項目の数を返します。
Hash(Column[])	指定された列のハッシュコードを計算し、結果を int 列として返します。
Hex(Column)	指定された列の 16 進値を計算します。
Hour(Column)	指定した日付/タイムスタンプ/文字列から時間を整数として抽出します。
Hours(Column)	データを時間にパーティション分割するためのタイムスタンプの変換。
Hypot(Column, Column)	`sqrt(a^2^ + b^2^)`中間オーバーフローまたはアンダーフローのないコンピューティング。
Hypot(Column, Double)	`sqrt(a^2^ + b^2^)`中間オーバーフローまたはアンダーフローのないコンピューティング。
Hypot(Column, String)	`sqrt(a^2^ + b^2^)`中間オーバーフローまたはアンダーフローのないコンピューティング。
Hypot(Double, Column)	`sqrt(a^2^ + b^2^)`中間オーバーフローまたはアンダーフローのないコンピューティング。
Hypot(Double, String)	`sqrt(a^2^ + b^2^)`中間オーバーフローまたはアンダーフローのないコンピューティング。
Hypot(String, Column)	`sqrt(a^2^ + b^2^)`中間オーバーフローまたはアンダーフローのないコンピューティング。
Hypot(String, Double)	`sqrt(a^2^ + b^2^)`中間オーバーフローまたはアンダーフローのないコンピューティング。
Hypot(String, String)	`sqrt(a^2^ + b^2^)`中間オーバーフローまたはアンダーフローのないコンピューティング。
InitCap(Column)	各単語の最初の文字を大文字に変換して、新しい文字列列を返します。単語は空白で区切られます。
InputFileName()	現在の Spark タスクのファイル名の文字列列を作成します。
Instr(Column, String)	指定した部分文字列の最初の出現位置を見つけます。
IsNaN(Column)	列が NaN の場合は true を返します。
IsNull(Column)	列が null の場合は true を返します。
JsonTuple(Column, String[])	指定されたフィールド名に従って、JSON 列の新しい行を作成します。
Kurtosis(Column)	グループ内の値の尖度を返します。
Kurtosis(String)	グループ内の値の尖度を返します。
Lag(Column, Int32, Object)	Window 関数: 現在の行の前の 'offset' 行の値を返し、現在の行の前に 'offset' 行が存在しない場合は null を返します。たとえば、1 の 'offset' は、ウィンドウパーティション内の特定のポイントで前の行を返します。
Lag(String, Int32, Object)	Window 関数: 現在の行の前の 'offset' 行の値を返し、現在の行の前に 'offset' 行が存在しない場合は null を返します。たとえば、1 の 'offset' は、ウィンドウパーティション内の特定のポイントで前の行を返します。
Last(Column, Boolean)	グループ内の列の最後の値を返します。
Last(String, Boolean)	グループ内の列の最後の値を返します。
LastDay(Column)	指定した日付が属する月の最終日を返します。
Lead(Column, Int32, Object)	Window 関数: 現在の行の後の 'offset' 行の値を返し、現在の行の後に 'offset' 行より小さい場合は null を返します。たとえば、1 の 'offset' は、ウィンドウパーティション内の任意のポイントで次の行を返します。
Lead(String, Int32, Object)	Window 関数: 現在の行の後の 'offset' 行の値を返し、現在の行の後に 'offset' 行より小さい場合は null を返します。たとえば、1 の 'offset' は、ウィンドウパーティション内の任意のポイントで次の行を返します。
Least(Column[])	null 値をスキップして、値のリストの最小値を返します。
Least(String, String[])	null 値をスキップして、値のリストの最小値を返します。
Length(Column)	指定された文字列の文字長またはバイナリ文字列のバイト数を計算します。
Levenshtein(Column, Column)	指定された 2 つの文字列列の Levenshtein 距離を計算します。
Lit(Object)	リテラル値の列を作成します。
Locate(String, Column)	指定した部分文字列の最初の出現位置を見つけます。
Locate(String, Column, Int32)	指定した位置オフセットから始まる、指定された部分文字列の最初の出現位置を見つけます。
Log(Column)	指定された値の自然対数を計算します。
Log(Double, Column)	2 番目の引数の最初の引数と底の対数を計算します。
Log(Double, String)	2 番目の引数の最初の引数と底の対数を計算します。
Log(String)	指定された値の自然対数を計算します。
Log10(Column)	指定した値の対数を底 10 で計算します。
Log10(String)	指定した値の対数を底 10 で計算します。
Log1p(Column)	指定された値に 1 を加えた自然対数を計算します。
Log1p(String)	指定された値に 1 を加えた自然対数を計算します。
Log2(Column)	底 2 の指定された列の対数を計算します。
Log2(String)	底 2 の指定された列の対数を計算します。
Lower(Column)	文字列列を小文字に変換します。
Lpad(Column, Int32, String)	文字列列を左に埋め込み、指定した長さに埋め込みます `len`。文字列列がより `len`長い場合、戻り値は文字に `len` 短縮されます。
Ltrim(Column)	指定した文字列列の左端からスペースをトリミングします。
Ltrim(Column, String)	指定した文字列列の左端から指定した文字列をトリミングします。
Map(Column[])	新しいマップ列を作成します。
MapConcat(Column[])	指定されたすべてのマップの和集合を返します。
MapEntries(Column)	指定されたマップ内のすべてのエントリの順序なしの配列を返します。
MapFromArrays(Column, Column)	新しいマップ列を作成します。キーには、最初の列の配列が使用されます。 2 番目の列の配列が値に使用されます。 key の配列内のすべての要素を null にすることはできません。
MapFromEntries(Column)	指定されたエントリの配列から作成されたマップを返します。
MapKeys(Column)	マップのキーを含む順序なしの配列を返します。
MapValues(Column)	マップの値を含む順序なしの配列を返します。
Max(Column)	グループ内の列の最大値を返します。
Max(String)	グループ内の列の最大値を返します。
Md5(Column)	バイナリ列の MD5 ダイジェストを計算し、32 文字の 16 進文字列として値を返します。
Mean(Column)	グループ内の列の平均値を返します。
Mean(String)	グループ内の列の平均値を返します。
Min(Column)	グループ内の列の最小値を返します。
Min(String)	グループ内の列の最小値を返します。
Minute(Column)	指定した日付/タイムスタンプ/文字列から分を整数として抽出します。
MonotonicallyIncreasingId()	単調に増加する 64 ビット整数を生成する列式。
Month(Column)	指定した日付/タイムスタンプ/文字列から月を整数として抽出します。
Months(Column)	データを月に分割するためのタイムスタンプと日付の変換。
MonthsBetween(Column, Column)	日付 `end` との間の月数を `stasrt`返します。
MonthsBetween(Column, Column, Boolean)	日付 `end` との間の月数を `start`返します。が true に設定されている場合 `roundOff` 、結果は 8 桁に丸められます。それ以外の場合は丸めされません。
NaNvl(Column, Column)	NaN でない場合は col1 を返し、col1 が NaN の場合は col2 を返します。
Negate(Column)	単項マイナス、つまり式を否定します。
NextDay(Column, String)	日付列を指定すると、指定した曜日の日付列の値より後の最初の日付が返されます。
Not(Column)	ブール式の反転、つまり NOT。
Ntile(Int32)	Window 関数: 順序付けられたウィンドウパーティション内の ntile グループ ID (1 から 1 を `n` 含む) を返します。たとえば、が 4 の場合 `n` 、行の最初の四半期は値 1、第 2 四半期は 2、第 3 四半期は 3、最後の四半期は 4 になります。
Overlay(Column, Column, Column)	のバイト位置`possrc`から開始して、の`src`指定した部分をに`replace`オーバーレイします。
Overlay(Column, Column, Column, Column)	の指定した部分`src`をで`replace`オーバーレイし、の`src`バイト位置`pos`から開始し、バイトに進`len`みます。
PercentRank()	Window 関数: ウィンドウパーティション内の行の相対ランク (パーセンタイル) を返します。
Pmod(Column, Column)	除数 mod 除数の正の値を返します。
PosExplode(Column)	指定された配列またはマップ列の位置を持つ各要素の新しい行を作成します。
PosExplodeOuter(Column)	指定された配列またはマップ列の位置を持つ各要素の新しい行を作成します。 Posexplode() とは異なり、配列/マップが null または空の場合、row(null, null) が生成されます。
Pow(Column, Column)	2 番目の引数の累乗に対して発生した最初の引数の値を返します。
Pow(Column, Double)	2 番目の引数の累乗に対して発生した最初の引数の値を返します。
Pow(Column, String)	2 番目の引数の累乗に対して発生した最初の引数の値を返します。
Pow(Double, Column)	2 番目の引数の累乗に対して発生した最初の引数の値を返します。
Pow(Double, String)	2 番目の引数の累乗に対して発生した最初の引数の値を返します。
Pow(String, Column)	2 番目の引数の累乗に対して発生した最初の引数の値を返します。
Pow(String, Double)	2 番目の引数の累乗に対して発生した最初の引数の値を返します。
Pow(String, String)	2 番目の引数の累乗に対して発生した最初の引数の値を返します。
Quarter(Column)	指定した日付/タイムスタンプ/文字列から四半期を整数として抽出します。
Radians(Column)	度単位の角度をラジアンで測定したほぼ等価の角度に変換します。
Radians(String)	度単位の角度をラジアンで測定したほぼ等価の角度に変換します。
Rand()	U[0.0, 1.0] から独立した同一分布 (つまり、) サンプルを含むランダム列を生成します。
Rand(Int64)	U[0.0, 1.0] から独立した同一分布 (つまり、) サンプルを含むランダム列を生成します。
Randn()	標準正規分布から、独立した同一分布 (i.i.d.) サンプルを含むランダム列を生成します。
Randn(Int64)	標準正規分布から、独立した同一分布 (i.i.d.) サンプルを含むランダム列を生成します。
Rank()	Window 関数: ウィンドウパーティション内の行のランクを返します。
RegexpExtract(Column, String, Int32)	指定した文字列列から、Java 正規表現に一致する特定のグループを抽出します。
RegexpReplace(Column, Column, Column)	パターンに一致する指定した文字列値のすべての部分文字列を、指定された置換文字列に置き換えます。
RegexpReplace(Column, String, String)	パターンに一致する指定した文字列値のすべての部分文字列を、指定された置換文字列に置き換えます。
Repeat(Column, Int32)	文字列列 `n` を繰り返し、新しい文字列列として返します。
Reverse(Column)	文字列列を反転し、新しい文字列列として返します。
Rint(Column)	引数に最も近く、数学整数と等しい double 値を返します。
Rint(String)	引数に最も近く、数学整数と等しい double 値を返します。
Round(Column)	丸めモードで小数点以下 0 桁に丸められたの値 `column` HALF_UP返します。
Round(Column, Int32)	丸めモードで小数点以下に `column` 丸められた `scale` の値HALF_UP返します。
RowNumber()	Window 関数: ウィンドウパーティション内の 1 から始まる連続する数値を返します。
Rpad(Column, Int32, String)	文字列列を右に埋め込み、指定した長さに埋め込みます `len`。文字列列がより `len`長い場合、戻り値は文字に `len` 短縮されます。
Rtrim(Column)	指定した文字列値の右端からスペースをトリミングします。
Rtrim(Column, String)	指定した文字列列の右端から指定した文字列をトリミングします。
SchemaOfCsv(Column)	CSV 文字列を解析し、そのスキーマを DDL 形式で推論します。
SchemaOfCsv(Column, Dictionary<String,String>)	CSV 文字列を解析し、そのスキーマを DDL 形式で推論します。
SchemaOfCsv(String)	CSV 文字列を解析し、そのスキーマを DDL 形式で推論します。
SchemaOfJson(Column)	JSON 文字列を解析し、そのスキーマを DDL 形式で推論します。
SchemaOfJson(Column, Dictionary<String,String>)	JSON 文字列を解析し、そのスキーマを DDL 形式で推論します。
SchemaOfJson(String)	JSON 文字列を解析し、そのスキーマを DDL 形式で推論します。
Second(Column)	指定した日付/タイムスタンプ/文字列から秒を整数として抽出します。
Sequence(Column, Column)	start が stop 以下の場合は 1 ずつインクリメントされ、それ以外の場合は -1 の整数のシーケンスを生成します。
Sequence(Column, Column, Column)	から `start` までの `stop`一連の整数を生成し、で `step`インクリメントします。
Sha1(Column)	バイナリ列の SHA-1 ダイジェストを計算し、40 文字の 16 進文字列として値を返します。
Sha2(Column, Int32)	バイナリ列の SHA-2 ファミリのハッシュ関数を計算し、値を 16 進文字列として返します。
ShiftLeft(Column, Int32)	指定した値 `numBits` を左にシフトします。
ShiftRight(Column, Int32)	(符号付き) 指定された値 `numBits` を右にシフトします。
ShiftRightUnsigned(Column, Int32)	符号なしでは、指定された値 `numBits` を右にシフトします。
Shuffle(Column)	指定された配列のランダムな順列を返します。
Signum(Column)	指定された値の符号を計算します。
Signum(String)	指定された値の符号を計算します。
Sin(Column)	によって計算されるかのように、角度のサインを `java.lang.Math.sin`計算します。
Sin(String)	によって計算されるかのように、角度のサインを `java.lang.Math.sin`計算します。
Sinh(Column)	によって計算されるかのように、角度の双曲線サインを `java.lang.Math.sin`計算します。
Sinh(String)	によって計算されるかのように、角度の双曲線サインを `java.lang.Math.sin`計算します。
Size(Column)	配列またはマップの長さを返します。
Skewness(Column)	グループ内の値の歪度を返します。
Skewness(String)	グループ内の値の歪度を返します。
Slice(Column, Int32, Int32)	指定した `length`を使用して、内のすべての要素`column`を含む配列をインデックス`start`から返します (または、が負の場合`start`は末尾から始まります)。
SortArray(Column, Boolean)	指定された列の入力配列を、配列要素の自然な順序である昇順 (既定値) または降順で並べ替えます。
Soundex(Column)	指定した式の soundex コードを返します。
SparkPartitionId()	パーティション ID。
Split(Column, String)	文字列を正規表現パターンで分割します。
Split(Column, String, Int32)	指定されたパターンの一致を囲む str を分割します。
Sqrt(Column)	指定した float 値の平方根を計算します。
Sqrt(String)	指定した float 値の平方根を計算します。
Stddev(Column)	StddevSamp() のエイリアス。
Stddev(String)	StddevSamp() のエイリアス。
StddevPop(Column)	グループ内の式の母集団標準偏差を返します。
StddevPop(String)	グループ内の式の母集団標準偏差を返します。
StddevSamp(Column)	グループ内の式の標本標準偏差を返します。
StddevSamp(String)	グループ内の式の標本標準偏差を返します。
Struct(Column[])	複数の入力列を構成する新しい構造体列を作成します。
Struct(String, String[])	複数の入力列を構成する新しい構造体列を作成します。
Substring(Column, Int32, Int32)	指定した長さの指定した位置から始まる部分文字列 (またはバイト配列のスライス) を返します。
SubstringIndex(Column, String, Int32)	指定された区切り記号が出現する前に `count` 、指定された文字列から部分文字列を返します。
Sum(Column)	式内のすべての値の合計を返します。
Sum(String)	式内のすべての値の合計を返します。
SumDistinct(Column)	式内の個別の値の合計を返します。
SumDistinct(String)	式内の個別の値の合計を返します。
Tan(Column)	によって計算されるかのように、指定された値のタンジェントを `java.lang.Math.tan`計算します。
Tan(String)	によって計算されるかのように、指定された値のタンジェントを `java.lang.Math.tan`計算します。
Tanh(Column)	によって計算されるかのように、指定された値の双曲線正接を `java.lang.Math.tanh`計算します。
Tanh(String)	によって計算されるかのように、指定された値の双曲線正接を `java.lang.Math.tanh`計算します。
ToCsv(Column)	を含む列を `StructType` 、指定したスキーマを持つ CSV 文字列に変換します。
ToCsv(Column, Dictionary<String,String>)	を含む列を `StructType` 、指定したスキーマを持つ CSV 文字列に変換します。
ToDate(Column)	規則をにキャストして、列をに`DateTypeDateType`変換します。
ToDate(Column, String)	指定した形式のに `DateType` 列を変換します。
ToJson(Column, Dictionary<String,String>)	s、または `MapTypeArrayType` の `StructType`を含む `ArrayTypeStructType`列を `MapType` JSON 文字列に変換します。
ToTimestamp(Column)	ルールをにキャストして、時刻文字列を Unix タイムスタンプ (秒単位) に `TimestampType`変換します。
ToTimestamp(Column, String)	時刻文字列を、指定した形式の Unix タイムスタンプ (秒単位) に変換します。
ToUtcTimestamp(Column, Column)	'2017-07-14 02:40:00.0' のようなタイムスタンプを指定すると、指定されたタイムゾーンの時刻として解釈され、その時刻が UTC のタイムスタンプとしてレンダリングされます。たとえば、'GMT+1' では '2017-07-14 01:40:00.0' が生成されます。
ToUtcTimestamp(Column, String)	'2017-07-14 02:40:00.0' のようなタイムスタンプを指定すると、指定されたタイムゾーンの時刻として解釈され、その時刻が UTC のタイムスタンプとしてレンダリングされます。たとえば、'GMT+1' では '2017-07-14 01:40:00.0' が生成されます。
Translate(Column, String, String)	指定されたによって、列内の指定 `matchingString` されたと一致するすべての文字を翻訳します `replaceString`。
Trim(Column)	指定した文字列列の両端からスペースをトリミングします。
Trim(Column, String)	指定した文字列列の両端から指定した文字をトリミングします。
Trunc(Column, String)	形式で指定された単位に切り捨てられた日付を返します。
Udf(Func<Row>, StructType)	指定したデリゲートから UDF を作成します。
Udf<A1,RT>(Func<A1,RT>)	指定したデリゲートから UDF を作成します。
Udf<T>(Func<T,Row>, StructType)	指定したデリゲートから UDF を作成します。
Udf<T1,T2,T3,T4,T5,T6,T7,T8,T9,T10,TResult>(Func<T1,T2,T3,T4,T5,T6,T7,T8,T9,T10,TResult>)	指定したデリゲートから UDF を作成します。
Udf<T1,T2,T3,T4,T5,T6,T7,T8,T9,T10>(Func<T1,T2,T3,T4,T5,T6,T7,T8,T9,T10,Row>, StructType)	指定したデリゲートから UDF を作成します。
Udf<T1,T2,T3,T4,T5,T6,T7,T8,T9,TResult>(Func<T1,T2,T3,T4,T5,T6,T7,T8,T9,TResult>)	指定したデリゲートから UDF を作成します。
Udf<T1,T2,T3,T4,T5,T6,T7,T8,T9>(Func<T1,T2,T3,T4,T5,T6,T7,T8,T9,Row>, StructType)	指定したデリゲートから UDF を作成します。
Udf<T1,T2,T3,T4,T5,T6,T7,T8,TResult>(Func<T1,T2,T3,T4,T5,T6,T7,T8,TResult>)	指定したデリゲートから UDF を作成します。
Udf<T1,T2,T3,T4,T5,T6,T7,T8>(Func<T1,T2,T3,T4,T5,T6,T7,T8,Row>, StructType)	指定したデリゲートから UDF を作成します。
Udf<T1,T2,T3,T4,T5,T6,T7,TResult>(Func<T1,T2,T3,T4,T5,T6,T7,TResult>)	指定したデリゲートから UDF を作成します。
Udf<T1,T2,T3,T4,T5,T6,T7>(Func<T1,T2,T3,T4,T5,T6,T7,Row>, StructType)	指定したデリゲートから UDF を作成します。
Udf<T1,T2,T3,T4,T5,T6,TResult>(Func<T1,T2,T3,T4,T5,T6,TResult>)	指定したデリゲートから UDF を作成します。
Udf<T1,T2,T3,T4,T5,T6>(Func<T1,T2,T3,T4,T5,T6,Row>, StructType)	指定したデリゲートから UDF を作成します。
Udf<T1,T2,T3,T4,T5,TResult>(Func<T1,T2,T3,T4,T5,TResult>)	指定したデリゲートから UDF を作成します。
Udf<T1,T2,T3,T4,T5>(Func<T1,T2,T3,T4,T5,Row>, StructType)	指定したデリゲートから UDF を作成します。
Udf<T1,T2,T3,T4,TResult>(Func<T1,T2,T3,T4,TResult>)	指定したデリゲートから UDF を作成します。
Udf<T1,T2,T3,T4>(Func<T1,T2,T3,T4,Row>, StructType)	指定したデリゲートから UDF を作成します。
Udf<T1,T2,T3,TResult>(Func<T1,T2,T3,TResult>)	指定したデリゲートから UDF を作成します。
Udf<T1,T2,T3>(Func<T1,T2,T3,Row>, StructType)	指定したデリゲートから UDF を作成します。
Udf<T1,T2,TResult>(Func<T1,T2,TResult>)	指定したデリゲートから UDF を作成します。
Udf<T1,T2>(Func<T1,T2,Row>, StructType)	指定したデリゲートから UDF を作成します。
Udf<TResult>(Func<TResult>)	指定したデリゲートから UDF を作成します。
Unbase64(Column)	BASE64 でエンコードされた文字列列をデコードし、バイナリ列として返します。
UnboundedFollowing()	Window 関数: ウィンドウパーティションの最後の行を表す特殊なフレーム境界を返します。
UnboundedPreceding()	Window 関数: ウィンドウパーティションの最初の行を表す特殊なフレーム境界を返します。
Unhex(Column)	16 進数の逆関数。各文字のペアを 16 進数として解釈し、数値のバイト表現に変換します。
UnixTimestamp()	現在の Unix タイムスタンプ (秒単位) を返します。
UnixTimestamp(Column)	既定のタイムゾーンと既定のロケールを使用して、時刻文字列を yyyy-MM-dd HH:mm:ss 形式で Unix タイムスタンプ (秒単位) に変換します。
UnixTimestamp(Column, String)	指定された形式の時刻文字列を Unix タイムスタンプ (秒単位) に変換します。
Upper(Column)	文字列列を大文字に変換します。
Variance(Column)	VarSamp() のエイリアス。
Variance(String)	VarSamp() のエイリアス。
VarPop(Column)	グループ内の値の母集団の分散を返します。
VarPop(String)	グループ内の値の母集団の分散を返します。
VarSamp(Column)	グループ内の値の偏りのない分散を返します。
VarSamp(String)	グループ内の値の偏りのない分散を返します。
WeekOfYear(Column)	特定の日付/タイムスタンプ/文字列から週番号を整数として抽出します。
When(Column, Object)	条件を評価し、考えられる複数の結果式のいずれかを返します。それ以外の場合は、一致しない条件に対して null が返されます。
Window(Column, String)	列を指定するタイムスタンプを指定してタンブリングタイムウィンドウを生成します。
Window(Column, String, String)	タイムスタンプ列を指定して、行を 1 つ以上の時間枠にバケット化します。
Window(Column, String, String, String)	タイムスタンプ列を指定して、行を 1 つ以上の時間枠にバケット化します。
XXHash64(Column[])	xxHash アルゴリズムの 64 ビットバリアントを使用して、特定の列のハッシュコードを計算し、結果を長い列として返します。
Year(Column)	指定した日付/タイムスタンプ/文字列から年を整数として抽出します。
Years(Column)	データを年に分割するためのタイムスタンプと日付の変換。

適用対象

次の方法で共有

Functions クラス

定義

メソッド

適用対象

フィードバック

その他のリソース