Functions クラス
定義
重要
一部の情報は、リリース前に大きく変更される可能性があるプレリリースされた製品に関するものです。 Microsoft は、ここに記載されている情報について、明示または黙示を問わず、一切保証しません。
DataFrame 操作で使用できる関数。
public static class Functions
type Functions = class
Public Class Functions
- 継承
-
Functions
メソッド
Abs(Column) |
絶対値を計算します。 |
Acos(Column) |
によって計算される |
Acos(String) |
によって計算される |
AddMonths(Column, Column) |
|
AddMonths(Column, Int32) |
|
ApproxCountDistinct(Column) |
グループ内の個別の項目のおおよその数を返します。 |
ApproxCountDistinct(Column, Double) |
グループ内の個別の項目のおおよその数を返します。 |
ApproxCountDistinct(String) |
グループ内の個別の項目のおおよその数を返します。 |
ApproxCountDistinct(String, Double) |
グループ内の個別の項目のおおよその数を返します。 |
Array(Column[]) |
新しい配列列を作成します。 入力列はすべて同じデータ型である必要があります。 |
Array(String, String[]) |
新しい配列列を作成します。 入力列はすべて同じデータ型である必要があります。 |
ArrayContains(Column, Object) |
配列が null の場合は null、配列に が含まれている場合は true、それ以外の |
ArrayDistinct(Column) |
配列から重複する値を削除します。 |
ArrayExcept(Column, Column) |
内の要素 |
ArrayIntersect(Column, Column) |
指定された 2 つの配列の交差部分にある要素の配列を、重複せずに返します。 |
ArrayJoin(Column, String) |
を使用して の |
ArrayJoin(Column, String, String) |
を使用して の |
ArrayMax(Column) |
配列内の最大値を返します。 |
ArrayMin(Column) |
配列の最小値を返します。 |
ArrayPosition(Column, Object) |
指定された配列内の値が最初に出現する位置を、長い間検索します。 いずれかの引数が null の場合は null を返します。 |
ArrayRemove(Column, Object) |
指定された配列から element と等しいすべての要素を削除します。 |
ArrayRepeat(Column, Column) |
引数によって指定された回数繰り返される引数を含む |
ArrayRepeat(Column, Int32) |
引数が繰り返される回数を |
ArraySort(Column) |
入力配列を昇順で並べ替えます。 入力配列の要素は並べ替え可能である必要があります。 null 要素は、返される配列の末尾に配置されます。 |
ArraysOverlap(Column, Column) |
共通の null 以外の要素が 1 つ以上ある場合 |
ArraysZip(Column[]) |
N 番目の構造体に入力配列のすべての N 番目の値が含まれている構造体のマージされた配列を返します。 |
ArrayUnion(Column, Column) |
指定された 2 つの配列の和集合内の要素の配列を、重複せずに返します。 |
Asc(String) |
列の昇順に基づいて並べ替え式を返します。 |
Ascii(Column) |
文字列列の最初の文字の数値を計算し、結果を int 列として返します。 |
AscNullsFirst(String) |
列の昇順に基づいて並べ替え式を返し、null 以外の値の前に null 値を返します。 |
AscNullsLast(String) |
列の昇順に基づいて並べ替え式を返し、null 以外の値の後に null 値が表示されます。 |
Asin(Column) |
によって計算される |
Asin(String) |
によって計算される |
Atan(Column) |
によって計算される |
Atan(String) |
によって計算される |
Atan2(Column, Column) |
指定 |
Atan2(Column, Double) |
指定 |
Atan2(Column, String) |
指定 |
Atan2(Double, Column) |
指定 |
Atan2(Double, String) |
指定 |
Atan2(String, Column) |
指定 |
Atan2(String, Double) |
指定 |
Atan2(String, String) |
指定 |
Avg(Column) |
グループ内の値の平均を返します。 |
Avg(String) |
グループ内の値の平均を返します。 |
Base64(Column) |
バイナリ列の BASE64 エンコードを計算し、文字列列として返します。 |
Bin(Column) |
指定された long 列のバイナリ値の文字列表現を返す式。 たとえば、bin("12") は "1100" を返します。 |
Bin(String) |
指定された long 列のバイナリ値の文字列表現を返す式。 たとえば、bin("12") は "1100" を返します。 |
BitwiseNOT(Column) |
ビットごとの NOT を計算します。 |
Broadcast(DataFrame) |
DataFrame をブロードキャスト結合で使用するのに十分な小さいものとしてマークします。 |
Bround(Column) |
丸めモードで小数点以下 0 桁に丸められた の値 |
Bround(Column, Int32) |
丸めモードで小数点以下に丸められた |
Bucket(Column, Column) |
入力列のハッシュによってパーティション分割される任意の型の変換。 |
Bucket(Int32, Column) |
入力列のハッシュによってパーティション分割される任意の型の変換。 |
CallUDF(String, Column[]) |
SparkSession.Udf() を介して登録されたユーザー定義関数を呼び出します。Register()。 |
Cbrt(Column) |
指定された列のキューブ ルートを計算します。 |
Cbrt(String) |
指定された列のキューブ ルートを計算します。 |
Ceil(Column) |
指定された値の上限を計算します。 |
Ceil(String) |
指定された値の上限を計算します。 |
Coalesce(Column[]) |
null ではない最初の列を返します。すべての入力が null の場合は null を返します。 |
Col(String) |
指定した列名に基づいて Column を返します。 Column() のエイリアス。 |
CollectList(Column) |
重複するオブジェクトの一覧を返します。 |
CollectList(String) |
重複するオブジェクトの一覧を返します。 |
CollectSet(Column) |
重複する要素が削除されたオブジェクトのセットを返します。 |
CollectSet(String) |
重複する要素が削除されたオブジェクトのセットを返します。 |
Column(String) |
指定した列名に基づいて Column を返します。 |
Concat(Column[]) |
複数の入力列を 1 つの列に連結します。 |
ConcatWs(String, Column[]) |
指定された区切り記号を使用して、複数の入力文字列列を 1 つの文字列列に連結します。 |
Conv(Column, Int32, Int32) |
文字列列の数値をベース間で変換します。 |
Corr(Column, Column) |
2 つの列のピアソン相関係数を返します。 |
Corr(String, String) |
2 つの列のピアソン相関係数を返します。 |
Cos(Column) |
によって計算されるかのように、角度のコサインを計算します |
Cos(String) |
によって計算されるかのように、角度のコサインを計算します |
Cosh(Column) |
によって計算されるかのように、角度の双曲線余弦を計算します |
Cosh(String) |
によって計算されるかのように、角度の双曲線余弦を計算します |
Count(Column) |
グループ内のアイテムの数を返します。 |
Count(String) |
グループ内のアイテムの数を返します。 |
CountDistinct(Column, Column[]) |
グループ内の個別の項目の数を返します。 |
CountDistinct(String, String[]) |
グループ内の個別の項目の数を返します。 |
CovarPop(Column, Column) |
2 つの列の母集団共分散を返します。 |
CovarPop(String, String) |
2 つの列の母集団共分散を返します。 |
CovarSamp(Column, Column) |
2 つの列のサンプル共分散を返します。 |
CovarSamp(String, String) |
2 つの列のサンプル共分散を返します。 |
Crc32(Column) |
バイナリ列の循環冗長チェック値 (CRC32) を計算し、その値を bigint として返します。 |
CumeDist() |
Window 関数: ウィンドウ パーティション内の値の累積分布 (つまり、現在の行の下にある行の割合) を返します。 |
CurrentDate() |
現在の日付を日付列として返します。 |
CurrentRow() |
Window 関数: ウィンドウ パーティションの現在の行を表す特別なフレーム境界を返します。 |
CurrentTimestamp() |
現在のタイムスタンプをタイムスタンプ列として返します。 |
DateAdd(Column, Column) |
の後 |
DateAdd(Column, Int32) |
の後 |
DateDiff(Column, Column) |
|
DateFormat(Column, String) |
日付/タイムスタンプ/文字列を、2 番目の引数で指定された日付形式で指定された形式の文字列の値に変換します。 |
DateSub(Column, Column) |
より前 |
DateSub(Column, Int32) |
より前 |
DateTrunc(String, Column) |
形式で指定された単位に切り捨てられたタイムスタンプを返します。 |
DayOfMonth(Column) |
指定した日付/タイムスタンプ/文字列から月の日を整数として抽出します。 |
DayOfWeek(Column) |
指定した日付/タイムスタンプ/文字列から曜日を整数として抽出します。 |
DayOfYear(Column) |
指定した日付/タイムスタンプ/文字列から年の日を整数として抽出します。 |
Days(Column) |
データを日に分割するためのタイムスタンプと日付の変換。 |
Decode(Column, String) |
指定された文字セット ('US-ASCII'、'ISO-8859-1'、'UTF-8'、'UTF-16BE'、'UTF-16LE'、'UTF-16') を使用して、バイナリから文字列に最初の引数を計算します。 |
Degrees(Column) |
ラジアン単位で測定された角度を、度単位で測定されたほぼ等価の角度に変換します。 |
Degrees(String) |
ラジアン単位で測定された角度を、度単位で測定されたほぼ等価の角度に変換します。 |
DenseRank() |
Window 関数: ギャップなしで、ウィンドウ パーティション内の行のランクを返します。 |
Desc(String) |
列の降順に基づいて並べ替え式を返します。 |
DescNullsFirst(String) |
列の降順に基づいて並べ替え式を返し、null 以外の値の前に null 値を返します。 |
DescNullsLast(String) |
列の降順に基づいて並べ替え式を返し、null 以外の値の後に null 値が表示されます。 |
ElementAt(Column, Object) |
column が array の場合は、 内の指定されたインデックス位置にある配列の |
Encode(Column, String) |
指定された文字セット ('US-ASCII'、'ISO-8859-1'、'UTF-8'、'UTF-16BE'、'UTF-16LE'、'UTF-16') を使用して、文字列からバイナリに最初の引数を計算します。 |
Exp(Column) |
指定された値の指数を計算します。 |
Exp(String) |
指定された値の指数を計算します。 |
Explode(Column) |
指定された配列またはマップ列の各要素に対して新しい行を作成します。 |
ExplodeOuter(Column) |
指定された配列またはマップ列の各要素に対して新しい行を作成します。 Explode() とは異なり、配列/マップが null または空の場合、null が生成されます。 |
Expm1(Column) |
指定された値から 1 を引いた指数を計算します。 |
Expm1(String) |
指定された値から 1 を引いた指数を計算します。 |
Expr(String) |
式文字列を、それが表す列に解析します。 |
Factorial(Column) |
指定された値の階乗を計算します。 |
First(Column, Boolean) |
グループ内の列の最初の値を返します。 |
First(String, Boolean) |
グループ内の列の最初の値を返します。 |
Flatten(Column) |
配列の配列から 1 つの配列を作成します。 入れ子になった配列の構造が 2 つのレベルより深い場合、入れ子のレベルは 1 つだけ削除されます。 |
Floor(Column) |
指定された値のフロアを計算します。 |
Floor(String) |
指定された値のフロアを計算します。 |
FormatNumber(Column, Int32) |
指定した数値 |
FormatString(String, Column[]) |
引数を printf スタイルで書式設定し、結果を文字列列として返します。 |
FromCsv(Column, Column, Dictionary<String,String>) |
CSV 文字列 |
FromCsv(Column, StructType, Dictionary<String,String>) |
CSV 文字列 |
FromJson(Column, Column, Dictionary<String,String>) |
JSON 文字列を含む列を、指定したスキーマの |
FromJson(Column, String, Dictionary<String,String>) |
JSON 文字列を含む列を、指定したスキーマの |
FromUnixTime(Column) |
UNIX エポック (1970-01-01 00:00:00 UTC) の秒数を、既定の形式 "yyyy-MM-dd HH:mm:ss" の現在のシステム タイム ゾーンのその時点のタイムスタンプを表す文字列に変換します。 |
FromUnixTime(Column, String) |
UNIX エポック (1970-01-01 00:00:00 UTC) の秒数を、指定された形式の現在のシステム タイム ゾーンでその時点のタイムスタンプを表す文字列に変換します。 |
FromUtcTimestamp(Column, Column) |
'2017-07-14 02:40:00.0' のようなタイムスタンプを指定すると、それを UTC の時刻として解釈し、その時刻を特定のタイム ゾーンのタイムスタンプとしてレンダリングします。 たとえば、'GMT+1' では '2017-07-14 03:40:00.0' が生成されます。 |
FromUtcTimestamp(Column, String) |
'2017-07-14 02:40:00.0' のようなタイムスタンプを指定すると、それを UTC の時刻として解釈し、その時刻を特定のタイム ゾーンのタイムスタンプとしてレンダリングします。 たとえば、'GMT+1' では '2017-07-14 03:40:00.0' が生成されます。 |
GetJsonObject(Column, String) |
指定されたパスに基づいて JSON 文字列から JSON オブジェクトを抽出し、抽出された JSON オブジェクトの JSON 文字列を返します。 |
Greatest(Column[]) |
null 値をスキップして、値の一覧の最大値を返します。 |
Greatest(String, String[]) |
列名の一覧の最大値を返し、null 値はスキップします。 |
Grouping(Column) |
GROUP BY リスト内の指定された列を集計するかどうかを示します。集計の場合は 1、結果セットで集計されていない場合は 0 を返します。 |
Grouping(String) |
GROUP BY リスト内の指定された列を集計するかどうかを示します。集計の場合は 1、結果セットで集計されていない場合は 0 を返します。 |
GroupingId(Column[]) |
グループ内の個別の項目の数を返します。 |
GroupingId(String, String[]) |
グループ内の個別の項目の数を返します。 |
Hash(Column[]) |
指定された列のハッシュ コードを計算し、結果を int 列として返します。 |
Hex(Column) |
指定された列の 16 進値を計算します。 |
Hour(Column) |
指定した日付/タイムスタンプ/文字列から時間を整数として抽出します。 |
Hours(Column) |
データを時間にパーティション分割するためのタイムスタンプの変換。 |
Hypot(Column, Column) |
|
Hypot(Column, Double) |
|
Hypot(Column, String) |
|
Hypot(Double, Column) |
|
Hypot(Double, String) |
|
Hypot(String, Column) |
|
Hypot(String, Double) |
|
Hypot(String, String) |
|
InitCap(Column) |
各単語の最初の文字を大文字に変換して、新しい文字列列を返します。 単語は空白で区切られます。 |
InputFileName() |
現在の Spark タスクのファイル名の文字列列を作成します。 |
Instr(Column, String) |
指定した部分文字列の最初の出現位置を見つけます。 |
IsNaN(Column) |
列が NaN の場合は true を返します。 |
IsNull(Column) |
列が null の場合は true を返します。 |
JsonTuple(Column, String[]) |
指定されたフィールド名に従って、JSON 列の新しい行を作成します。 |
Kurtosis(Column) |
グループ内の値の尖度を返します。 |
Kurtosis(String) |
グループ内の値の尖度を返します。 |
Lag(Column, Int32, Object) |
Window 関数: 現在の行の前の 'offset' 行の値を返し、現在の行の前に 'offset' 行が存在しない場合は null を返します。 たとえば、1 の 'offset' は、ウィンドウ パーティション内の特定のポイントで前の行を返します。 |
Lag(String, Int32, Object) |
Window 関数: 現在の行の前の 'offset' 行の値を返し、現在の行の前に 'offset' 行が存在しない場合は null を返します。 たとえば、1 の 'offset' は、ウィンドウ パーティション内の特定のポイントで前の行を返します。 |
Last(Column, Boolean) |
グループ内の列の最後の値を返します。 |
Last(String, Boolean) |
グループ内の列の最後の値を返します。 |
LastDay(Column) |
指定した日付が属する月の最終日を返します。 |
Lead(Column, Int32, Object) |
Window 関数: 現在の行の後の 'offset' 行の値を返し、現在の行の後に 'offset' 行より小さい場合は null を返します。 たとえば、1 の 'offset' は、ウィンドウ パーティション内の任意のポイントで次の行を返します。 |
Lead(String, Int32, Object) |
Window 関数: 現在の行の後の 'offset' 行の値を返し、現在の行の後に 'offset' 行より小さい場合は null を返します。 たとえば、1 の 'offset' は、ウィンドウ パーティション内の任意のポイントで次の行を返します。 |
Least(Column[]) |
null 値をスキップして、値のリストの最小値を返します。 |
Least(String, String[]) |
null 値をスキップして、値のリストの最小値を返します。 |
Length(Column) |
指定された文字列の文字長またはバイナリ文字列のバイト数を計算します。 |
Levenshtein(Column, Column) |
指定された 2 つの文字列列の Levenshtein 距離を計算します。 |
Lit(Object) |
リテラル値の列を作成します。 |
Locate(String, Column) |
指定した部分文字列の最初の出現位置を見つけます。 |
Locate(String, Column, Int32) |
指定した位置オフセットから始まる、指定された部分文字列の最初の出現位置を見つけます。 |
Log(Column) |
指定された値の自然対数を計算します。 |
Log(Double, Column) |
2 番目の引数の最初の引数と底の対数を計算します。 |
Log(Double, String) |
2 番目の引数の最初の引数と底の対数を計算します。 |
Log(String) |
指定された値の自然対数を計算します。 |
Log10(Column) |
指定した値の対数を底 10 で計算します。 |
Log10(String) |
指定した値の対数を底 10 で計算します。 |
Log1p(Column) |
指定された値に 1 を加えた自然対数を計算します。 |
Log1p(String) |
指定された値に 1 を加えた自然対数を計算します。 |
Log2(Column) |
底 2 の指定された列の対数を計算します。 |
Log2(String) |
底 2 の指定された列の対数を計算します。 |
Lower(Column) |
文字列列を小文字に変換します。 |
Lpad(Column, Int32, String) |
文字列列を左に埋め込み、指定した長さに埋め込みます |
Ltrim(Column) |
指定した文字列列の左端からスペースをトリミングします。 |
Ltrim(Column, String) |
指定した文字列列の左端から指定した文字列をトリミングします。 |
Map(Column[]) |
新しいマップ列を作成します。 |
MapConcat(Column[]) |
指定されたすべてのマップの和集合を返します。 |
MapEntries(Column) |
指定されたマップ内のすべてのエントリの順序なしの配列を返します。 |
MapFromArrays(Column, Column) |
新しいマップ列を作成します。 キーには、最初の列の配列が使用されます。 2 番目の列の配列が値に使用されます。 key の配列内のすべての要素を null にすることはできません。 |
MapFromEntries(Column) |
指定されたエントリの配列から作成されたマップを返します。 |
MapKeys(Column) |
マップのキーを含む順序なしの配列を返します。 |
MapValues(Column) |
マップの値を含む順序なしの配列を返します。 |
Max(Column) |
グループ内の列の最大値を返します。 |
Max(String) |
グループ内の列の最大値を返します。 |
Md5(Column) |
バイナリ列の MD5 ダイジェストを計算し、32 文字の 16 進文字列として値を返します。 |
Mean(Column) |
グループ内の列の平均値を返します。 |
Mean(String) |
グループ内の列の平均値を返します。 |
Min(Column) |
グループ内の列の最小値を返します。 |
Min(String) |
グループ内の列の最小値を返します。 |
Minute(Column) |
指定した日付/タイムスタンプ/文字列から分を整数として抽出します。 |
MonotonicallyIncreasingId() |
単調に増加する 64 ビット整数を生成する列式。 |
Month(Column) |
指定した日付/タイムスタンプ/文字列から月を整数として抽出します。 |
Months(Column) |
データを月に分割するためのタイムスタンプと日付の変換。 |
MonthsBetween(Column, Column) |
日付 |
MonthsBetween(Column, Column, Boolean) |
日付 |
NaNvl(Column, Column) |
NaN でない場合は col1 を返し、col1 が NaN の場合は col2 を返します。 |
Negate(Column) |
単項マイナス、つまり式を否定します。 |
NextDay(Column, String) |
日付列を指定すると、指定した曜日の日付列の値より後の最初の日付が返されます。 |
Not(Column) |
ブール式の反転、つまり NOT。 |
Ntile(Int32) |
Window 関数: 順序付けられたウィンドウ パーティション内の ntile グループ ID (1 から 1 を |
Overlay(Column, Column, Column) |
のバイト位置 |
Overlay(Column, Column, Column, Column) |
の指定した部分 |
PercentRank() |
Window 関数: ウィンドウ パーティション内の行の相対ランク (パーセンタイル) を返します。 |
Pmod(Column, Column) |
除数 mod 除数の正の値を返します。 |
PosExplode(Column) |
指定された配列またはマップ列の位置を持つ各要素の新しい行を作成します。 |
PosExplodeOuter(Column) |
指定された配列またはマップ列の位置を持つ各要素の新しい行を作成します。 Posexplode() とは異なり、配列/マップが null または空の場合、row(null, null) が生成されます。 |
Pow(Column, Column) |
2 番目の引数の累乗に対して発生した最初の引数の値を返します。 |
Pow(Column, Double) |
2 番目の引数の累乗に対して発生した最初の引数の値を返します。 |
Pow(Column, String) |
2 番目の引数の累乗に対して発生した最初の引数の値を返します。 |
Pow(Double, Column) |
2 番目の引数の累乗に対して発生した最初の引数の値を返します。 |
Pow(Double, String) |
2 番目の引数の累乗に対して発生した最初の引数の値を返します。 |
Pow(String, Column) |
2 番目の引数の累乗に対して発生した最初の引数の値を返します。 |
Pow(String, Double) |
2 番目の引数の累乗に対して発生した最初の引数の値を返します。 |
Pow(String, String) |
2 番目の引数の累乗に対して発生した最初の引数の値を返します。 |
Quarter(Column) |
指定した日付/タイムスタンプ/文字列から四半期を整数として抽出します。 |
Radians(Column) |
度単位の角度をラジアンで測定したほぼ等価の角度に変換します。 |
Radians(String) |
度単位の角度をラジアンで測定したほぼ等価の角度に変換します。 |
Rand() |
U[0.0, 1.0] から独立した同一分布 (つまり、) サンプルを含むランダム列を生成します。 |
Rand(Int64) |
U[0.0, 1.0] から独立した同一分布 (つまり、) サンプルを含むランダム列を生成します。 |
Randn() |
標準正規分布から、独立した同一分布 (i.i.d.) サンプルを含むランダム列を生成します。 |
Randn(Int64) |
標準正規分布から、独立した同一分布 (i.i.d.) サンプルを含むランダム列を生成します。 |
Rank() |
Window 関数: ウィンドウ パーティション内の行のランクを返します。 |
RegexpExtract(Column, String, Int32) |
指定した文字列列から、Java 正規表現に一致する特定のグループを抽出します。 |
RegexpReplace(Column, Column, Column) |
パターンに一致する指定した文字列値のすべての部分文字列を、指定された置換文字列に置き換えます。 |
RegexpReplace(Column, String, String) |
パターンに一致する指定した文字列値のすべての部分文字列を、指定された置換文字列に置き換えます。 |
Repeat(Column, Int32) |
文字列列 |
Reverse(Column) |
文字列列を反転し、新しい文字列列として返します。 |
Rint(Column) |
引数に最も近く、数学整数と等しい double 値を返します。 |
Rint(String) |
引数に最も近く、数学整数と等しい double 値を返します。 |
Round(Column) |
丸めモードで小数点以下 0 桁に丸められた の値 |
Round(Column, Int32) |
丸めモードで小数点以下に |
RowNumber() |
Window 関数: ウィンドウ パーティション内の 1 から始まる連続する数値を返します。 |
Rpad(Column, Int32, String) |
文字列列を右に埋め込み、指定した長さに埋め込みます |
Rtrim(Column) |
指定した文字列値の右端からスペースをトリミングします。 |
Rtrim(Column, String) |
指定した文字列列の右端から指定した文字列をトリミングします。 |
SchemaOfCsv(Column) |
CSV 文字列を解析し、そのスキーマを DDL 形式で推論します。 |
SchemaOfCsv(Column, Dictionary<String,String>) |
CSV 文字列を解析し、そのスキーマを DDL 形式で推論します。 |
SchemaOfCsv(String) |
CSV 文字列を解析し、そのスキーマを DDL 形式で推論します。 |
SchemaOfJson(Column) |
JSON 文字列を解析し、そのスキーマを DDL 形式で推論します。 |
SchemaOfJson(Column, Dictionary<String,String>) |
JSON 文字列を解析し、そのスキーマを DDL 形式で推論します。 |
SchemaOfJson(String) |
JSON 文字列を解析し、そのスキーマを DDL 形式で推論します。 |
Second(Column) |
指定した日付/タイムスタンプ/文字列から秒を整数として抽出します。 |
Sequence(Column, Column) |
start が stop 以下の場合は 1 ずつインクリメントされ、それ以外の場合は -1 の整数のシーケンスを生成します。 |
Sequence(Column, Column, Column) |
から |
Sha1(Column) |
バイナリ列の SHA-1 ダイジェストを計算し、40 文字の 16 進文字列として値を返します。 |
Sha2(Column, Int32) |
バイナリ列の SHA-2 ファミリのハッシュ関数を計算し、値を 16 進文字列として返します。 |
ShiftLeft(Column, Int32) |
指定した値 |
ShiftRight(Column, Int32) |
(符号付き) 指定された値 |
ShiftRightUnsigned(Column, Int32) |
符号なしでは、指定された値 |
Shuffle(Column) |
指定された配列のランダムな順列を返します。 |
Signum(Column) |
指定された値の符号を計算します。 |
Signum(String) |
指定された値の符号を計算します。 |
Sin(Column) |
によって計算されるかのように、角度のサインを |
Sin(String) |
によって計算されるかのように、角度のサインを |
Sinh(Column) |
によって計算されるかのように、角度の双曲線サインを |
Sinh(String) |
によって計算されるかのように、角度の双曲線サインを |
Size(Column) |
配列またはマップの長さを返します。 |
Skewness(Column) |
グループ内の値の歪度を返します。 |
Skewness(String) |
グループ内の値の歪度を返します。 |
Slice(Column, Int32, Int32) |
指定した |
SortArray(Column, Boolean) |
指定された列の入力配列を、配列要素の自然な順序である昇順 (既定値) または降順で並べ替えます。 |
Soundex(Column) |
指定した式の soundex コードを返します。 |
SparkPartitionId() |
パーティション ID。 |
Split(Column, String) |
文字列を正規表現パターンで分割します。 |
Split(Column, String, Int32) |
指定されたパターンの一致を囲む str を分割します。 |
Sqrt(Column) |
指定した float 値の平方根を計算します。 |
Sqrt(String) |
指定した float 値の平方根を計算します。 |
Stddev(Column) |
StddevSamp() のエイリアス。 |
Stddev(String) |
StddevSamp() のエイリアス。 |
StddevPop(Column) |
グループ内の式の母集団標準偏差を返します。 |
StddevPop(String) |
グループ内の式の母集団標準偏差を返します。 |
StddevSamp(Column) |
グループ内の式の標本標準偏差を返します。 |
StddevSamp(String) |
グループ内の式の標本標準偏差を返します。 |
Struct(Column[]) |
複数の入力列を構成する新しい構造体列を作成します。 |
Struct(String, String[]) |
複数の入力列を構成する新しい構造体列を作成します。 |
Substring(Column, Int32, Int32) |
指定した長さの指定した位置から始まる部分文字列 (またはバイト配列のスライス) を返します。 |
SubstringIndex(Column, String, Int32) |
指定された区切り記号が出現する前に |
Sum(Column) |
式内のすべての値の合計を返します。 |
Sum(String) |
式内のすべての値の合計を返します。 |
SumDistinct(Column) |
式内の個別の値の合計を返します。 |
SumDistinct(String) |
式内の個別の値の合計を返します。 |
Tan(Column) |
によって計算されるかのように、指定された値のタンジェントを |
Tan(String) |
によって計算されるかのように、指定された値のタンジェントを |
Tanh(Column) |
によって計算されるかのように、指定された値の双曲線正接を |
Tanh(String) |
によって計算されるかのように、指定された値の双曲線正接を |
ToCsv(Column) |
を含む列を |
ToCsv(Column, Dictionary<String,String>) |
を含む列を |
ToDate(Column) |
規則を にキャストして、列を に |
ToDate(Column, String) |
指定した形式の に |
ToJson(Column, Dictionary<String,String>) |
s、または |
ToTimestamp(Column) |
ルールを にキャストして、時刻文字列を Unix タイムスタンプ (秒単位) に |
ToTimestamp(Column, String) |
時刻文字列を、指定した形式の Unix タイムスタンプ (秒単位) に変換します。 |
ToUtcTimestamp(Column, Column) |
'2017-07-14 02:40:00.0' のようなタイムスタンプを指定すると、指定されたタイム ゾーンの時刻として解釈され、その時刻が UTC のタイムスタンプとしてレンダリングされます。 たとえば、'GMT+1' では '2017-07-14 01:40:00.0' が生成されます。 |
ToUtcTimestamp(Column, String) |
'2017-07-14 02:40:00.0' のようなタイムスタンプを指定すると、指定されたタイム ゾーンの時刻として解釈され、その時刻が UTC のタイムスタンプとしてレンダリングされます。 たとえば、'GMT+1' では '2017-07-14 01:40:00.0' が生成されます。 |
Translate(Column, String, String) |
指定された によって、列内の 指定 |
Trim(Column) |
指定した文字列列の両端からスペースをトリミングします。 |
Trim(Column, String) |
指定した文字列列の両端から指定した文字をトリミングします。 |
Trunc(Column, String) |
形式で指定された単位に切り捨てられた日付を返します。 |
Udf(Func<Row>, StructType) |
指定したデリゲートから UDF を作成します。 |
Udf<A1,RT>(Func<A1,RT>) |
指定したデリゲートから UDF を作成します。 |
Udf<T>(Func<T,Row>, StructType) |
指定したデリゲートから UDF を作成します。 |
Udf<T1,T2,T3,T4,T5,T6,T7,T8,T9,T10,TResult>(Func<T1,T2,T3,T4,T5,T6,T7,T8,T9,T10,TResult>) |
指定したデリゲートから UDF を作成します。 |
Udf<T1,T2,T3,T4,T5,T6,T7,T8,T9,T10>(Func<T1,T2,T3,T4,T5,T6,T7,T8,T9,T10,Row>, StructType) |
指定したデリゲートから UDF を作成します。 |
Udf<T1,T2,T3,T4,T5,T6,T7,T8,T9,TResult>(Func<T1,T2,T3,T4,T5,T6,T7,T8,T9,TResult>) |
指定したデリゲートから UDF を作成します。 |
Udf<T1,T2,T3,T4,T5,T6,T7,T8,T9>(Func<T1,T2,T3,T4,T5,T6,T7,T8,T9,Row>, StructType) |
指定したデリゲートから UDF を作成します。 |
Udf<T1,T2,T3,T4,T5,T6,T7,T8,TResult>(Func<T1,T2,T3,T4,T5,T6,T7,T8,TResult>) |
指定したデリゲートから UDF を作成します。 |
Udf<T1,T2,T3,T4,T5,T6,T7,T8>(Func<T1,T2,T3,T4,T5,T6,T7,T8,Row>, StructType) |
指定したデリゲートから UDF を作成します。 |
Udf<T1,T2,T3,T4,T5,T6,T7,TResult>(Func<T1,T2,T3,T4,T5,T6,T7,TResult>) |
指定したデリゲートから UDF を作成します。 |
Udf<T1,T2,T3,T4,T5,T6,T7>(Func<T1,T2,T3,T4,T5,T6,T7,Row>, StructType) |
指定したデリゲートから UDF を作成します。 |
Udf<T1,T2,T3,T4,T5,T6,TResult>(Func<T1,T2,T3,T4,T5,T6,TResult>) |
指定したデリゲートから UDF を作成します。 |
Udf<T1,T2,T3,T4,T5,T6>(Func<T1,T2,T3,T4,T5,T6,Row>, StructType) |
指定したデリゲートから UDF を作成します。 |
Udf<T1,T2,T3,T4,T5,TResult>(Func<T1,T2,T3,T4,T5,TResult>) |
指定したデリゲートから UDF を作成します。 |
Udf<T1,T2,T3,T4,T5>(Func<T1,T2,T3,T4,T5,Row>, StructType) |
指定したデリゲートから UDF を作成します。 |
Udf<T1,T2,T3,T4,TResult>(Func<T1,T2,T3,T4,TResult>) |
指定したデリゲートから UDF を作成します。 |
Udf<T1,T2,T3,T4>(Func<T1,T2,T3,T4,Row>, StructType) |
指定したデリゲートから UDF を作成します。 |
Udf<T1,T2,T3,TResult>(Func<T1,T2,T3,TResult>) |
指定したデリゲートから UDF を作成します。 |
Udf<T1,T2,T3>(Func<T1,T2,T3,Row>, StructType) |
指定したデリゲートから UDF を作成します。 |
Udf<T1,T2,TResult>(Func<T1,T2,TResult>) |
指定したデリゲートから UDF を作成します。 |
Udf<T1,T2>(Func<T1,T2,Row>, StructType) |
指定したデリゲートから UDF を作成します。 |
Udf<TResult>(Func<TResult>) |
指定したデリゲートから UDF を作成します。 |
Unbase64(Column) |
BASE64 でエンコードされた文字列列をデコードし、バイナリ列として返します。 |
UnboundedFollowing() |
Window 関数: ウィンドウ パーティションの最後の行を表す特殊なフレーム境界を返します。 |
UnboundedPreceding() |
Window 関数: ウィンドウ パーティションの最初の行を表す特殊なフレーム境界を返します。 |
Unhex(Column) |
16 進数の逆関数。 各文字のペアを 16 進数として解釈し、数値のバイト表現に変換します。 |
UnixTimestamp() |
現在の Unix タイムスタンプ (秒単位) を返します。 |
UnixTimestamp(Column) |
既定のタイムゾーンと既定のロケールを使用して、時刻文字列を yyyy-MM-dd HH:mm:ss 形式で Unix タイムスタンプ (秒単位) に変換します。 |
UnixTimestamp(Column, String) |
指定された形式の時刻文字列を Unix タイムスタンプ (秒単位) に変換します。 |
Upper(Column) |
文字列列を大文字に変換します。 |
Variance(Column) |
VarSamp() のエイリアス。 |
Variance(String) |
VarSamp() のエイリアス。 |
VarPop(Column) |
グループ内の値の母集団の分散を返します。 |
VarPop(String) |
グループ内の値の母集団の分散を返します。 |
VarSamp(Column) |
グループ内の値の偏りのない分散を返します。 |
VarSamp(String) |
グループ内の値の偏りのない分散を返します。 |
WeekOfYear(Column) |
特定の日付/タイムスタンプ/文字列から週番号を整数として抽出します。 |
When(Column, Object) |
条件を評価し、考えられる複数の結果式のいずれかを返します。 それ以外の場合は、一致しない条件に対して null が返されます。 |
Window(Column, String) |
列を指定するタイムスタンプを指定してタンブリング タイム ウィンドウを生成します。 |
Window(Column, String, String) |
タイムスタンプ列を指定して、行を 1 つ以上の時間枠にバケット化します。 |
Window(Column, String, String, String) |
タイムスタンプ列を指定して、行を 1 つ以上の時間枠にバケット化します。 |
XXHash64(Column[]) |
xxHash アルゴリズムの 64 ビットバリアントを使用して、特定の列のハッシュ コードを計算し、結果を長い列として返します。 |
Year(Column) |
指定した日付/タイムスタンプ/文字列から年を整数として抽出します。 |
Years(Column) |
データを年に分割するためのタイムスタンプと日付の変換。 |
適用対象
フィードバック
https://aka.ms/ContentUserFeedback」を参照してください。
以下は間もなく提供いたします。2024 年を通じて、コンテンツのフィードバック メカニズムとして GitHub の issue を段階的に廃止し、新しいフィードバック システムに置き換えます。 詳細については、「フィードバックの送信と表示