Bagikan melalui


ntile

Fungsi jendela: mengembalikan id grup ntile (dari 1 hingga n inklusif) dalam partisi jendela yang diurutkan. Misalnya, jika n 4, kuartal pertama baris akan mendapatkan nilai 1, kuartal kedua akan mendapatkan 2, kuartal ketiga akan mendapatkan 3, dan kuartal terakhir akan mendapatkan 4.

Ini setara dengan fungsi NTILE di SQL.

Syntax

from pyspark.sql import functions as sf

sf.ntile(n)

Parameter-parameternya

Pengaturan Tipe Description
n int Bilangan bulat yang menentukan jumlah grup untuk membagi partisi.

Pengembalian Barang

pyspark.sql.Column: id grup porsi.

Examples

from pyspark.sql import functions as sf
from pyspark.sql import Window
df = spark.createDataFrame(
    [("a", 1), ("a", 2), ("a", 3), ("b", 8), ("b", 2)], ["c1", "c2"])
df.show()
+---+---+
| c1| c2|
+---+---+
|  a|  1|
|  a|  2|
|  a|  3|
|  b|  8|
|  b|  2|
+---+---+
w = Window.partitionBy("c1").orderBy("c2")
df.withColumn("ntile", sf.ntile(2).over(w)).show()
+---+---+-----+
| c1| c2|ntile|
+---+---+-----+
|  a|  1|    1|
|  a|  2|    1|
|  a|  3|    2|
|  b|  2|    1|
|  b|  8|    2|
+---+---+-----+