Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Funkcja okna: zwraca identyfikator grupy ntile (od 1 do n inkluzywnego) w uporządkowanej partycji okna. Na przykład jeśli n wartość to 4, pierwszy kwartał wierszy otrzyma wartość 1, drugi kwartał otrzyma 2, trzeci kwartał otrzyma 3, a ostatni kwartał otrzyma 4.
Jest to odpowiednik funkcji NTILE w języku SQL.
Składnia
from pyspark.sql import functions as sf
sf.ntile(n)
Parametry
| Parameter | Typ | Description |
|---|---|---|
n |
int | Liczba całkowita określająca liczbę grup, na które ma być podzielona partycja. |
Zwraca
pyspark.sql.Column: identyfikator grupy częściowej.
Przykłady
from pyspark.sql import functions as sf
from pyspark.sql import Window
df = spark.createDataFrame(
[("a", 1), ("a", 2), ("a", 3), ("b", 8), ("b", 2)], ["c1", "c2"])
df.show()
+---+---+
| c1| c2|
+---+---+
| a| 1|
| a| 2|
| a| 3|
| b| 8|
| b| 2|
+---+---+
w = Window.partitionBy("c1").orderBy("c2")
df.withColumn("ntile", sf.ntile(2).over(w)).show()
+---+---+-----+
| c1| c2|ntile|
+---+---+-----+
| a| 1| 1|
| a| 2| 1|
| a| 3| 2|
| b| 2| 1|
| b| 8| 2|
+---+---+-----+