Nota
L'accesso a questa pagina richiede l'autorizzazione. Puoi provare ad accedere o a cambiare directory.
L'accesso a questa pagina richiede l'autorizzazione. Puoi provare a cambiare directory.
Restituisce il numero di bucket in cui il valore di questa espressione cadrebbe dopo la valutazione. Si noti che gli argomenti di input devono seguire le condizioni elencate di seguito; in caso contrario, il metodo restituirà Null. Supporta Spark Connect.
Per la funzione SQL di Databricks corrispondente, vedere width_bucket funzione.
Sintassi
from pyspark.databricks.sql import functions as dbf
dbf.width_bucket(v=<v>, min=<min>, max=<max>, numBucket=<numBucket>)
Parametri
| Parametro | TIPO | Description |
|---|---|---|
v |
pyspark.sql.Column or column name |
valore per calcolare un numero di bucket nell'istogramma |
min |
pyspark.sql.Column or column name |
valore minimo dell'istogramma |
max |
pyspark.sql.Column or column name |
valore massimo dell'istogramma |
numBucket |
pyspark.sql.Column, column name or int |
numero di bucket |
Restituzioni
pyspark.sql.Column: numero di bucket in cui il valore cadrebbe dopo essere stato valutato
Esempi
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([
(5.3, 0.2, 10.6, 5),
(-2.1, 1.3, 3.4, 3),
(8.1, 0.0, 5.7, 4),
(-0.9, 5.2, 0.5, 2)],
['v', 'min', 'max', 'n'])
df.select("*", dbf.width_bucket('v', 'min', 'max', 'n')).show()
+----+---+----+---+----------------------------+
| v|min| max| n|width_bucket(v, min, max, n)|
+----+---+----+---+----------------------------+
| 5.3|0.2|10.6| 5| 3|
|-2.1|1.3| 3.4| 3| 0|
| 8.1|0.0| 5.7| 4| 5|
|-0.9|5.2| 0.5| 2| 3|
+----+---+----+---+----------------------------+