Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Restituisce il numero di bucket in cui il valore di questa espressione cadrebbe dopo la valutazione. Si noti che gli argomenti di input devono seguire le condizioni elencate di seguito; in caso contrario, il metodo restituirà Null. Supporta Spark Connect.
Per la funzione SQL di Databricks corrispondente, vedere width_bucket funzione.
Sintassi
from pyspark.databricks.sql import functions as dbf
dbf.width_bucket(v=<v>, min=<min>, max=<max>, numBucket=<numBucket>)
Parametri
| Parametro | TIPO | Description |
|---|---|---|
v |
pyspark.sql.Column or column name |
valore per calcolare un numero di bucket nell'istogramma |
min |
pyspark.sql.Column or column name |
valore minimo dell'istogramma |
max |
pyspark.sql.Column or column name |
valore massimo dell'istogramma |
numBucket |
pyspark.sql.Column, column name or int |
numero di bucket |
Restituzioni
pyspark.sql.Column: numero di bucket in cui il valore cadrebbe dopo essere stato valutato
Esempi
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([
(5.3, 0.2, 10.6, 5),
(-2.1, 1.3, 3.4, 3),
(8.1, 0.0, 5.7, 4),
(-0.9, 5.2, 0.5, 2)],
['v', 'min', 'max', 'n'])
df.select("*", dbf.width_bucket('v', 'min', 'max', 'n')).show()
+----+---+----+---+----------------------------+
| v|min| max| n|width_bucket(v, min, max, n)|
+----+---+----+---+----------------------------+
| 5.3|0.2|10.6| 5| 3|
|-2.1|1.3| 3.4| 3| 0|
| 8.1|0.0| 5.7| 4| 5|
|-0.9|5.2| 0.5| 2| 3|
+----+---+----+---+----------------------------+