width_bucket

Restituisce il numero di bucket in cui il valore di questa espressione cadrebbe dopo la valutazione. Si noti che gli argomenti di input devono seguire le condizioni elencate di seguito; in caso contrario, il metodo restituirà Null. Supporta Spark Connect.

Per la funzione SQL di Databricks corrispondente, vedere width_bucket funzione.

Sintassi

from pyspark.databricks.sql import functions as dbf

dbf.width_bucket(v=<v>, min=<min>, max=<max>, numBucket=<numBucket>)

Parametri

Parametro	TIPO	Description
`v`	`pyspark.sql.Column or column name`	valore per calcolare un numero di bucket nell'istogramma
`min`	`pyspark.sql.Column or column name`	valore minimo dell'istogramma
`max`	`pyspark.sql.Column or column name`	valore massimo dell'istogramma
`numBucket`	`pyspark.sql.Column, column name or int`	numero di bucket

Restituzioni

pyspark.sql.Column: numero di bucket in cui il valore cadrebbe dopo essere stato valutato

Esempi

from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([
    (5.3, 0.2, 10.6, 5),
    (-2.1, 1.3, 3.4, 3),
    (8.1, 0.0, 5.7, 4),
    (-0.9, 5.2, 0.5, 2)],
    ['v', 'min', 'max', 'n'])
df.select("*", dbf.width_bucket('v', 'min', 'max', 'n')).show()

+----+---+----+---+----------------------------+
|   v|min| max|  n|width_bucket(v, min, max, n)|
+----+---+----+---+----------------------------+
| 5.3|0.2|10.6|  5|                           3|
|-2.1|1.3| 3.4|  3|                           0|
| 8.1|0.0| 5.7|  4|                           5|
|-0.9|5.2| 0.5|  2|                           3|
+----+---+----+---+----------------------------+

Valutazione

Questa pagina ti è stata utile?

Last updated on 2026-02-01