Bagikan melalui


width_bucket

Mengembalikan nomor wadah (bucket) tempat nilai ekspresi ini akan jatuh setelah dievaluasi. Perhatikan bahwa argumen input harus mengikuti kondisi yang tercantum di bawah ini; jika tidak, metode akan mengembalikan null. Mendukung Spark Connect.

Untuk fungsi Databricks SQL yang sesuai, lihat width_bucket fungsi.

Syntax

from pyspark.databricks.sql import functions as dbf

dbf.width_bucket(v=<v>, min=<min>, max=<max>, numBucket=<numBucket>)

Parameter-parameternya

Pengaturan Tipe Description
v pyspark.sql.Column or column name nilai untuk menghitung angka wadah dalam histogram
min pyspark.sql.Column or column name nilai minimum histogram
max pyspark.sql.Column or column name nilai maksimum histogram
numBucket pyspark.sql.Column, column name or int jumlah wadah

Pengembalian Barang

pyspark.sql.Column: nomor wadah tempat nilai akan jatuh setelah dievaluasi

Examples

from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([
    (5.3, 0.2, 10.6, 5),
    (-2.1, 1.3, 3.4, 3),
    (8.1, 0.0, 5.7, 4),
    (-0.9, 5.2, 0.5, 2)],
    ['v', 'min', 'max', 'n'])
df.select("*", dbf.width_bucket('v', 'min', 'max', 'n')).show()
+----+---+----+---+----------------------------+
|   v|min| max|  n|width_bucket(v, min, max, n)|
+----+---+----+---+----------------------------+
| 5.3|0.2|10.6|  5|                           3|
|-2.1|1.3| 3.4|  3|                           0|
| 8.1|0.0| 5.7|  4|                           5|
|-0.9|5.2| 0.5|  2|                           3|
+----+---+----+---+----------------------------+