Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Mengembalikan nomor wadah (bucket) tempat nilai ekspresi ini akan jatuh setelah dievaluasi. Perhatikan bahwa argumen input harus mengikuti kondisi yang tercantum di bawah ini; jika tidak, metode akan mengembalikan null. Mendukung Spark Connect.
Untuk fungsi Databricks SQL yang sesuai, lihat width_bucket fungsi.
Syntax
from pyspark.databricks.sql import functions as dbf
dbf.width_bucket(v=<v>, min=<min>, max=<max>, numBucket=<numBucket>)
Parameter-parameternya
| Pengaturan | Tipe | Description |
|---|---|---|
v |
pyspark.sql.Column or column name |
nilai untuk menghitung angka wadah dalam histogram |
min |
pyspark.sql.Column or column name |
nilai minimum histogram |
max |
pyspark.sql.Column or column name |
nilai maksimum histogram |
numBucket |
pyspark.sql.Column, column name or int |
jumlah wadah |
Pengembalian Barang
pyspark.sql.Column: nomor wadah tempat nilai akan jatuh setelah dievaluasi
Examples
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([
(5.3, 0.2, 10.6, 5),
(-2.1, 1.3, 3.4, 3),
(8.1, 0.0, 5.7, 4),
(-0.9, 5.2, 0.5, 2)],
['v', 'min', 'max', 'n'])
df.select("*", dbf.width_bucket('v', 'min', 'max', 'n')).show()
+----+---+----+---+----------------------------+
| v|min| max| n|width_bucket(v, min, max, n)|
+----+---+----+---+----------------------------+
| 5.3|0.2|10.6| 5| 3|
|-2.1|1.3| 3.4| 3| 0|
| 8.1|0.0| 5.7| 4| 5|
|-0.9|5.2| 0.5| 2| 3|
+----+---+----+---+----------------------------+