Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Menghitung perkiraan kuantil kolom numerik DataFrame.
Sintaksis
approxQuantile(col: Union[str, List[str], Tuple[str]], probabilities: Union[List[float], Tuple[float]], relativeError: float)
Parameter-parameternya
| Parameter | Tipe | Deskripsi |
|---|---|---|
col |
str, tuple, atau daftar | Bisa berupa satu nama kolom, atau daftar nama untuk beberapa kolom. |
probabilities |
daftar atau tuple float | daftar probabilitas kuantil. Setiap angka harus berupa float dalam rentang [0, 1]. Misalnya 0,0 adalah minimum, 0,5 adalah median, 1,0 adalah maksimum. |
relativeError |
float | Presisi target relatif untuk mencapai (>= 0). Jika diatur ke nol, kuantil yang tepat dihitung, yang bisa sangat mahal. Perhatikan bahwa nilai yang lebih besar dari 1 diterima tetapi memberikan hasil yang sama dengan 1. |
Pengembalian Barang
list: perkiraan kuantil pada probabilitas yang diberikan. Jika input col adalah string, output adalah daftar float. Jika input col adalah daftar atau tuple string, output juga merupakan daftar, tetapi setiap elemen di dalamnya adalah daftar float.
Catatan
Nilai null akan diabaikan dalam kolom numerik sebelum perhitungan. Untuk kolom yang hanya berisi nilai null, daftar kosong dikembalikan.
Examples
data = [(1,), (2,), (3,), (4,), (5,)]
df = spark.createDataFrame(data, ["values"])
quantiles = df.approxQuantile("values", [0.0, 0.5, 1.0], 0.05)
quantiles
# [1.0, 3.0, 5.0]
data = [(1, 10), (2, 20), (3, 30), (4, 40), (5, 50)]
df = spark.createDataFrame(data, ["col1", "col2"])
quantiles = df.approxQuantile(["col1", "col2"], [0.0, 0.5, 1.0], 0.05)
quantiles
# [[1.0, 3.0, 5.0], [10.0, 30.0, 50.0]]