approxQuantile (DataFrame)

Menghitung perkiraan kuantil kolom numerik DataFrame.

Sintaksis

approxQuantile(col: Union[str, List[str], Tuple[str]], probabilities: Union[List[float], Tuple[float]], relativeError: float)

Parameter-parameternya

Parameter Tipe Deskripsi
col str, tuple, atau daftar Bisa berupa satu nama kolom, atau daftar nama untuk beberapa kolom.
probabilities daftar atau tuple float daftar probabilitas kuantil. Setiap angka harus berupa float dalam rentang [0, 1]. Misalnya 0,0 adalah minimum, 0,5 adalah median, 1,0 adalah maksimum.
relativeError float Presisi target relatif untuk mencapai (>= 0). Jika diatur ke nol, kuantil yang tepat dihitung, yang bisa sangat mahal. Perhatikan bahwa nilai yang lebih besar dari 1 diterima tetapi memberikan hasil yang sama dengan 1.

Pengembalian Barang

list: perkiraan kuantil pada probabilitas yang diberikan. Jika input col adalah string, output adalah daftar float. Jika input col adalah daftar atau tuple string, output juga merupakan daftar, tetapi setiap elemen di dalamnya adalah daftar float.

Catatan

Nilai null akan diabaikan dalam kolom numerik sebelum perhitungan. Untuk kolom yang hanya berisi nilai null, daftar kosong dikembalikan.

Examples

data = [(1,), (2,), (3,), (4,), (5,)]
df = spark.createDataFrame(data, ["values"])
quantiles = df.approxQuantile("values", [0.0, 0.5, 1.0], 0.05)
quantiles
# [1.0, 3.0, 5.0]

data = [(1, 10), (2, 20), (3, 30), (4, 40), (5, 50)]
df = spark.createDataFrame(data, ["col1", "col2"])
quantiles = df.approxQuantile(["col1", "col2"], [0.0, 0.5, 1.0], 0.05)
quantiles
# [[1.0, 3.0, 5.0], [10.0, 30.0, 50.0]]