approxQuantile (DataFrame)

Menghitung perkiraan kuantil kolom numerik DataFrame.

Sintaksis

approxQuantile(col: Union[str, List[str], Tuple[str]], probabilities: Union[List[float], Tuple[float]], relativeError: float)

Parameter-parameternya

Parameter	Tipe	Deskripsi
`col`	str, tuple, atau daftar	Bisa berupa satu nama kolom, atau daftar nama untuk beberapa kolom.
`probabilities`	daftar atau tuple float	daftar probabilitas kuantil. Setiap angka harus berupa float dalam rentang [0, 1]. Misalnya 0,0 adalah minimum, 0,5 adalah median, 1,0 adalah maksimum.
`relativeError`	float	Presisi target relatif untuk mencapai (>= 0). Jika diatur ke nol, kuantil yang tepat dihitung, yang bisa sangat mahal. Perhatikan bahwa nilai yang lebih besar dari 1 diterima tetapi memberikan hasil yang sama dengan 1.

Pengembalian Barang

list: perkiraan kuantil pada probabilitas yang diberikan. Jika input col adalah string, output adalah daftar float. Jika input col adalah daftar atau tuple string, output juga merupakan daftar, tetapi setiap elemen di dalamnya adalah daftar float.

Catatan

Nilai null akan diabaikan dalam kolom numerik sebelum perhitungan. Untuk kolom yang hanya berisi nilai null, daftar kosong dikembalikan.

Examples

data = [(1,), (2,), (3,), (4,), (5,)]
df = spark.createDataFrame(data, ["values"])
quantiles = df.approxQuantile("values", [0.0, 0.5, 1.0], 0.05)
quantiles
# [1.0, 3.0, 5.0]

data = [(1, 10), (2, 20), (3, 30), (4, 40), (5, 50)]
df = spark.createDataFrame(data, ["col1", "col2"])
quantiles = df.approxQuantile(["col1", "col2"], [0.0, 0.5, 1.0], 0.05)
quantiles
# [[1.0, 3.0, 5.0], [10.0, 30.0, 50.0]]

Saran dan Komentar

Apakah halaman ini membantu?

Last updated on 2026-04-19