approxQuantile (DataFrame)

Bir DataFrame'in sayısal sütunlarının yaklaşık niceliklerini hesaplar.

Sözdizimi

approxQuantile(col: Union[str, List[str], Tuple[str]], probabilities: Union[List[float], Tuple[float]], relativeError: float)

Parametreler

Parametre	Türü	Açıklama
`col`	str, tanımlama grubu veya liste	Tek bir sütun adı veya birden çok sütun için ad listesi olabilir.
`probabilities`	kayanlar listesi veya demet	nicel olasılıkların listesi. Her sayı [0, 1] aralığında bir float olmalıdır. Örneğin, en az 0,0, ortanca değer 0,5, en fazla 1,0'dır.
`relativeError`	yüzmek	Elde etmek için göreli hedef duyarlık (>= 0). Sıfır olarak ayarlanırsa, tam niceller hesaplanır ve bu çok pahalı olabilir. 1'den büyük değerlerin kabul edildiğine ancak 1 ile aynı sonucu verdiğine dikkat edin.

İadeler

list: verilen olasılıkların yaklaşık nicelleri. Giriş col bir dizeyse, çıkış bir kayanlar listesidir. Giriş col bir dize listesi veya demet ise, çıkış aynı zamanda bir listedir, ancak içindeki her öğe bir floats listesidir.

Notlar

Hesaplamadan önce sayısal sütunlarda null değerler yoksayılır. Yalnızca null değerler içeren sütunlar için boş bir liste döndürülür.

Örnekler

data = [(1,), (2,), (3,), (4,), (5,)]
df = spark.createDataFrame(data, ["values"])
quantiles = df.approxQuantile("values", [0.0, 0.5, 1.0], 0.05)
quantiles
# [1.0, 3.0, 5.0]

data = [(1, 10), (2, 20), (3, 30), (4, 40), (5, 50)]
df = spark.createDataFrame(data, ["col1", "col2"])
quantiles = df.approxQuantile(["col1", "col2"], [0.0, 0.5, 1.0], 0.05)
quantiles
# [[1.0, 3.0, 5.0], [10.0, 30.0, 50.0]]

Geri Bildirim

Bu sayfayı yararlı buldunuz mu?

Last updated on 2026-04-19