approxQuantile (DataFrame)

Bir DataFrame'in sayısal sütunlarının yaklaşık niceliklerini hesaplar.

Sözdizimi

approxQuantile(col: Union[str, List[str], Tuple[str]], probabilities: Union[List[float], Tuple[float]], relativeError: float)

Parametreler

Parametre Türü Açıklama
col str, tanımlama grubu veya liste Tek bir sütun adı veya birden çok sütun için ad listesi olabilir.
probabilities kayanlar listesi veya demet nicel olasılıkların listesi. Her sayı [0, 1] aralığında bir float olmalıdır. Örneğin, en az 0,0, ortanca değer 0,5, en fazla 1,0'dır.
relativeError yüzmek Elde etmek için göreli hedef duyarlık (>= 0). Sıfır olarak ayarlanırsa, tam niceller hesaplanır ve bu çok pahalı olabilir. 1'den büyük değerlerin kabul edildiğine ancak 1 ile aynı sonucu verdiğine dikkat edin.

İadeler

list: verilen olasılıkların yaklaşık nicelleri. Giriş col bir dizeyse, çıkış bir kayanlar listesidir. Giriş col bir dize listesi veya demet ise, çıkış aynı zamanda bir listedir, ancak içindeki her öğe bir floats listesidir.

Notlar

Hesaplamadan önce sayısal sütunlarda null değerler yoksayılır. Yalnızca null değerler içeren sütunlar için boş bir liste döndürülür.

Örnekler

data = [(1,), (2,), (3,), (4,), (5,)]
df = spark.createDataFrame(data, ["values"])
quantiles = df.approxQuantile("values", [0.0, 0.5, 1.0], 0.05)
quantiles
# [1.0, 3.0, 5.0]

data = [(1, 10), (2, 20), (3, 30), (4, 40), (5, 50)]
df = spark.createDataFrame(data, ["col1", "col2"])
quantiles = df.approxQuantile(["col1", "col2"], [0.0, 0.5, 1.0], 0.05)
quantiles
# [[1.0, 3.0, 5.0], [10.0, 30.0, 50.0]]