Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Bir DataFrame'in sayısal sütunlarının yaklaşık niceliklerini hesaplar.
Sözdizimi
approxQuantile(col: Union[str, List[str], Tuple[str]], probabilities: Union[List[float], Tuple[float]], relativeError: float)
Parametreler
| Parametre | Türü | Açıklama |
|---|---|---|
col |
str, tanımlama grubu veya liste | Tek bir sütun adı veya birden çok sütun için ad listesi olabilir. |
probabilities |
kayanlar listesi veya demet | nicel olasılıkların listesi. Her sayı [0, 1] aralığında bir float olmalıdır. Örneğin, en az 0,0, ortanca değer 0,5, en fazla 1,0'dır. |
relativeError |
yüzmek | Elde etmek için göreli hedef duyarlık (>= 0). Sıfır olarak ayarlanırsa, tam niceller hesaplanır ve bu çok pahalı olabilir. 1'den büyük değerlerin kabul edildiğine ancak 1 ile aynı sonucu verdiğine dikkat edin. |
İadeler
list: verilen olasılıkların yaklaşık nicelleri. Giriş col bir dizeyse, çıkış bir kayanlar listesidir. Giriş col bir dize listesi veya demet ise, çıkış aynı zamanda bir listedir, ancak içindeki her öğe bir floats listesidir.
Notlar
Hesaplamadan önce sayısal sütunlarda null değerler yoksayılır. Yalnızca null değerler içeren sütunlar için boş bir liste döndürülür.
Örnekler
data = [(1,), (2,), (3,), (4,), (5,)]
df = spark.createDataFrame(data, ["values"])
quantiles = df.approxQuantile("values", [0.0, 0.5, 1.0], 0.05)
quantiles
# [1.0, 3.0, 5.0]
data = [(1, 10), (2, 20), (3, 30), (4, 40), (5, 50)]
df = spark.createDataFrame(data, ["col1", "col2"])
quantiles = df.approxQuantile(["col1", "col2"], [0.0, 0.5, 1.0], 0.05)
quantiles
# [[1.0, 3.0, 5.0], [10.0, 30.0, 50.0]]