kde

Gauss çekirdeklerini kullanarak bir Çekirdek Yoğunluğu Tahmini (KDE) çizimi oluşturur.

İstatistiklerde çekirdek yoğunluğu tahmini, rastgele bir değişkenin olasılık yoğunluğu işlevini (PDF) tahmin etmenin parametrik olmayan bir yoludur. Bu işlev Gauss çekirdeklerini kullanır ve otomatik bant genişliği belirlemeyi içerir.

Sözdizimi

kde(bw_method, column=None, ind=None, **kwargs)

Parametreler

Parametre Türü Açıklama
bw_method int veya float Tahmin aracı bant genişliğini hesaplamak için kullanılan yöntem. Daha fazla bilgi için PySpark'a bakın KernelDensity .
column str veya str listesi, isteğe bağlı KDE çizimi oluşturmak için kullanılacak sütun adı veya ad listesi. (varsayılan) ise None , tüm sayısal sütunlar kullanılır.
ind float, NumPy dizisi veya int listesi isteğe bağlı Tahmini PDF için değerlendirme noktaları. (varsayılan) ise None , eşit aralıklı 1000 nokta kullanılır. Bir NumPy dizisiyse, KDE bu noktalarda değerlendirilir. Bir tamsayı ise, eşit aralıklı çok sayıda nokta kullanılır.
**kwargs optional Ek anahtar sözcük bağımsız değişkenleri.

İadeler

plotly.graph_objs.Figure

Örnekler

from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [(5.1, 3.5, 0), (4.9, 3.0, 0), (7.0, 3.2, 1), (6.4, 3.2, 1), (5.9, 3.0, 2)]
columns = ["length", "width", "species"]
df = spark.createDataFrame(data, columns)
df.plot.kde(bw_method=0.3, ind=100)