kutu

Sütunlardan DataFrame bir kutu ve çizgi çizimi oluşturur.

Kutu çizimi, sayısal veri gruplarını dörttebirlikleriyle grafik olarak gösteren bir yöntemdir. Kutu, Q1'den verilerin Q3 dörttebirlik değerlerine kadar uzanır ve ortanca değerde (Q2) bir çizgi bulunur. Yatay çizgiler, veri aralığını göstermek için kutunun kenarlarından uzanır. Varsayılan olarak, kutunun kenarlarından en fazla 1,5 × IQR (IQR = Q3 - Q1) genişletmez ve bu aralık içindeki en uzak veri noktasında biter. Aykırı değerler ayrı noktalar olarak çizilir.

Sözdizimi

box(column=None, **kwargs)

Parametreler

Parametre Türü Açıklama
column str veya str listesi, isteğe bağlı Kutu çizimi oluşturmak için kullanılacak sütun adı veya ad listesi. (varsayılan) ise None , tüm sayısal sütunlar kullanılır.
**kwargs optional Ek anahtar sözcük bağımsız değişkenleri. Destekler precision: kutu çizimi için yaklaşık istatistikleri hesaplamak için kullanılan float. Varsayılan: 0.01. Daha hassas istatistikler için daha küçük değerler kullanın.

İadeler

plotly.graph_objs.Figure

Örnekler

from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [
    ("A", 50, 55),
    ("B", 55, 60),
    ("C", 60, 65),
    ("D", 65, 70),
    ("E", 70, 75),
    ("F", 10, 15),
    ("G", 85, 90),
    ("H", 5, 150),
]
columns = ["student", "math_score", "english_score"]
df = spark.createDataFrame(data, columns)
df.plot.box()