Kotak

Membuat plot kotak dan kumis dari DataFrame kolom.

Plot kotak adalah metode untuk menggambarkan grup data numerik secara grafis melalui kuartilnya. Kotak meluas dari nilai kuartil Q1 ke Q3 data, dengan garis di median (Q2). Kumis meluas dari tepi kotak untuk memperlihatkan rentang data. Secara default, mereka memperluas tidak lebih dari 1,5 × IQR (IQR = Q3 - Q1) dari tepi kotak, berakhir pada titik data terjauh dalam interval tersebut. Outlier diplot sebagai titik terpisah.

Sintaksis

box(column=None, **kwargs)

Parameter-parameternya

Parameter Tipe Deskripsi
column str atau daftar str, opsional Nama kolom atau daftar nama yang akan digunakan untuk membuat plot kotak. Jika None (default), semua kolom numerik digunakan.
**kwargs fakultatif Argumen kata kunci tambahan. precisionMendukung : float yang digunakan untuk menghitung perkiraan statistik untuk plot kotak. Standar: 0.01. Gunakan nilai yang lebih kecil untuk statistik yang lebih tepat.

Pengembalian Barang

plotly.graph_objs.Figure

Examples

from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [
    ("A", 50, 55),
    ("B", 55, 60),
    ("C", 60, 65),
    ("D", 65, 70),
    ("E", 70, 75),
    ("F", 10, 15),
    ("G", 85, 90),
    ("H", 5, 150),
]
columns = ["student", "math_score", "english_score"]
df = spark.createDataFrame(data, columns)
df.plot.box()