Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Membuat plot kotak dan kumis dari DataFrame kolom.
Plot kotak adalah metode untuk menggambarkan grup data numerik secara grafis melalui kuartilnya. Kotak meluas dari nilai kuartil Q1 ke Q3 data, dengan garis di median (Q2). Kumis meluas dari tepi kotak untuk memperlihatkan rentang data. Secara default, mereka memperluas tidak lebih dari 1,5 × IQR (IQR = Q3 - Q1) dari tepi kotak, berakhir pada titik data terjauh dalam interval tersebut. Outlier diplot sebagai titik terpisah.
Sintaksis
box(column=None, **kwargs)
Parameter-parameternya
| Parameter | Tipe | Deskripsi |
|---|---|---|
column |
str atau daftar str, opsional | Nama kolom atau daftar nama yang akan digunakan untuk membuat plot kotak. Jika None (default), semua kolom numerik digunakan. |
**kwargs |
fakultatif | Argumen kata kunci tambahan.
precisionMendukung : float yang digunakan untuk menghitung perkiraan statistik untuk plot kotak. Standar: 0.01. Gunakan nilai yang lebih kecil untuk statistik yang lebih tepat. |
Pengembalian Barang
plotly.graph_objs.Figure
Examples
from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [
("A", 50, 55),
("B", 55, 60),
("C", 60, 65),
("D", 65, 70),
("E", 70, 75),
("F", 10, 15),
("G", 85, 90),
("H", 5, 150),
]
columns = ["student", "math_score", "english_score"]
df = spark.createDataFrame(data, columns)
df.plot.box()