doboz

Dobozos és bajuszos diagramot hoz létre oszlopokból DataFrame .

A dobozdiagram a numerikus adatok csoportjainak grafikus ábrázolására szolgáló módszer kvartiliseken keresztül. A mező az adatok Q1-től a Q3 kvartilisértékéig terjed, a mediánon (Q2) egy vonallal. A bajuszok a doboz széleitől terjednek az adatok tartományának megjelenítéséhez. Alapértelmezés szerint legfeljebb 1,5 × IQR-t (IQR = Q3 - Q1) terjesztenek ki a mező széleitől, és az adott intervallumon belül a legtávolabbi adatpontra végződnek. A kiugró értékek különálló pontként vannak ábrázolva.

Szemantika

box(column=None, **kwargs)

Paraméterek

Paraméter Típus Leírás
column str vagy str lista, nem kötelező Oszlopnév vagy a meződiagram létrehozásához használandó nevek listája. Ha None (alapértelmezés) az összes numerikus oszlopot használja a rendszer.
**kwargs optional További kulcsszóargumentumok. Támogatja precision: a dobozdiagram hozzávetőleges statisztikáinak kiszámításához használt lebegőpontos adat. Alapértelmezett: 0.01. Használjon kisebb értékeket a pontosabb statisztikákhoz.

Visszatérítések

plotly.graph_objs.Figure

Examples

from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [
    ("A", 50, 55),
    ("B", 55, 60),
    ("C", 60, 65),
    ("D", 65, 70),
    ("E", 70, 75),
    ("F", 10, 15),
    ("G", 85, 90),
    ("H", 5, 150),
]
columns = ["student", "math_score", "english_score"]
df = spark.createDataFrame(data, columns)
df.plot.box()