Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Vytvoří krabicový graf ze DataFrame sloupců.
Krabicový graf je metoda grafického znázornění skupin číselných dat prostřednictvím jejich kvartilů. Pole se rozšiřuje z hodnot kvartilu Q1 až Q3 dat s čárou v mediánu (Q2). Vousy se rozšiřují od okrajů krabice, aby se zobrazil rozsah dat. Ve výchozím nastavení rozšiřují maximálně 1,5 × IQR (IQR = Q3 – Q1) z okrajů pole, které končí na nejbližším datovém bodu v daném intervalu. Odlehlé hodnoty se vykreslují jako samostatné tečky.
Syntaxe
box(column=None, **kwargs)
Parametry
| Parameter | Typ | Description |
|---|---|---|
column |
str nebo list of str, optional | Název sloupce nebo seznam názvů, které se mají použít k vytvoření krabicového grafu. Pokud None (výchozí), použijí se všechny číselné sloupce. |
**kwargs |
volitelný | Další argumenty klíčových slov Podporuje precision: plovoucí hodnota použitá k výpočtu přibližné statistiky pro krabicový graf. Výchozí hodnota: 0.01. Pro přesnější statistiku použijte menší hodnoty. |
Návraty
plotly.graph_objs.Figure
Příklady
from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [
("A", 50, 55),
("B", 55, 60),
("C", 60, 65),
("D", 65, 70),
("E", 70, 75),
("F", 10, 15),
("G", 85, 90),
("H", 5, 150),
]
columns = ["student", "math_score", "english_score"]
df = spark.createDataFrame(data, columns)
df.plot.box()