从 DataFrame 列创建一个箱子和胡须图。
框图是一种通过四分位数以图形方式描述数值数据组的方法。 该框从 Q1 扩展到数据的四分位数值,中间值 (Q2) 处有一行。 胡须从框的边缘延伸,以显示数据的范围。 默认情况下,它们从框边缘扩展不超过 1.5 × IQR (IQR = Q3 - Q1),以该间隔内最远的数据点结束。 离群值绘制为单独的点。
Syntax
box(column=None, **kwargs)
参数
| 参数 | 类型 | 说明 |
|---|---|---|
column |
str 或 str 列表,可选 | 用于创建框图的名称或名称列表。 如果 None 为 ,则使用所有数值列(默认值)。 |
**kwargs |
optional | 其他关键字参数。 支持 precision:用于计算框图的近似统计信息的浮点数。 默认值:0.01。 使用较小的值进行更精确的统计信息。 |
退货
plotly.graph_objs.Figure
示例
from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [
("A", 50, 55),
("B", 55, 60),
("C", 60, 65),
("D", 65, 70),
("E", 70, 75),
("F", 10, 15),
("G", 85, 90),
("H", 5, 150),
]
columns = ["student", "math_score", "english_score"]
df = spark.createDataFrame(data, columns)
df.plot.box()