поле

Создает диаграмму box-and-whisker из DataFrame столбцов.

Диаграмма поля — это метод графического отображения групп числовых данных через их квартили. Поле расширяется от Q1 до Q3 квартильных значений данных с строкой в медиане (Q2). Виски расширяются от краев поля, чтобы отобразить диапазон данных. По умолчанию они расширяют не более 1,5 × IQR (IQR = Q3 - Q1) от краев поля, заканчивая самой удаленной точкой данных в пределах этого интервала. Вылители отображаются в виде отдельных точек.

Синтаксис

box(column=None, **kwargs)

Параметры

Параметр Тип Описание
column str или list of str, необязательный Имя столбца или список имен, используемых для создания диаграммы поля. Если None (по умолчанию) используются все числовые столбцы.
**kwargs optional Дополнительные аргументы ключевых слов. Поддерживает precision: float, используемый для вычисления приблизительной статистики для диаграммы поля. По умолчанию: 0.01. Используйте меньшие значения для более точной статистики.

Возвраты

plotly.graph_objs.Figure

Примеры

from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [
    ("A", 50, 55),
    ("B", 55, 60),
    ("C", 60, 65),
    ("D", 65, 70),
    ("E", 70, 75),
    ("F", 10, 15),
    ("G", 85, 90),
    ("H", 5, 150),
]
columns = ["student", "math_score", "english_score"]
df = spark.createDataFrame(data, columns)
df.plot.box()