Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Создает диаграмму box-and-whisker из DataFrame столбцов.
Диаграмма поля — это метод графического отображения групп числовых данных через их квартили. Поле расширяется от Q1 до Q3 квартильных значений данных с строкой в медиане (Q2). Виски расширяются от краев поля, чтобы отобразить диапазон данных. По умолчанию они расширяют не более 1,5 × IQR (IQR = Q3 - Q1) от краев поля, заканчивая самой удаленной точкой данных в пределах этого интервала. Вылители отображаются в виде отдельных точек.
Синтаксис
box(column=None, **kwargs)
Параметры
| Параметр | Тип | Описание |
|---|---|---|
column |
str или list of str, необязательный | Имя столбца или список имен, используемых для создания диаграммы поля. Если None (по умолчанию) используются все числовые столбцы. |
**kwargs |
optional | Дополнительные аргументы ключевых слов. Поддерживает precision: float, используемый для вычисления приблизительной статистики для диаграммы поля. По умолчанию: 0.01. Используйте меньшие значения для более точной статистики. |
Возвраты
plotly.graph_objs.Figure
Примеры
from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [
("A", 50, 55),
("B", 55, 60),
("C", 60, 65),
("D", 65, 70),
("E", 70, 75),
("F", 10, 15),
("G", 85, 90),
("H", 5, 150),
]
columns = ["student", "math_score", "english_score"]
df = spark.createDataFrame(data, columns)
df.plot.box()