Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Создает график оценки плотности ядра (KDE) с помощью ядер Gaussian.
В статистике оценка плотности ядра — это непараметрический способ оценки функции плотности вероятности (PDF) случайной переменной. Эта функция использует ядра Gaussian и включает автоматическое определение пропускной способности.
Синтаксис
kde(bw_method, column=None, ind=None, **kwargs)
Параметры
| Параметр | Тип | Описание |
|---|---|---|
bw_method |
int или float | Метод, используемый для вычисления пропускной способности оценки. Дополнительные сведения см KernelDensity . в PySpark. |
column |
str или list of str, необязательный | Имя столбца или список имен, используемых для создания диаграммы KDE. Если None (по умолчанию) используются все числовые столбцы. |
ind |
список с плавающей запятой, массив NumPy или int, необязательный | Точки оценки для предполагаемого PDF-файла. Если None (по умолчанию) используются равные 1000 точек. Если массив NumPy, KDE вычисляется в этих точках. Если целое число, то используются многие равно пробелы. |
**kwargs |
optional | Дополнительные аргументы ключевых слов. |
Возвраты
plotly.graph_objs.Figure
Примеры
from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [(5.1, 3.5, 0), (4.9, 3.0, 0), (7.0, 3.2, 1), (6.4, 3.2, 1), (5.9, 3.0, 2)]
columns = ["length", "width", "species"]
df = spark.createDataFrame(data, columns)
df.plot.kde(bw_method=0.3, ind=100)