kde

Создает график оценки плотности ядра (KDE) с помощью ядер Gaussian.

В статистике оценка плотности ядра — это непараметрический способ оценки функции плотности вероятности (PDF) случайной переменной. Эта функция использует ядра Gaussian и включает автоматическое определение пропускной способности.

Синтаксис

kde(bw_method, column=None, ind=None, **kwargs)

Параметры

Параметр Тип Описание
bw_method int или float Метод, используемый для вычисления пропускной способности оценки. Дополнительные сведения см KernelDensity . в PySpark.
column str или list of str, необязательный Имя столбца или список имен, используемых для создания диаграммы KDE. Если None (по умолчанию) используются все числовые столбцы.
ind список с плавающей запятой, массив NumPy или int, необязательный Точки оценки для предполагаемого PDF-файла. Если None (по умолчанию) используются равные 1000 точек. Если массив NumPy, KDE вычисляется в этих точках. Если целое число, то используются многие равно пробелы.
**kwargs optional Дополнительные аргументы ключевых слов.

Возвраты

plotly.graph_objs.Figure

Примеры

from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [(5.1, 3.5, 0), (4.9, 3.0, 0), (7.0, 3.2, 1), (6.4, 3.2, 1), (5.9, 3.0, 2)]
columns = ["length", "width", "species"]
df = spark.createDataFrame(data, columns)
df.plot.kde(bw_method=0.3, ind=100)