Oharra
Baimena behar duzu orria atzitzeko. Direktorioetan saioa has dezakezu edo haiek alda ditzakezu.
Baimena behar duzu orria atzitzeko. Direktorioak alda ditzakezu.
Descriptor de acceso para la funcionalidad de trazado de Tramas de datos en PySpark.
Sintaxis
# Call the accessor directly
df.plot(kind="line", ...)
# Use a dedicated method
df.plot.line(...)
Methods
| Método | Descripción |
|---|---|
area(x, y, **kwargs) |
Dibuja un trazado de área apilada. |
bar(x, y, **kwargs) |
Dibuja un trazado de barras verticales. |
barh(x, y, **kwargs) |
Dibuja un trazado de barras horizontal. |
box(column, **kwargs) |
Dibuja un trazado de cajas y bigotes de columnas DataFrame. |
hist(column, bins, **kwargs) |
Dibuja un histograma de las columnas DataFrame. |
kde(bw_method, column, ind, **kwargs) |
Genera un gráfico de estimación de densidad de kernel mediante kernels gaussianos. |
line(x, y, **kwargs) |
Traza columnas DataFrame como líneas. |
pie(x, y, **kwargs) |
Genera un gráfico circular. |
scatter(x, y, **kwargs) |
Crea un gráfico de dispersión. |
Ejemplos
Trazado de líneas
data = [("A", 10, 1.5), ("B", 30, 2.5), ("C", 20, 3.5)]
columns = ["category", "int_val", "float_val"]
df = spark.createDataFrame(data, columns)
df.plot.line(x="category", y="int_val")
Trazado de barras
data = [("A", 10, 1.5), ("B", 30, 2.5), ("C", 20, 3.5)]
columns = ["category", "int_val", "float_val"]
df = spark.createDataFrame(data, columns)
df.plot.bar(x="category", y="int_val")
Gráfico de dispersión
data = [(5.1, 3.5, 0), (4.9, 3.0, 0), (7.0, 3.2, 1), (6.4, 3.2, 1), (5.9, 3.0, 2)]
columns = ["length", "width", "species"]
df = spark.createDataFrame(data, columns)
df.plot.scatter(x="length", y="width")
Trazado de área
from datetime import datetime
data = [
(3, 5, 20, datetime(2018, 1, 31)),
(2, 5, 42, datetime(2018, 2, 28)),
(3, 6, 28, datetime(2018, 3, 31)),
(9, 12, 62, datetime(2018, 4, 30)),
]
columns = ["sales", "signups", "visits", "date"]
df = spark.createDataFrame(data, columns)
df.plot.area(x="date", y=["sales", "signups", "visits"])
Trazado de cuadros
data = [
("A", 50, 55), ("B", 55, 60), ("C", 60, 65),
("D", 65, 70), ("E", 70, 75), ("F", 10, 15),
]
columns = ["student", "math_score", "english_score"]
df = spark.createDataFrame(data, columns)
df.plot.box()
Trazado KDE
data = [(5.1, 3.5, 0), (4.9, 3.0, 0), (7.0, 3.2, 1), (6.4, 3.2, 1), (5.9, 3.0, 2)]
columns = ["length", "width", "species"]
df = spark.createDataFrame(data, columns)
df.plot.kde(bw_method=0.3, ind=100)
Histograma
data = [(5.1, 3.5, 0), (4.9, 3.0, 0), (7.0, 3.2, 1), (6.4, 3.2, 1), (5.9, 3.0, 2)]
columns = ["length", "width", "species"]
df = spark.createDataFrame(data, columns)
df.plot.hist(bins=4)