Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Funzione di accesso per la funzionalità di tracciamento dei dataframe in PySpark.
Sintassi
# Call the accessor directly
df.plot(kind="line", ...)
# Use a dedicated method
df.plot.line(...)
Methods
| metodo | Descrizione |
|---|---|
area(x, y, **kwargs) |
Disegna un tracciato di area in pila. |
bar(x, y, **kwargs) |
Disegna un tracciato a barre verticali. |
barh(x, y, **kwargs) |
Disegna un tracciato a barre orizzontali. |
box(column, **kwargs) |
Disegna un tracciato box-and-whisker dalle colonne DataFrame. |
hist(column, bins, **kwargs) |
Disegna un istogramma delle colonne del dataframe. |
kde(bw_method, column, ind, **kwargs) |
Genera un tracciato della stima della densità del kernel usando i kernel gaussian. |
line(x, y, **kwargs) |
Traccia le colonne dataframe come righe. |
pie(x, y, **kwargs) |
Genera un tracciato a torta. |
scatter(x, y, **kwargs) |
Crea un grafico a dispersione. |
Examples
Tracciato a linee
data = [("A", 10, 1.5), ("B", 30, 2.5), ("C", 20, 3.5)]
columns = ["category", "int_val", "float_val"]
df = spark.createDataFrame(data, columns)
df.plot.line(x="category", y="int_val")
Grafico a barre
data = [("A", 10, 1.5), ("B", 30, 2.5), ("C", 20, 3.5)]
columns = ["category", "int_val", "float_val"]
df = spark.createDataFrame(data, columns)
df.plot.bar(x="category", y="int_val")
Grafico a dispersione
data = [(5.1, 3.5, 0), (4.9, 3.0, 0), (7.0, 3.2, 1), (6.4, 3.2, 1), (5.9, 3.0, 2)]
columns = ["length", "width", "species"]
df = spark.createDataFrame(data, columns)
df.plot.scatter(x="length", y="width")
Tracciato ad area
from datetime import datetime
data = [
(3, 5, 20, datetime(2018, 1, 31)),
(2, 5, 42, datetime(2018, 2, 28)),
(3, 6, 28, datetime(2018, 3, 31)),
(9, 12, 62, datetime(2018, 4, 30)),
]
columns = ["sales", "signups", "visits", "date"]
df = spark.createDataFrame(data, columns)
df.plot.area(x="date", y=["sales", "signups", "visits"])
Diagramma a scatola (Box plot)
data = [
("A", 50, 55), ("B", 55, 60), ("C", 60, 65),
("D", 65, 70), ("E", 70, 75), ("F", 10, 15),
]
columns = ["student", "math_score", "english_score"]
df = spark.createDataFrame(data, columns)
df.plot.box()
Tracciato DI TRACCIA
data = [(5.1, 3.5, 0), (4.9, 3.0, 0), (7.0, 3.2, 1), (6.4, 3.2, 1), (5.9, 3.0, 2)]
columns = ["length", "width", "species"]
df = spark.createDataFrame(data, columns)
df.plot.kde(bw_method=0.3, ind=100)
Istogramma
data = [(5.1, 3.5, 0), (4.9, 3.0, 0), (7.0, 3.2, 1), (6.4, 3.2, 1), (5.9, 3.0, 2)]
columns = ["length", "width", "species"]
df = spark.createDataFrame(data, columns)
df.plot.hist(bins=4)