Lưu ý
Cần có ủy quyền mới truy nhập được vào trang này. Bạn có thể thử đăng nhập hoặc thay đổi thư mục.
Cần có ủy quyền mới truy nhập được vào trang này. Bạn có thể thử thay đổi thư mục.
Creates a scatter plot with varying marker point size and color.
The coordinates of each point are defined by two DataFrame columns, and filled circles are used to represent each point. This kind of plot is useful for seeing complex correlations between two variables, such as natural 2D coordinates like longitude and latitude, or any pair of metrics that can be plotted against each other.
Syntax
scatter(x, y, **kwargs)
Parameters
| Parameter | Type | Description |
|---|---|---|
x |
str | Name of column to use as horizontal coordinates for each point. |
y |
str or list of str | Name of column to use as vertical coordinates for each point. |
**kwargs |
optional | Additional keyword arguments. |
Returns
plotly.graph_objs.Figure
Examples
from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [(5.1, 3.5, 0), (4.9, 3.0, 0), (7.0, 3.2, 1), (6.4, 3.2, 1), (5.9, 3.0, 2)]
columns = ['length', 'width', 'species']
df = spark.createDataFrame(data, columns)
df.plot.scatter(x='length', y='width')