创建具有不同标记点大小和颜色的散点图。
每个点的坐标由两个数据帧列定义,填充圆用于表示每个点。 此类绘图可用于查看两个变量之间的复杂相关性,例如自然 2D 坐标(如经度和纬度)或可相互绘制的任意一对指标。
Syntax
scatter(x, y, **kwargs)
参数
| 参数 | 类型 | 说明 |
|---|---|---|
x |
str | 要用作每个点的水平坐标的列的名称。 |
y |
str 或 str 列表 | 要用作每个点的垂直坐标的列的名称。 |
**kwargs |
optional | 其他关键字参数。 |
退货
plotly.graph_objs.Figure
示例
from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [(5.1, 3.5, 0), (4.9, 3.0, 0), (7.0, 3.2, 1), (6.4, 3.2, 1), (5.9, 3.0, 2)]
columns = ['length', 'width', 'species']
df = spark.createDataFrame(data, columns)
df.plot.scatter(x='length', y='width')