Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Membuat plot sebar dengan berbagai ukuran dan warna titik penanda.
Koordinat setiap titik ditentukan oleh dua kolom DataFrame, dan lingkaran yang diisi digunakan untuk mewakili setiap titik. Plot semacam ini berguna untuk melihat korelasi kompleks antara dua variabel, seperti koordinat 2D alami seperti bujur dan lintang, atau sepasang metrik yang dapat diplot satu sama lain.
Sintaksis
scatter(x, y, **kwargs)
Parameter-parameternya
| Parameter | Tipe | Deskripsi |
|---|---|---|
x |
str | Nama kolom yang akan digunakan sebagai koordinat horizontal untuk setiap titik. |
y |
str atau daftar str | Nama kolom yang akan digunakan sebagai koordinat vertikal untuk setiap titik. |
**kwargs |
fakultatif | Argumen kata kunci tambahan. |
Pengembalian Barang
plotly.graph_objs.Figure
Examples
from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [(5.1, 3.5, 0), (4.9, 3.0, 0), (7.0, 3.2, 1), (6.4, 3.2, 1), (5.9, 3.0, 2)]
columns = ['length', 'width', 'species']
df = spark.createDataFrame(data, columns)
df.plot.scatter(x='length', y='width')