Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Kluster data menurut kolom yang diberikan untuk mengoptimalkan performa kueri.
Sintaksis
clusterBy(*cols)
Parameter-parameternya
| Parameter | Tipe | Deskripsi |
|---|---|---|
*cols |
str atau daftar | Nama kolom yang akan diklusterkan. |
Pengembalian Barang
DataFrameWriter
Examples
Tulis DataFrame ke dalam file Parquet dengan pengklusteran.
import tempfile
with tempfile.TemporaryDirectory(prefix="clusterBy") as d:
spark.createDataFrame(
[{"age": 100, "name": "Alice"}, {"age": 120, "name": "Ruifeng Zheng"}]
).write.clusterBy("name").mode("overwrite").format("parquet").save(d)