Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Mengembalikan subset sampel dari DataFrame ini.
Sintaksis
sample(withReplacement: Optional[Union[float, bool]] = None, fraction: Optional[Union[int, float]] = None, seed: Optional[int] = None)
Parameter-parameternya
| Parameter | Tipe | Deskripsi |
|---|---|---|
withReplacement |
bool, opsional | Sampel dengan penggantian atau tidak (default False). |
fraction |
float, opsional | Pecahan baris yang akan dihasilkan, rentang [0.0, 1.0]. |
seed |
int, opsional | Seed untuk pengambilan sampel (default seed acak). |
Pengembalian Barang
DataFrame: Sampel baris dari DataFrame tertentu.
Catatan
Ini tidak dijamin untuk memberikan tepat pecahan yang ditentukan dari jumlah total DataFrame yang diberikan.
fraction diperlukan dan, withReplacement dan seed bersifat opsional.
Examples
df = spark.range(0, 10, 1, 1)
df.sample(0.5, 3).count()
# 7
df.sample(fraction=0.5, seed=3).count()
# 4
df.sample(withReplacement=True, fraction=0.5, seed=3).count()
# 2
df.sample(1.0).count()
# 10
df.sample(fraction=1.0).count()
# 10
df.sample(False, fraction=1.0).count()
# 10