sampel

Mengembalikan subset sampel dari DataFrame ini.

Sintaksis

sample(withReplacement: Optional[Union[float, bool]] = None, fraction: Optional[Union[int, float]] = None, seed: Optional[int] = None)

Parameter-parameternya

Parameter Tipe Deskripsi
withReplacement bool, opsional Sampel dengan penggantian atau tidak (default False).
fraction float, opsional Pecahan baris yang akan dihasilkan, rentang [0.0, 1.0].
seed int, opsional Seed untuk pengambilan sampel (default seed acak).

Pengembalian Barang

DataFrame: Sampel baris dari DataFrame tertentu.

Catatan

Ini tidak dijamin untuk memberikan tepat pecahan yang ditentukan dari jumlah total DataFrame yang diberikan.

fraction diperlukan dan, withReplacement dan seed bersifat opsional.

Examples

df = spark.range(0, 10, 1, 1)
df.sample(0.5, 3).count()
# 7
df.sample(fraction=0.5, seed=3).count()
# 4
df.sample(withReplacement=True, fraction=0.5, seed=3).count()
# 2
df.sample(1.0).count()
# 10
df.sample(fraction=1.0).count()
# 10
df.sample(False, fraction=1.0).count()
# 10