minta

A DataFrame mintául szolgáló részhalmazát adja vissza.

Szemantika

sample(withReplacement: Optional[Union[float, bool]] = None, fraction: Optional[Union[int, float]] = None, seed: Optional[int] = None)

Paraméterek

Paraméter Típus Leírás
withReplacement bool, nem kötelező Minta csere vagy sem (alapértelmezett False).
fraction lebegőpontos, nem kötelező A létrehozandó sorok töredéke, tartomány :[0.0, 1.0].
seed int, nem kötelező Mintavételre szánt vetőmag (alapértelmezés szerint véletlenszerű vetőmag).

Visszatérítések

DataFrame: Mintavételezett sorok adott DataFrame-ből.

Jegyzetek

Ez nem garantálja, hogy pontosan az adott DataFrame teljes számának megadott törtrészét adja meg.

fraction kötelező, withReplacement és seed nem kötelező.

Examples

df = spark.range(0, 10, 1, 1)
df.sample(0.5, 3).count()
# 7
df.sample(fraction=0.5, seed=3).count()
# 4
df.sample(withReplacement=True, fraction=0.5, seed=3).count()
# 2
df.sample(1.0).count()
# 10
df.sample(fraction=1.0).count()
# 10
df.sample(False, fraction=1.0).count()
# 10