Megjegyzés
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhat bejelentkezni vagy módosítani a címtárat.
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhatja módosítani a címtárat.
A DataFrame mintául szolgáló részhalmazát adja vissza.
Szemantika
sample(withReplacement: Optional[Union[float, bool]] = None, fraction: Optional[Union[int, float]] = None, seed: Optional[int] = None)
Paraméterek
| Paraméter | Típus | Leírás |
|---|---|---|
withReplacement |
bool, nem kötelező | Minta csere vagy sem (alapértelmezett False). |
fraction |
lebegőpontos, nem kötelező | A létrehozandó sorok töredéke, tartomány :[0.0, 1.0]. |
seed |
int, nem kötelező | Mintavételre szánt vetőmag (alapértelmezés szerint véletlenszerű vetőmag). |
Visszatérítések
DataFrame: Mintavételezett sorok adott DataFrame-ből.
Jegyzetek
Ez nem garantálja, hogy pontosan az adott DataFrame teljes számának megadott törtrészét adja meg.
fraction kötelező, withReplacement és seed nem kötelező.
Examples
df = spark.range(0, 10, 1, 1)
df.sample(0.5, 3).count()
# 7
df.sample(fraction=0.5, seed=3).count()
# 4
df.sample(withReplacement=True, fraction=0.5, seed=3).count()
# 2
df.sample(1.0).count()
# 10
df.sample(fraction=1.0).count()
# 10
df.sample(False, fraction=1.0).count()
# 10