Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Возвращает пример подмножества этого кадра данных.
Синтаксис
sample(withReplacement: Optional[Union[float, bool]] = None, fraction: Optional[Union[int, float]] = None, seed: Optional[int] = None)
Параметры
| Параметр | Тип | Описание |
|---|---|---|
withReplacement |
bool, необязательный | Пример с заменой или нет (по умолчанию False). |
fraction |
float, необязательный | Доля строк для создания, диапазона [0.0, 1.0]. |
seed |
int, необязательный | Начальное значение для выборки (по умолчанию случайное начальное значение). |
Возвраты
DataFrame: примеры строк из заданного кадра данных.
Примечания
Это не гарантируется, что доля, указанная в общем количестве заданного кадра данных.
fraction является обязательным и withReplacementseed необязательным.
Примеры
df = spark.range(0, 10, 1, 1)
df.sample(0.5, 3).count()
# 7
df.sample(fraction=0.5, seed=3).count()
# 4
df.sample(withReplacement=True, fraction=0.5, seed=3).count()
# 2
df.sample(1.0).count()
# 10
df.sample(fraction=1.0).count()
# 10
df.sample(False, fraction=1.0).count()
# 10