Oharra
Baimena behar duzu orria atzitzeko. Direktorioetan saioa has dezakezu edo haiek alda ditzakezu.
Baimena behar duzu orria atzitzeko. Direktorioak alda ditzakezu.
Devuelve un subconjunto muestreado de este DataFrame.
Sintaxis
sample(withReplacement: Optional[Union[float, bool]] = None, fraction: Optional[Union[int, float]] = None, seed: Optional[int] = None)
Parámetros
| Parámetro | Tipo | Descripción |
|---|---|---|
withReplacement |
bool, opcional | Ejemplo con reemplazo o no (valor predeterminado False). |
fraction |
float, opcional | Fracción de filas que se van a generar, intervalo [0,0, 1,0]. |
seed |
int, opcional | Inicialización para el muestreo (valor predeterminado de una inicialización aleatoria). |
Devoluciones
DataFrame: filas de ejemplo de dataframe dadas.
Notas
Esto no se garantiza que proporcione exactamente la fracción especificada del recuento total del dataframe especificado.
fraction es obligatorio y, withReplacement y seed son opcionales.
Ejemplos
df = spark.range(0, 10, 1, 1)
df.sample(0.5, 3).count()
# 7
df.sample(fraction=0.5, seed=3).count()
# 4
df.sample(withReplacement=True, fraction=0.5, seed=3).count()
# 2
df.sample(1.0).count()
# 10
df.sample(fraction=1.0).count()
# 10
df.sample(False, fraction=1.0).count()
# 10