Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Gera uma coluna aleatória com amostras independentes e distribuídas de forma idêntica (i.i.d.) distribuídas uniformemente em [0.0, 1.0). Dá suporte ao Spark Connect.
A função não é determinística em caso geral.
Para a função SQL do Databricks correspondente, consulte a função rand.
Sintaxe
from pyspark.databricks.sql import functions as dbf
dbf.rand(seed=<seed>)
Parâmetros
| Parâmetro | Tipo | Description |
|---|---|---|
seed |
int, optional |
Valor de semente para o gerador aleatório. |
Devoluções
pyspark.sql.Column: uma coluna de valores aleatórios.
Exemplos
from pyspark.databricks.sql import functions as dbf
spark.range(0, 2, 1, 1).select("*", dbf.rand()).show() # doctest: +SKIP
+---+-------------------------+
| id|rand(-158884697681280011)|
+---+-------------------------+
| 0| 0.9253464547887...|
| 1| 0.6533254118758...|
+---+-------------------------+
from pyspark.databricks.sql import functions as dbf
spark.range(0, 2, 1, 1).select("*", dbf.rand(seed=42)).show() # doctest: +SKIP
+---+------------------+
| id| rand(42)|
+---+------------------+
| 0| 0.619189370225...|
| 1|0.5096018842446...|
+---+------------------+