Condividi tramite


rand

Genera una colonna casuale con esempi indipendenti e distribuiti in modo identico (i.i.d.) distribuiti in modo uniforme in [0.0, 1.0). Supporta Spark Connect.

La funzione non è deterministica in generale.

Per la funzione SQL di Databricks corrispondente, vedere rand funzione.

Sintassi

from pyspark.databricks.sql import functions as dbf

dbf.rand(seed=<seed>)

Parametri

Parametro TIPO Description
seed int, optional Valore di inizializzazione per il generatore casuale.

Restituzioni

pyspark.sql.Column: colonna di valori casuali.

Esempi

from pyspark.databricks.sql import functions as dbf
spark.range(0, 2, 1, 1).select("*", dbf.rand()).show() # doctest: +SKIP
+---+-------------------------+
| id|rand(-158884697681280011)|
+---+-------------------------+
|  0|       0.9253464547887...|
|  1|       0.6533254118758...|
+---+-------------------------+

from pyspark.databricks.sql import functions as dbf
spark.range(0, 2, 1, 1).select("*", dbf.rand(seed=42)).show() # doctest: +SKIP
+---+------------------+
| id|          rand(42)|
+---+------------------+
|  0| 0.619189370225...|
|  1|0.5096018842446...|
+---+------------------+