生成一个随机列,该列具有独立且相同的分布(i.i.d.)样本均匀分布。[0.0, 1.0) 支持 Spark Connect。
该函数在一般情况下是不确定的。
有关相应的 Databricks SQL 函数,请参阅 rand 函数。
Syntax
from pyspark.databricks.sql import functions as dbf
dbf.rand(seed=<seed>)
参数
| 参数 | 类型 | Description |
|---|---|---|
seed |
int, optional |
随机生成器的种子值。 |
退货
pyspark.sql.Column:随机值的列。
例子
from pyspark.databricks.sql import functions as dbf
spark.range(0, 2, 1, 1).select("*", dbf.rand()).show() # doctest: +SKIP
+---+-------------------------+
| id|rand(-158884697681280011)|
+---+-------------------------+
| 0| 0.9253464547887...|
| 1| 0.6533254118758...|
+---+-------------------------+
from pyspark.databricks.sql import functions as dbf
spark.range(0, 2, 1, 1).select("*", dbf.rand(seed=42)).show() # doctest: +SKIP
+---+------------------+
| id| rand(42)|
+---+------------------+
| 0| 0.619189370225...|
| 1|0.5096018842446...|
+---+------------------+