次の方法で共有


ランド

[0.0, 1.0)で均一に分散された、独立した同一分散 (i.i.d.) サンプルを含むランダム列を生成します。 Spark Connect をサポートします。

この関数は、一般的なケースでは非決定論的です。

対応する Databricks SQL 関数については、 rand 関数を参照してください。

構文

from pyspark.databricks.sql import functions as dbf

dbf.rand(seed=<seed>)

パラメーター

パラメーター タイプ Description
seed int, optional ランダム ジェネレーターのシード値。

返品ポリシー

pyspark.sql.Column: ランダムな値の列。

例示

from pyspark.databricks.sql import functions as dbf
spark.range(0, 2, 1, 1).select("*", dbf.rand()).show() # doctest: +SKIP
+---+-------------------------+
| id|rand(-158884697681280011)|
+---+-------------------------+
|  0|       0.9253464547887...|
|  1|       0.6533254118758...|
+---+-------------------------+

from pyspark.databricks.sql import functions as dbf
spark.range(0, 2, 1, 1).select("*", dbf.rand(seed=42)).show() # doctest: +SKIP
+---+------------------+
| id|          rand(42)|
+---+------------------+
|  0| 0.619189370225...|
|  1|0.5096018842446...|
+---+------------------+