지정된 열의 해시 코드를 계산하고 결과를 int 열로 반환합니다. Spark Connect를 지원합니다.
해당 Databricks SQL 함수에 대해 알아보려면 hash 함수를 참조하세요.
문법
from pyspark.databricks.sql import functions as dbf
dbf.hash(*cols)
매개 변수
| 매개 변수 | 유형 | Description |
|---|---|---|
cols |
pyspark.sql.Column 또는 str |
계산할 하나 이상의 열입니다. |
Returns
pyspark.sql.Column: int 열로 해시 값입니다.
예시
예제 1: 단일 열의 컴퓨팅 해시
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('ABC', 'DEF')], ['c1', 'c2'])
df.select('*', dbf.hash('c1')).show()
+---+---+----------+
| c1| c2| hash(c1)|
+---+---+----------+
|ABC|DEF|-757602832|
+---+---+----------+
예제 2: 여러 열의 컴퓨팅 해시
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('ABC', 'DEF')], ['c1', 'c2'])
df.select('*', dbf.hash('c1', df.c2)).show()
+---+---+------------+
| c1| c2|hash(c1, c2)|
+---+---+------------+
|ABC|DEF| 599895104|
+---+---+------------+