다음을 통해 공유


hash

지정된 열의 해시 코드를 계산하고 결과를 int 열로 반환합니다. Spark Connect를 지원합니다.

해당 Databricks SQL 함수에 대해 알아보려면 hash 함수를 참조하세요.

문법

from pyspark.databricks.sql import functions as dbf

dbf.hash(*cols)

매개 변수

매개 변수 유형 Description
cols pyspark.sql.Column 또는 str 계산할 하나 이상의 열입니다.

Returns

pyspark.sql.Column: int 열로 해시 값입니다.

예시

예제 1: 단일 열의 컴퓨팅 해시

from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('ABC', 'DEF')], ['c1', 'c2'])
df.select('*', dbf.hash('c1')).show()
+---+---+----------+
| c1| c2|  hash(c1)|
+---+---+----------+
|ABC|DEF|-757602832|
+---+---+----------+

예제 2: 여러 열의 컴퓨팅 해시

from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('ABC', 'DEF')], ['c1', 'c2'])
df.select('*', dbf.hash('c1', df.c2)).show()
+---+---+------------+
| c1| c2|hash(c1, c2)|
+---+---+------------+
|ABC|DEF|   599895104|
+---+---+------------+