levenshtein

Calcula la distancia levenshtein de las dos cadenas dadas.

Para obtener la función SQL de Databricks correspondiente, consulte levenshtein function.

Syntax

from pyspark.databricks.sql import functions as dbf

dbf.levenshtein(left=<left>, right=<right>, threshold=<threshold>)

Parámetros

Parámetro Tipo Description
left pyspark.sql.Column o str Primer valor de columna.
right pyspark.sql.Column o str Segundo valor de columna.
threshold intopcional Si se establece cuando la distancia levenshtein de las dos cadenas dadas es menor o igual que un umbral determinado, devuelve la distancia del resultado o -1

Devoluciones

pyspark.sql.Column: distancia levenshtein como valor entero.

Examples

from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('kitten', 'sitting',)], ['l', 'r'])
df.select('*', dbf.levenshtein('l', 'r')).show()
df.select('*', dbf.levenshtein(df.l, df.r, 2)).show()