Udostępnij przez


maska

Maskuje daną wartość ciągu. Może to być przydatne w przypadku tworzenia kopii tabel z usuniętymi poufnymi informacjami.

Aby uzyskać odpowiednią funkcję SQL usługi Databricks, zobacz mask funkcja.

Składnia

from pyspark.databricks.sql import functions as dbf

dbf.mask(col=<col>, upperChar=<upperChar>, lowerChar=<lowerChar>, digitChar=<digitChar>, otherChar=<otherChar>)

Parametry

Parameter Typ Description
col pyspark.sql.Column lub str kolumna docelowa do obliczenia.
upperChar pyspark.sql.Column lub str, optional znak, aby zastąpić wielkie litery znakami. Określ wartość NULL, aby zachować oryginalny znak.
lowerChar pyspark.sql.Column lub str, optional znak, aby zastąpić małe litery znakami. Określ wartość NULL, aby zachować oryginalny znak.
digitChar pyspark.sql.Column lub str, optional znak, aby zastąpić znaki cyfry znakiem. Określ wartość NULL, aby zachować oryginalny znak.
otherChar pyspark.sql.Column lub str, optional znak, aby zastąpić wszystkie inne znaki znaki. Określ wartość NULL, aby zachować oryginalny znak.

Zwraca

pyspark.sql.Column:

Przykłady

df = spark.createDataFrame([("AbCD123-@$#",), ("abcd-EFGH-8765-4321",)], ['data'])
df.select(mask(df.data).alias('r')).collect()
df.select(mask(df.data, lit('Y')).alias('r')).collect()
df.select(mask(df.data, lit('Y'), lit('y')).alias('r')).collect()
df.select(mask(df.data, lit('Y'), lit('y'), lit('d')).alias('r')).collect()
df.select(mask(df.data, lit('Y'), lit('y'), lit('d'), lit('*')).alias('r')).collect()