次の方法で共有


マスク

指定された文字列値をマスクします。 これは、機密情報が削除されたテーブルのコピーを作成する場合に役立ちます。

対応する Databricks SQL 関数については、 mask 関数を参照してください。

構文

from pyspark.databricks.sql import functions as dbf

dbf.mask(col=<col>, upperChar=<upperChar>, lowerChar=<lowerChar>, digitChar=<digitChar>, otherChar=<otherChar>)

パラメーター

パラメーター タイプ Description
col pyspark.sql.Column または str 計算対象のターゲット列。
upperChar pyspark.sql.Column または str, optional 大文字を置き換える文字。 元の文字を保持するには NULL を指定します。
lowerChar pyspark.sql.Column または str, optional 小文字を置き換える文字。 元の文字を保持するには NULL を指定します。
digitChar pyspark.sql.Column または str, optional 数字を置き換える文字。 元の文字を保持するには NULL を指定します。
otherChar pyspark.sql.Column または str, optional 他のすべての文字を置き換える文字。 元の文字を保持するには NULL を指定します。

返品ポリシー

pyspark.sql.Column:

例示

df = spark.createDataFrame([("AbCD123-@$#",), ("abcd-EFGH-8765-4321",)], ['data'])
df.select(mask(df.data).alias('r')).collect()
df.select(mask(df.data, lit('Y')).alias('r')).collect()
df.select(mask(df.data, lit('Y'), lit('y')).alias('r')).collect()
df.select(mask(df.data, lit('Y'), lit('y'), lit('d')).alias('r')).collect()
df.select(mask(df.data, lit('Y'), lit('y'), lit('d'), lit('*')).alias('r')).collect()