次の方法で共有


ai_mask 関数

適用対象: Databricks SQL

重要

この機能はパブリック プレビュー段階にあります。

このプレビューでは:

  • 基になる言語モデルでは複数の言語を処理できますが、これらの関数は英語用にチューニングされています。
  • 基になる Foundation Model API にはレート制限があります。 これらの制限を更新するには、「Foundation Model API の制限」を参照してください。

ai_mask() 関数を使用すると、最先端の生成 AI モデルを呼び出して、SQL を使用して特定のテキスト内の指定されたエンティティをマスクできます。 この関数では、Databricks Foundation Model API によって提供されるチャット モデル提供のエンドポイントを使用します。

要件

重要

現時点で使用できる基になるモデルは、Apache 2.0 ライセンスまたは Llama 2 Community License に基づいてライセンス付与されます。 Databricks では、該当する使用条件に準拠するために、これらのライセンスを確認することをお勧めしています。 将来、Databricks の内部ベンチマークに従ってパフォーマンスが向上するモデルが開発された場合、Databricks によってモデルが変更される可能性があります (変更に伴い、このページで提供されている該当するライセンスの一覧も変更されます)。

現在、Mixtral-8x7B 指示は、これらの AI 関数を実行する基になるモデルとなっています。

構文

ai_mask(content, labels)

引数

  • content: STRING 式。
  • labels: ARRAY<STRING> リテラル。 各要素は、マスクする情報の種類を表します。

返品

指定した情報がマスクされる STRING

contentNULL の場合、結果は NULL です。

> SELECT ai_mask(
    'John Doe lives in New York. His email is john.doe@example.com.',
    array('person', 'email')
  );
 "[MASKED] lives in New York. His email is [MASKED]."

> SELECT ai_mask(
    'Contact me at 555-1234 or visit us at 123 Main St.',
    array('phone', 'address')
  );
 "Contact me at [MASKED] or visit us at [MASKED]"