ai_mask 函数

适用于:勾选“是” Databricks SQL 勾选“是” Databricks Runtime

重要

此功能目前以公共预览版提供。

在预览版中:

  • 基础语言模型可以处理多种语言,但这些函数针对英语进行了优化。
  • 底层基础模型 API 存在速率限制。 请参阅基础模型 API 限制,以便更新这些限制。

ai_mask() 函数允许你调用最先进的生成式 AI 模型,以便使用 SQL 对给定文本中的指定实体进行掩码。 此函数使用通过 Databricks 基础模型 API 提供的聊天模型服务终结点。

要求

重要

目前可能使用的基础模型根据 Apache 2.0 许可证、版权 © Apache Software Foundation 或 LLAMA 3.1 社区许可证 版权©元平台公司获得许可。保留所有权利。 客户需负责确保遵守适用的模型许可条款。

Databricks 建议查看这些许可证,以确保遵守任何适用的条款。 如果模型在未来根据 Databricks 的内部基准表现更好,Databricks 可能会更改模型(以及本页中提供的适用许可证列表)。

目前, Meta-Llama-3.1-70B-Instruct 是支持这些 AI 函数的基础模型。

注意

在 Databricks Runtime 15.1 及更高版本中,Databricks 笔记本(包括作为任务在 Databricks 工作流中运行的笔记本)支持此函数。

语法

ai_mask(content, labels)

参数

  • content:一个 STRING 表达式。
  • labelsARRAY<STRING> 文本。 每个元素表示要掩码的信息类型。

返回

一个 STRING,其中的指定信息被屏蔽。

如果 contentNULL,则结果为 NULL

示例

> SELECT ai_mask(
    'John Doe lives in New York. His email is john.doe@example.com.',
    array('person', 'email')
  );
 "[MASKED] lives in New York. His email is [MASKED]."

> SELECT ai_mask(
    'Contact me at 555-1234 or visit us at 123 Main St.',
    array('phone', 'address')
  );
 "Contact me at [MASKED] or visit us at [MASKED]"